智能晚报|Meta可实时解码大脑视觉皮层;智谱AI今年融资超25亿元;智能体公司Imbue再融资1200万美元...
「每周一三五更新」
撰文:裘欢欣、张司钰
编辑:吴洋洋
Key Points
Meta实现对大脑视觉皮层的实时解码
智谱AI今年总计完成超25亿元融资
Google上线英语辅导功能,对标多邻国
智能体公司Imbue获得1200万美元融资
中国考虑推迟批准博通收购VMware
现在打开ChatGPT就可以用DALL-E3了
Meta在实验室实现对大脑视觉皮层的实时解码
10月18日,Meta AI发布与巴黎文理大学、巴黎高师合作的模型,该模型可将大脑脑磁图(MEG)信号解码,并实时可视化。
Meta如何解码MEG数据?
MEG(Magnetoencephalography,脑磁图)是一项功能性神经成像技术,能够以每秒数千次的频率扫描大脑,记录其中自然产生的电流所形成的磁场。
具体来说,Meta开发了一个由图像编码器、大脑编码器和图像解码器组成的系统。其中,大脑编码器用来学习将MEG信号与对应的视觉图像做配对训练,最终,图像解码器就可以反过来根据MEG信号猜测受试者看到的图像。
Meta在一个公开的MEG数据集上训练出了该系统。
与此前通过fMRI信号解码视觉有何不同?
新皮层曾报道,一个叫Mind's Eye的生成式AI模型,可以通过解码fMRI数据,识别脑活动中的视觉、感知等信息,进而用这些信息输出与之对应的图像。部分生成图片的结果与被测试者当时浏览的照片高度相似。
Mind's Eye用fMRI数据的解码效果。
Mind's Eye使用的fMRI(Functional magnetic resonance imaging,功能性磁共振成像)是另一种神经影像学技术,其检测对象是大脑中的血液流动和代谢变化。
fMRI具有更高的空间分辨率,可以精确定位大脑活动的区域。不过,它通常以秒为单位收集数据,难以捕捉大脑的快速波动,更适合于静态或缓慢变化的大脑活动。相比之下,MEG数据具有更高的时序分辨率,能够以毫秒级的精度捕捉大脑活动变化。
Meta认为,虽然fMRI可以更好地解码图像,但MEG解码器可以实时生成结果,连续解码大脑活动。
不过MEG解码器仍有弊端,那就是空间分辨率不够,难以清楚知道到底是大脑的哪个区域在产生信号。这是MEG解码器从实验室走向真实社会的挑战。
参考链接:
https://ai.meta.com/blog/brain-ai-image-decoding-meg-magnetoencephalography/
智谱AI今年总计完成超25亿元融资
10月20日,智谱AI官方发布公告表示,公司今年已完成超25亿元融资。中关村自主创新基金、红杉、高瓴、美团、阿里、腾讯、小米、蚂蚁等众多机构均有参与。
公司背景
智谱AI是国内少数几个成功开发出大模型的初创公司,于2019年成立,由清华大学计算机系唐杰教授创建,为该系知识工程实验室的技术成果转化而来。
目前,智谱AI旗下已拥有大语言模型ChatGLM、可联网搜索的模型WebGLM、代码生成模型CodeGeeX2、超拟人大模型CharacterGLM、多模态模型VisualGLM-6B和CogVLM-17B等多款模型。
同时,智谱AI拥有一款面向C端的应用「智谱清言」。
今年之前,智谱AI曾获得三轮融资,融资金额超2亿元。智谱AI告诉「新皮层」,目前智谱AI估值超过百亿元。
智谱和百川智能成为国内融资最多的大模型公司
· 百川智能:搜狗创始人王小川于4月创立,其「百川大模型」已获网信办备案审批,迄今融资3亿美元,与智谱相当;
· Moonshot AI:清华系背景的大模型公司,今年3月创立,旨在研发跨模态大模型。今年累计融资6000万美元,另有1.7亿美元尚未交割。
· Minimax:成立于2021年12月,其适用于文本处理任务的大模型「ABAB大模型」已获网信办备案审批,今年融资金额超2.5亿美元。
参考链接:
https://mp.weixin.qq.com/s/ZlvlEIASDWHhu4CmYEx60Q
Google搜索上线英语辅导功能,对标多邻国
10月19日,Google搜索上线了一项口语练习功能,为部分地区的Android用户提供英语互动口语练习,并计划未来将该功能扩展到更多国家和语言。
该功能强调个性化学习
新功能将为语言学习者提供交互式口语练习,学习者可以参加3至5分钟的练习课程,并获得个性化的反馈,从而能够按照自己的节奏练习英语练习。
·个性化实时反馈:该功能可以分析学习者的回答,提供有用的实时建议和更正。不仅如此,该功能还会提示学习者可以改进的语法问题,并提供了一组不同语言复杂程度的示例答案。
·语境翻译:孤立的单个单词通常具有多种替代含义,多个单词则可以形成需要一致翻译的含义集群。该功能能够实现在上下文中翻译单个单词和短语的能力。
·语法反馈:针对有口音的用户,Google采用了文本语法校正模型来处理语音转录。此外,该团队开发了一种基于编辑的输出表示,它利用输入和输出之间的高度重叠,来适配学习过程中常见的短句。
·语义分析:语言初学者的口语常有语法问题,Google的语义分析功能可以向学习者传达他们的反应是否与上下文相关,并且判断是否可以被聆听者所理解。
该语言学习功能对标多邻国
早在2019年,Google就曾涉足语言学习和教育工具,推出了一个模块,让搜索用户练习正确的单词表达方式,并在页面上立即提供反馈。本次结合AI功能的语言学习模块的推出,则是直接对标了多邻国。
多邻国是一家以语言学习服务为主的教育技术公司,在今年4月与OpenAI合作,成为首批向客户提供基于GPT-4服务的企业之一。它为学习者提供了基于AI的虚拟语言导师,并在学习过程中创建交互式学习体验。此外,AI也被广泛使用到该公司的英语测试系统,包括大学、学院和政府组织在内的4000多个机构都使用该公司的测试系统来评估非母语者的能力。
Google的语言学习功能将在未来几天向阿根廷、哥伦比亚、印度(印地语)、印度尼西亚、墨西哥和委内瑞拉的 Android用户开放。
参考链接:
https://blog.research.google/2023/10/google-search-can-now-help-with-english-speaking-practice.html
Imbue获得1200万美元融资
10月19日,人工智能初创公司Imbue表示,它已在B轮融资中获得了额外的1200万美元资金,目前其现金筹集总额已超过2.1亿美元。
哪些人投资了?
投资者包括亚马逊的Alexa基金和Google前首席执行官埃里克·施密特 (Eric Schmidt)。
今年9月,Imbue宣布完成2亿美元的B轮融资,估值超过10亿美元,包括英伟达在内的投资者参与了投资。此外,Imbue还从英伟达那里获得了1万张GPU来处理密集的计算任务。
Imbue是做什么的?
Imbue前身为General Intelligence,是一家构建大型语言模型来支持人工智能工具的初创公司,由Josh Albrecht和华人女科学家Kanjun Qiu于2021年联合创立。
不同于专注训练基础模型(foundation model)的人工智能公司,Imbue正在构建能推理的智能体(agent),其长期目标是构建「实用的AI智能体,并使之可以在现实世界中工作」。与只能完成简单任务的普通AI相比,智能体能够模拟人类抉择来完成复杂任务,例如会议安排或复杂的数据分析。
然而,目前该公司尚未发布任何终端应用,仅在去年秋天发布了Avalon开源训练环境。
参考链接:
https://www.reuters.com/markets/deals/ai-startup-imbue-gets-12-million-follow-on-funding-2023-10-19/
中国考虑推迟批准博通收购VMware
10月20日,中国政府考虑阻止美国芯片制造商博通以690亿美元收购云软件公司VMware。
此前1天,美国政府更新了其芯片出口规定,进一步收紧了包括英伟达A800和H800等芯片的对华出口,这些芯片是训练大模型需要的核心芯片。
中国区收入超过4亿元,交易就需要中国批准
根据中国法律的相关规定,如果大型跨国公司在中国创造的收入超过4亿元,则两家公司之间的交易必须向国家市场监督管理总局备案,以获得反垄断审批。根据财报,博通在最近一个财年的330亿美元收入中,约有三分之一来自对中国。VMware在中国的业务收入也十分「强劲」。
此前,2023年8月,由于英特尔未能在交易截止日期之前获得中国监管部门的批准,取消了以54亿美元收购以色列芯片制造商Tower Semiconductor的交易。
收购交易原预计于10月底完成
2022年5月26日,美国芯片制造商博通宣布将收购云软件公司VMware,总价610亿美元,预计交易将在10月结束的财年中完成。
如果本次收购案完成,博通将转变为一家多元化的科技公司,而不是主要专注于半导体的公司。而如果收购案失败,将是该美国半导体巨头在5年内面临的第二桩收购失败。
2018年,时任美国总统特朗普以国家安全为由,阻止了博通以1420亿美元收购芯片制造商高通的收购案。彼时,博通被新加坡安华高科技公司收购,将总部设立新加坡。为规避外国在美投资委员会的审查,博通随后将总部迁至美国。
参考链接:
https://www.ft.com/content/b23d2a9f-d873-43e4-9032-632d4e9d438c
现在打开ChatGPT就可以用DALL-E3了
10月20日,OpenAI宣布DALL·E3正式上线ChatGPT。DALL·E3是OpenAI在今年9月发布的文生图模型,相比上一代DALL·E2,新模型可以利用GPT-4生成提示词(prompt),并让模型根据该提示生成图像,提升了文生图的效率。目前ChatGPT的Plus用户和Enterprise用户均可使用。
参考链接:
https://openai.com/blog/dall-e-3-is-now-available-in-chatgpt-plus-and-enterprise
https://cdn.openai.com/papers/dall-e-3.pdf
-END-
若想了解更多当日资讯,请点击阅读往期智能晚报
智能晚报|A800和H800芯片都将被禁;华为手机单周销量重回第一;蚂蚁入股智谱AI;百川智能获阿里、腾讯、小米等投资
智能晚报|佳能发布用「纳米压印」制造5nm芯片的机器;英伟达H800可能被纳入美国禁令;苹果计划推平价版Vision Pro
若想了解更多当日头条,请点击阅读往期头条新闻
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。
在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与「智能」相关的议题。请注意,我们说的智能,不只是 AI。
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
喜欢就关注我们吧,记得「设为星标」