机器之心

经济

Just keep scaling!思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

AGI,但会非常困难,我们需要继续大量扩展。三、扩展范式二:基于思维链扩展强化学习纯粹的下一词预测在处理复杂任务时存在局限性。思维链(CoT)让模型能够像人类一样展示推理过程。OpenAI
1月4日 下午 12:30
其他

没有博士学位却开启了GPT时代,奥特曼盛赞Alec Radford,爱因斯坦级天才

主要从事识别、开发和改进有前景的图像和文本机器学习技术,并将其从研究阶段转化为更广泛的行业应用。在那里,他进行了生成对抗网络(GAN)相关研究,并提出
1月1日 下午 12:05
其他

AI教父、诺奖得主Hinton支持起诉OpenAI,阻止「转营利」

年作为非营利研究实验室成立。但随着其实验进程的加快,公司变得越来越资本密集,它创建了当前的结构,从风险投资公司、包括微软等科技巨头那里获得了外部投资。2019
2024年12月31日
其他

考研数学得126分、还能编写小游戏,智谱首个推理模型来了,人人免费用

体验一番后,我们的最大感受是:它的深度思考过程让逻辑推理更加完整、连贯,准确度和说服力更强。从「审题、分析、多方式证明」到「自我怀疑、验证、再验证」到「最后确认」,环环相扣。当然,智谱表示,目前
2024年12月31日
其他

一道题烧几千美元,OpenAI新模型o3:这34道题我真不会

虽然做了一堆推理,最后却只是简单画了几条重复的线(这明显不对)。说实话,感觉它就像是「算了算了,我不玩了!」测试样本比训练样本大得多,这一点很有意思。可以看到,和标准答案相比,o3
2024年12月29日
其他

突发!刚刚,OpenAI裂变成了两块:一块营利,一块非营利

对于新架构的表述也立刻引发了争议,并且网友的评论整体偏向负面。正面评价自然也有,但不多。截止到本文发稿时,马斯克与奥特曼等利益相关方都还没未对此事公开置评。不过有意思的是,奥特曼在
2024年12月28日
其他

AGI前夜的思考:2025年将出现真正的AI智能体,年轻人需要快速适应

PR。不同于数学家,软件工程师需要不断与物理世界(也就是其他人)互动。工程师必须与客户和团队合作,才能理解他们的需求。当工程师设计架构或编写代码时,会涉及到大量有关组织的上下文知识。o4
2024年12月27日
其他

2024即将结束,中国AI应用支棱起来了吗?这家公司交出95分答卷

轮融资,领投金额过亿元人民币,领投方系以合肥产投为主的国资基金,跟投方有安徽省人工智能母基金,湖北省长江电影集团有限公司等,目前还有知名战略资本正在持续推进当中。©
2024年12月27日
其他

围猎Suno!国产AI音乐三巨头:华语创作称雄,MV一键生成全球首创

生成应用的优势。「启明星」接入了「琴乐大模型」,仍聚焦于纯音乐创作,并未涉足涉及人声的歌曲生成。对此,腾讯音乐表示,歌曲生成等复杂能力可以拭目以待。作为这一轮
2024年12月26日
其他

超越Claude 3.5紧追o1!DeepSeek-V3-Base开源,编程能力暴增近31%

个专家(topk=8)。图源:X@arankomatsuzaki该模型利用了大量专家,但对于任何给定的输入,只有一小部分专家是活跃的,模型具有很高的稀疏性。图源:X@Rohan
2024年12月26日
其他

Karpathy力荐博客:写代码的时候,请心疼一下读代码的同事

认为「这可能是最真实,但最少被实践的观点。」毕竟相当多开发者都乐于在自己的项目或工作中「炫技」,甚至以花哨复杂、难以理解为荣。很多读者对此表示了认同,并分享了自己的观点和经历。Hyperbolic
2024年12月26日
其他

o3智商高达157?每13333人中才有一个这么高,网友:编码分数无意义

估计智商的可靠性。图源:X@facundo_fagalde图源:https://www.trackingai.org/home因此,未来等
2024年12月24日
其他

参加完NeurIPS,纽约大学教授感受到了AI博士生的焦虑与挫败

这场革命将改变他们所做的一切。因此,那时候很多被聘用的博士的任务就是自由地做研究;也就是说,他们可以选择自己想做的事情,发表自己想发表的文章。这就像一个学术研究职位,但薪酬是原来的
2024年12月23日
自由知乎 自由微博
其他

豆包说要「普惠」,于是大模型处理图片按「厘」计价了

App。一键海报的关键点在于「写字」。在实际体验中,我们可以感受到,豆包・文生图模型对文字细节的指令遵循能力很强,特别是非常擅长「写汉字」:Prompt:生成一张卡通土拨鼠的图片
2024年12月23日
其他

2024亚马逊研究奖获奖名单:张崇杰、魏华等人入选

Lab)。她在亚利桑那州立大学获得了计算机科学博士学位,分别在华中科技大学和伦斯勒理工学院获得了了本科与硕士学位。程璐的研究兴趣广泛,主要集中在社会责任人工智能(如公平性、可解释性
2024年12月23日
其他

2025英伟达奖学金出炉,7位华人博士生入选,上交、中科大、浙大校友在列

Yang机构:南加州大学入选理由:通过自监督学习为自主系统创建可扩展、可泛化的基础模型,利用神经重建来捕捉详细的环境几何和动态场景行为,并增强机器人、数字孪生技术和自动驾驶的适应性。Jiawei
2024年12月20日
其他

图森未来陈默:自动驾驶无以为继,急转驶入AIGC游戏,已拿下金庸群侠传、三体IP | 智者访谈

默:现在市场基本上全行业产能过剩,我们需要找到一个清晰且有可能成功的商业模式。目前唯一在增长的就是动漫和游戏,而且这个市场毛利很高,所以我们认为进入动漫游戏市场是正确的选择。我们可以用现有的
2024年12月20日
其他

UniReal登场:用视频架构统一图像生成与编辑,还学到真实世界动态变化规律

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com论文一作陈汐,现为香港大学三年级博士生,在此之前本科硕士毕业于浙江大学,同时获得法国马赛中央理工双硕士学位。主要研究方向为图像视频生成与理解,在领域内顶级期刊会议上发表论文十余篇,并且
2024年12月20日
其他

推理最强也最快,谷歌发布Gemini 2.0 Flash Thinking,全面超越o1-preview

完成了任务。测试一下,该模型生成的代码确实能正确实现功能。这里再测试一道来自《孙子算经》的古代数学题:今有物不知其数,三三数之剩二;五五数之剩三;七七数之剩二。问物几何?这一次,Gemini
2024年12月20日
其他

刚刚,OpenAI元老级研究员Alec Radford离职,他主导了GPT-1、GPT-2的研发

开启了预训练大模型时代,提出「半监督(semi-supervised)」(后来普遍称为自监督)的方法,先在没有标号的数据上面训练一个预训练模型,再在少量标号数据上面训练一个分辨的微调模型。2019
2024年12月20日
其他

历时2年,华人团队力作,震撼开源生成式物理引擎Genesis,可模拟世界万物

表示:「我们的目标是构建一个通用数据引擎,其能利用上层的生成式框架自动创建物理世界,以及各种模式的数据,包括环境、相机运动、机器人任务提议、奖励函数、机器人策略、角色运动、完全交互式
2024年12月19日
其他

在线试玩 | 对齐、生成效果大增,文本驱动的风格转换迎来进阶版

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com论文的第一作者是来自西湖大学的研究人员雷明坤,指导老师为西湖大学通用人工智能(AGI)实验室的负责人张驰助理教授。实验室的研究方向聚焦于生成式人工智能和多模态机器学习。文本驱动的风格迁移是图像生成中的一个重要任务,旨在将参考图像的风格与符合文本提示的内容融合在一起,生成最终的风格化图片。近年来,随着
2024年12月19日
其他

跨模态通信总丢失语义、产生歧义?加入AI大模型,LAM-MSC实现四模态统一高效传输

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文的作者为湖南师范大学的江沸菠副教授,彭于波博士,湖南工商大学的董莉副教授,英国布鲁内尔伦敦大学的王可之教授,南京大学的杨鲲教授(欧洲科学院院士),东南大学的潘存华教授、尤肖虎教授(中国科学院院士)。多模态信号,包括文本、音频、图像和视频等,可以被整合到语义通信中,在语义层面提供低延迟、高质量的沉浸式体验。然而,多模态语义通信面临着数据异构、语义歧义和信号衰落等挑战。AI
2024年12月19日
其他

CMU把具身智能的机器人给越狱了

年夏天。在一系列学术论文中,安全机器学习领域的研究人员发现了许多大模型的漏洞,很多与所谓的越狱攻击有关。要理解越狱,必须注意的是,大模型通过被称为模型对齐的过程进行训练,以遵循人类的意图和价值观。将
2024年12月19日
其他

震惊!Claude伪对齐率竟能高达78%,Anthropic 137页长论文自揭短

部署中不太可能发生。为了解决这个问题,研究者进行了一组实验,其中仅隐式地向模型提供信息:在一堆类似于新闻文章、博客文章等的文档上微调模型,其中包含相关信息(关于训练目标和免费
2024年12月19日
其他

微调时无需泄露数据或权重,这篇AAAI 2025论文提出的ScaleOT竟能保护隐私

机器之心报道机器之心编辑部蚂蚁数科、浙江大学、利物浦大学和华东师范大学团队:构筑更好的大模型隐私保护。要让大模型适应各不一样的下游任务,微调必不可少。常规的中心化微调过程需要模型和数据存在于同一位置
2024年12月18日
其他

英伟达下代RTX 50系列显卡规格被泄露,旗舰5090显存达32GB

月,他曾表示,随着时间推移,芯片价格下降已经是「过去的事了」。图源:Nvidia在不断「压榨」显卡性能的同时,英伟达也在探索在不同的硬件上跑生成式
2024年12月18日
其他

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

机器之心报道机器之心编辑部人类的沟通交流充满了多模态的信息。为了与他人进行有效沟通,我们既使用言语语言,也使用身体语言,比如手势、面部表情、身体姿势和情绪表达。因此,为了理解和生成人类动作,理解这些多模态的行为至关重要,而且这一研究方向最近受到的关注也越来越多。而多模态语言模型看起来颇具潜力,可将多种模态的不同任务统一在一个框架下。近日,斯坦福大学李飞飞、Gordon
2024年12月18日
其他

Scaling Law撞墙?预训练终结?亚马逊云科技为什么还在做基础大模型

化方案就是完美的,能够在不丢失任何信息的情况下完成对文本、视频、时间和空间等信息的编码。随着模型规模的扩大以及编码技术的进一步演进,基础大模型或许能从已有数据中发掘出新的养分,实现进一步的
2024年12月18日
其他

OpenAI被偷家,谷歌Veo 2反超Sora

去测试其他模型,想实现这种自然又细腻的陶醉微表情,不失真、不鬼畜,试过才知道有多难。还有,这画面简直就像从纪录片里截取的一幕。镜头里,一个养蜂的男人在蜂群中忙碌,Veo
2024年12月17日
其他

Kimi又上新!抢先实测视觉思考模型k1,甚至比o1更聪明

揣摩了这张梗图背后的各种幽默元素,比如讽刺那些总是追求最新产品的人,即使这些新产品并不总是有显著的改进;每年新产品发布时的代际差异;调侃人们对于品牌和型号的过度关注等。对于微妙的谐音和双关语梗,k1
2024年12月16日
其他

企业大模型落地关键是什么?这家领先的大模型技术和应用公司给出答案

以上的增速。在这种情况下,大模型应用将必然有一个蓬勃的爆发。中关村科金作为一线参与者来说,还是看到很多挑战。比如成本的问题。现在把大模型应用到实际的业务中,成本不低。即使不做基础大模型研发,就是做
2024年12月16日
其他

Bengio参与的首个《AI安全指数报告》出炉,最高分仅C、国内一家公司上榜

家公司在安全实践方面仍有提升空间。报告链接:https://futureoflife.org/document/fli-ai-safety-index-2024/关于这份报告,Tegmark
2024年12月16日
其他

与1500多支国内外队伍同台竞技,快手在NeurIPS 2024顶级大赛中上演双杀

Bidding)赛道。两个赛道侧重点各有不同,对参赛队伍提出了不同的技术要求,其中:通用赛道关注不确定环境中的自动出价,需要解决数据稀疏性、转化方差、多坑等不确定问题;AIGB
2024年12月16日
其他

对话肖特特:从伯克利到PromptAI创业,发明创造下一代视觉智能

制作了内容,不一定是创造了艺术。第三,我们也要把艺术和娱乐也要区分开来。当我们听到一段旋律或是看到一段影像,觉得很好看、很过瘾,但不代表它激发我产生了认知上的改变、情绪上的共鸣、对世界新的理解。目前
2024年12月16日
其他

哗然!MIT教授NeurIPS演讲公开歧视中国学生,大会官方认错、本人道歉

NeurIPS,竟然有学者在演讲中公开发表对中国学者的歧视言论。「我这样做是为了让我的论文结果看上去更好,我的学校里没有人教我们道德或价值观。——
2024年12月15日
其他

Ilya Sutskever在NeurIPS炸裂宣判:预训练将结束,数据压榨到头了(全文+视频)

的化石燃料。它就像是以某种方式创建的,现在我们使用它,我们已经实现了数据的最大化利用,不能再更好了。我们想办法必须处理现在拥有的数据。我仍然会努力,这仍然让我们走得很远,但问题在于,只有一个互联网。
2024年12月14日
其他

Mamba作者带斯坦福同学、导师创业,Cartesia获2700万美元种子轮融资

架构的模型仍有重要局限,它们一次只能处理和生成很短的信息(几分钟的音频或几秒钟的视频),无法高效地保持交互状态,在大多数硬件上实时运行的成本也太过昂贵。」而能将长序列数据压缩成固定大小的状态的
2024年12月13日
其他

OpenAI很会营销,而号称超强AI营销的灵感岛实测成效如何?

图片创作:一键创作产品宣传图当然,要发小红书,光有文本可不够,我们还得有吸睛的图片。灵感岛配置了强大的图片工作室,支持从智能抠图、高清放大、智能消除到智能商拍的一系列图像处理任务。首先,当然是给机
2024年12月13日
其他

谷歌最强大模型Gemini 2.0被抬上来了,网友:好科幻

的基础上开发了游戏智能体。它特别有意思,能看懂你在玩什么游戏,理解游戏画面里发生的事情,然后实时跟你聊天,给你建议该怎么玩。就像有个资深玩家朋友在旁边指点你。他们还和
2024年12月12日
其他

Sora终于来了,但卷王可灵已经「拍」上了AI电影

机器之心原创编辑:杨文6个月迭代10余次,快手可灵一路狂飙。这次,轮到名导们下场整活了。短片一开场就相当震撼:钟馗手持一把斩鬼剑,穿行在一片乌漆麻黑、虬枝盘曲的密林中。伴随着一阵节奏急促的锣鼓声,野兔精、蛤蟆精、长满骷髅的树妖接连现身,紧张恐怖的气氛拉满。但一声长喝下,镜头一转,手机屏幕弹出「勿扰模式」四个大字,底下滚动着被拦截的各种信息:自动记账
2024年12月11日
其他

未来工厂,AI 领航 | 年终盛会,中信泰富特钢、施耐德、博世、工业富联等大咖共探 AI 赋能工厂新范式

赋能工厂生态圈」,如您希望了解活动详情或参与活动分享与展示,请添加机器之心小助手微信(ID:13661489516)备注「未来工厂」或者邮件至chenshi@jiqizhixin.com咨询。
2024年12月11日
其他

大模型「标王」硬气:不做Sora ,要帮更多企业做出Sora

视觉能力,快速将这些文档拆解为章节段落和图表,完成知识结构化。员工能在「甄知」辅助下编写各种企业文档,新产生的知识会自动进入企业知识库,精准推给需要的同事。基于多模态大模型重构的「一见」
2024年12月10日
其他

5分钟完成最强超算10^25年工作,谷歌量子芯片重大突破,马斯克、奥特曼齐祝贺

年宣布第一个超越经典计算的计算后发生的那样,他们预计经典计算机将在这项基准测试上继续改进,但迅速扩大的差距表明,量子处理器正以双指数速率起势,并将继续在他们扩大规模时远远超越经典计算机。首席科学家
2024年12月10日
其他

刚刚,OpenAI Sora正式炸裂登场,网页挤爆了!

变得更加容易,同时故事板工具让用户可以精准地指定每个帧的输入。我们可以先看几个生成视频示例:提示:镜头雾气弥漫,色彩对比鲜明,捕捉到的感觉是低能见度的镜头质量,提供一种即时感和混乱感。该场景从
2024年12月10日
其他

3D具身基础模型!北大提出Lift3D赋予2D大模型鲁棒的3D操纵能力

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com为了构建鲁棒的
2024年12月9日
其他

18k个视频、专为自动驾驶世界模型设计,DrivingDojo数据集来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com世界模型被广泛认为是实现通用人工智能的关键技术,其核心能力在于模拟真实世界的动态变化,并为决策提供精准的未来状态预测。在自动驾驶领域,世界模型的应用尤为引人注目。然而,现有数据集在视频多样性和行为复杂性方面的不足,限制了世界模型潜力的全面发挥。为了解决这一瓶颈,中国科学院自动化研究所联合美团无人车团队推出了
2024年12月9日
其他

新版Sora要来了?泄露视频引围观,网友:价格别太离谱

独有的、可以创造出一种人类难以复制的独特魅力。尤其是多人物同屏,以及画面的表现力运镜非常高级,同时它还保持了电影般的质感,人群中的每个个体细节表现非常出色。Emi
2024年12月9日
其他

困扰数学家近60年的搬沙发难题疑似被解决!119页论文证明最优解,百万网友围观

机器之心报道机器之心编辑部《老友记》中的罗斯终于能把沙发搬进屋了。生活中处处充满数学,比如在经典美剧《老友记》中,罗斯要搬家,却在和瑞秋抬沙发上楼梯扶手时翻了车。这涉及了数学领域一个著名的未解决难题
2024年12月8日
其他

OpenAI 12连发第2弹:强化微调,少量样本就能训练自己的专家模型

首先表示,今天发布的强化微调「允许你将你的黄金数据集转化为独特的产品,这将能让你将我们具有的神奇能力提供给你自己的用户和客户。」但它实际上要到明年才会真正公开推出。OpenAI
2024年12月7日