新智元

其他

微软发明全新「LLM语言」,AI智能体交互效率翻倍!

model作为发送方,微调版本作为接收方,选择了下面四组模型。单从模型参数来看,绝对是亲生的,相似度差别都是小数点后三位的水平:那么对于相同输入,中间的计算结果有多大差别?这里的E
12月1日 下午 12:45
其他

苹果一篇论文得罪大模型圈?Transformer不会推理,只是高级模式匹配器!所有LLM都判死刑

如果整个任务的解决方案过程可以用一个图来描述,那么其中的子任务就是该图中的子图。图的结构描述了哪些步骤依赖于其他步骤,而这种依赖顺序限制了子图如何被展平成线性序列。3.
10月19日 下午 1:21
其他

8秒生成犯罪现场报告,美警使用AI工具写文书,竟比人脑回忆还准

One的使用领域非常敏感,因此对新技术的引入也有许多人抱有疑虑。LLM固有的偏见问题如何解决?如何确保工具的正确使用?技术的使用范畴和使用门槛谁来限制?种族偏见俄克拉荷马城社区活动家Aurelius
8月31日 下午 1:09
其他

一周打完1000场官司,中科院发布首个AI法庭AgentCourt!

AI在法律领域的应用也带来了一系列伦理问题,如决策过程的透明度、AI偏见的控制等,需要社会各界共同探讨。参考资料:https://github.com/relic-yuexi/AgentCourt
8月30日 下午 12:52
其他

大厂围堵AI创业曝「死亡名单」,前谷歌大佬出走几乎无一幸免!

科技大厂就在前不久,我们刚刚报道过「25亿独角兽CEO带头跑路,连夜打包30个员工卖身谷歌」的故事。在短短5个月内,这是第三起AI初创公司卖身大科技巨头的交易了。Naom
8月27日 下午 12:53
其他

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

乔杨【新智元导读】多年来,马斯克一直在公开谈论Dojo——这台超算将成为特斯拉人工智能雄心的基石。他最近表示,随着特斯拉准备在10月推出Robotaxi,AI团队将「加倍投入」Dojo。
8月4日 下午 12:26
其他

25亿独角兽CEO带头跑路,携30员工卖身谷歌!AI大佬:AGI泡沫几周就要破

Information自2021年开始记录以来的任何一个季度——共有多达55家。在这之中,融资最多的公司基本都在训练基础模型。比如刚刚提到的xAI,筹集了6.4亿美元的开源模型开发公司Mistral
8月3日 下午 1:10
其他

大模型最强架构TTT问世!斯坦福UCSD等5年磨一剑, 一夜推翻Transformer

2k的所有观察结果仍然成立,唯一的例外是Mamba的表现略好于TTT-Linear。在32k上下文中,TTT-Linear(M)和TTT-MLP(M)的性能均优于Mamba,与Pile
7月9日 下午 12:52
其他

爆火AI惨遭阉割,1600万美国年轻人集体「失恋」? Character AI被爆资金断裂,00后炸了

Freitas,曾在谷歌参与早期聊天机器人的开发。但是,这些初创公司需要承担训练和运行AI模型的高额成本,以及来自科技巨头和OpenAI这类大型初创公司的竞争。今年三月份,Inflection
7月2日 下午 1:11
其他

OpenAI服务受限?别担心,来这里丝滑玩转700亿参数Llama3,还有100元券免费薅!

3推理:https://github.com/meta-Llama/Llama3#inference选一块A800的卡,计费方式已经默认选择了更省钱的潮汐计费。在公共镜像中找到Llama
6月26日 下午 1:02
其他

这个AI工具,让美国年轻人疯狂上瘾!Character AI每秒被查询2万次,占谷歌搜索20%

AI年轻用户的写照。一面认为聊天机器人有趣、有帮助,甚至像真实的朋友一样有支持性,但同时也清晰地知道自己有上瘾的感觉。Reddit一位用户发帖,描述自己的生活逐渐被Character
6月24日 下午 1:28
其他

GPT-5一年半后拥有「博士级智能」,Claude 3.5首超人类博士!全知全能ASI将成人类「新神」?

Sonnet已经将AGI的倒计时推至75%,成为了第一个测试分数高于最聪明的人类博士分数的模型。在研究生级推理(GPQA)、本科级知识(MMLU)和编码能力(HumanEval)上,Claude
6月22日 下午 12:59
其他

跨越AGI,Ilya官宣创业!我要的是「核安全」,SSI剑指安全超级智能

Ermon教授指导,在概率模型和强化学习方面做研究。2015年获得巴黎综合理工学院应用数学学士学位。入职OpenAI之前,他还在Facebook应用机器学习、谷歌大脑实习。Daniel
6月20日 上午 10:29
自由知乎 自由微博
其他

代码都让AI写,CS还有前途吗?加州大学伯克利分校:CDSS申请人数飙升48%!

DeNero也是生成式人工智能初创公司Lilt的首席科学家,曾在谷歌担任研究员,负责开发谷歌翻译。Lilt官网他在给Business
6月16日 下午 12:49
其他

陶哲轩最新采访:AI将颠覆数学界!用Lean规模化,成百上千条定理一次秒杀

4成功完成PFR猜想的证明德国数学家、菲尔兹奖得主Peter
6月15日 下午 1:28
其他

欧洲「OpenAI」崛起!Mistral一年估值暴涨至60亿,60人团队创奇迹

Laws)。随着2022年AI竞赛的升温,大公司的AI实验室减少了LLM研究成果的发表,也减少了与研究社区的分享,Mensch对于这一情况感到失望。Arthur
6月12日 下午 1:22
其他

中国版Sora震撼登场,原生16秒直出超清视频!国产黑马火了,世界模型签约多个大客户

CEO黄冠是清华大学自动化系博士,拥有超过十年、全球领先的AI技术经验,拥有微软、三星、地平线等知名公司算法经历,多次带领百人算法团队,还拥有AI、自动驾驶、大模型等方向的连续创业经验;-
6月11日 下午 2:15
其他

「汪汪」to Vector!密歇根博士生用AI解码狗的声音 | LREC 2024

Mihalcea表示:「关于与我们共享这个世界的动物,我们不知道的还有很多。人工智能的进步将彻底改变我们对动物交流的理解,而且我们可以使用以人类语音为基础的预训练模型,不必从头开始。」「汪汪」to
6月10日 下午 12:53
其他

1毛钱1百万token,写2遍红楼梦!国产大模型下一步还想卷什么?

Tools还有非常多的组合,开发者可以自行去探索。多模态比肩GPT-4V除了文本模型,这次一并开源了多模态模型GLM-4V-9B。最新模型采用了与CogVLM2相似的架构设计,能够处理高达1120
6月5日 下午 8:02
科技

Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍

Mamba-1的头维度是𝑃=1(即所有通道完全由独立的SSM控制),而Mamba-2使用的头维度是𝑃>1(默认情况下类似于𝑃=64)。特别是,这可以通过两种方式视为权重共享:1.
6月4日 下午 12:36
其他

LLM的「母语」是什么?

编辑:alan【新智元导读】在以英语为主的语料库上训练的多语言LLM,是否使用英语作为内部语言?对此,来自EPFL的研究人员针对Llama
6月3日 上午 1:08
其他

老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题

Blackwell,里面有8个GPU。而对应散热器的尺寸也很惊人,达到了15kW,并且是完全的风冷。如果你喜欢部署液冷系统呢?英伟达也有新型号MGX。单个MGX同时集成72个Blackwell
6月3日 上午 1:08
其他

谷歌DeepMind:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了

AI的高级研究员。在此之前,她在牛津大学获得了考古学与人类学的学士学位。参考资料:https://arxiv.org/abs/2405.18870
6月1日 下午 1:23
其他

27岁华裔天才少年对打UC伯克利,首发SEAL大模型排行榜!Claude 3 Opus数学封神

Arena相同的方法,使用Bradley-Terry模型对我们的数据点进行重新权重的最大似然估计。首先是一些定义:对于𝑀个模型,用𝐴={(𝑚,𝑚′):𝑚
5月30日 下午 1:10
其他

GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示

2-70B的得分明显低于人类。过于保守的GPT根据以上的试验,「失言」是GPT-4无法匹敌或超过人类表现的唯一测试,我们可能会据此以为GPT模型难以应对失言。令人惊讶的是,失言也是唯一一个Llama
5月26日 下午 12:36
其他

谷歌AI搜索惨败,竟教唆网友自杀!

Overview会大概率引用Reddit帖子作为收集素材的来源。11年前,Reddit用户F*cksmith曾经恶搞说过把胶水融合到酱汁里,会让披萨别有一番风味。Google
5月26日 下午 12:36
其他

中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o

5的成绩。展望未来,正如这次大会的主题「AI赋能,智筑国基」,中国移动将肩负AI「国家队」的使命继续前行,把AI领域最前沿的进展带入千家万户、千行百业。
5月25日 下午 8:35
其他

估值飙至138亿美元!27岁华裔天才少年再获融资,数据标注会是下一个风口?

AI发展飞速,到2021年已经成长为价值73亿美元的独角兽企业,2023年初公司规模也扩展到了700人。Wang在接受《财富》杂志独家采访时透露,随着企业客户竞相训练生成式AI模型,Scale
5月25日 下午 8:35
其他

89岁计算机架构先驱、超算软件之父戈登·贝尔逝世!ACM奖项以他命名

Computer。以太网的建立也离不开Bell的倡导。在美国国家科学基金会(NSF)工作期间,他领导了超级计算机联网工作,直接促成了现代互联网的发展。1987年,他赞助了ACM
5月25日 下午 8:35
其他

惊掉下巴:GPT-4o现场爆改代码看图导航!OpenAI曝光LLM路线图,GPT Next年底发

好困【新智元导读】全世界的目标再次聚焦在巴黎科技活动上的OpenAI。这次,开发者体验负责人带来了更多GPT-4o精彩演示,根据地图导航,修改代码惊艳了在场400+位观众。不仅如此,OpenAI
5月24日 下午 1:26
其他

微软深夜再掀AI生产力革命,奥特曼登台「自曝」新模型!定制Copilot十亿打工人狂欢

创建了众多团队来确保LLM按预期工作。」三大杀器过去的一年半里,世界发生了诸多变化,其中最令Altman本人震惊的事是什么?Altman表示,数百万开发者是推动过去一年里世界巨变的核心。从GPT-4
5月22日 上午 5:52
其他

微软一夜干翻苹果Mac!GPT-4o装进全家桶,微软把全世界PC都AI了

RT的Surface以来,微软一直未能在Arm架构上提供足够兼容且丝滑的操作系统体验,运行速度落后于搭载英特尔芯片的设备。为了充分利用AI架构与新款高通芯片的优势,微软重新设计了Windows
5月21日 下午 1:01
其他

GPT-4通过图灵测试,胜率高达54%!UCSD新作:人类无法认出GPT-4

研究者通过改编GPT-4和GPT-3.5探索性研究中表现最佳的提示,来指示大模型如何去响应消息。研究人员称,解释图灵测试的一个核心挑战是,系统表现出色可能源于两种原因:-
5月18日 下午 1:48
其他

复旦团队重大突破登Cell,破纪录复活「冰封」18个月人脑!三体云天明计划成真?

7G),进一步表明MEDY可以通过在冷冻保存或解冻过程中抑制这些基因的表达来防止类器官细胞的凋亡。这些结果表明,MEDY冷冻保存可以通过抑制内质网介导的细胞凋亡途径来维持类器官的存活和神经功能(图
5月18日 下午 1:48
其他

数据分析师噩梦?ChatGPT实时互动分析Excel数据,网友挖出背后新模型

V2(GPT-4)又出现了,全网都在寻找这个新模型的蛛丝马迹。有网友表示,ADA就是代表着Advanced
5月17日 下午 5:46
其他

GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大6位华人领衔

Chen是大家奋斗的支柱。他已是OpenAI五年多的老员工。此前曾在微软、Trading实习,在哈佛做访问学者,在量化研究工作过5年,并且成为合伙人。他毕业于MIT数学-计算机专业。Jiahui
5月16日 下午 1:30
其他

突发!OpenAI首席科学家Ilya离职,GPT-4背后天才科学家接任

编辑:编辑部【新智元导读】在OpenAI宫斗风波之后消失许久的Ilya,终于罕见地露面了:他表示,十年之后,自己选择离开OpenAI。消失太久的Ilya,再次现身竟是离职OpenAI!刚刚,Ilya
5月15日 上午 8:21
科技

OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真

MMLU(常识问题)上创造了88.7%的新高分。与传统的5个样本,没有使用COT的MMLU评测中,GPT-4o更是创下了87.2%的新高分!不过在DROP中,GPT-4o的表现稍落后于GPT-4
5月14日 上午 5:20
其他

MIT等惊人发现:全世界AI已学会欺骗人类!背刺人类盟友,佯攻击败99.8%玩家

编辑:桃子【新智元导读】AI系统越来越擅长欺骗、操作人类了。最近,来自MIT、ACU等机构的研究人员通过各种实例研究发现,
5月14日 上午 5:20
其他

OpenAI重磅更新定档下周一,奥特曼暗示会有「魔法」!

gpt4-lite-auto:与gpt4-auto类似,但使用的是lite版本。同样,也有人称,gpt4-lite即将发布。离职OpenAI,入职谷歌的Logan
5月11日 下午 1:37
其他

AI入侵华尔街,金领不金!高盛、摩根大通:66%初级分析师或将被取代

Dimon就在致股东的年度信件中表示,AI会切实影响工作岗位的安排。持同样态度的还有BlackRock(美国贝莱德集团),其首席执行官Larry
5月3日 下午 12:41
其他

MLP一夜被干掉!MIT加州理工等革命性KAN破记录,发现数学定理碾压DeepMind

theory)是低维拓扑学中的一门学科,它揭示了三流形和四流形的拓扑学问题,并在生物学和拓扑量子计算等领域有着广泛的应用。2021年,DeepMind团队曾首次用AI证明了纽结理论(knot
5月2日 下午 12:50
其他

全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT

1.0的基座模型在视觉问答和业务应用任务上超过了GPT-4V、Qwen-VL-Max和Intern-VL,同时它在描述、推理和检测任务上也达到了次好的效果。总体而言,Awaker
4月29日 下午 12:45
其他

国产黑马砸来百万算力福利,Llama 3微调快去冲!H800点击就送,1.99元玩转4090

3模型权重已准备好,无需额外安装步骤。推理生成运行生成脚本PRETRAINED_MODEL_PATH="/root/notebook/common_data/Meta-Llama-3-8B"
4月28日 下午 12:28
其他

震撼!GPT-4 Turbo级国产大模型登场,周冠宇F1赛事数据秒分析惊呆国际大佬

Turbo让我们重回到这些评测上,不难看出,日日新5.0在语言、知识、推理、数学、代码等能力上,都有了一波明显的。而在主流客观评测上,它已经达到甚至超越了GPT-4
4月26日 下午 6:43