新智元

其他

不到10天,国产「香蕉」突袭!一次7图逼真还原,合成大法惊呆歪果仁

Banana再比如,参考图中男子,将其背景P为教室。prompt:参考图中人物,修改背景为人物在班里座位上认真听课以下四大模型,在背景生成上各有特点。但在人物脸部特征、服饰细节上,Vidu
2025年9月9日
其他

万亿参数狂欢!一文刷爆2025年七大顶流大模型架构

2的做法类似,但仍值得强调,因为它与以下情况不同:原始Transformer使用的后规范化(Post-Norm);GPT-2推广并被许多后续架构采用的前规范化(Pre-Norm);之前提到的OLMo
2025年8月3日
其他

全球最强开源「定理证明器」出世!十位华人核心,8B暴击671B DeepSeek

Jegelka教授指导下完成机器学习方向的博士后研究。目前,他主要从事LLM开发工作,专注于数学推理与问题解决能力的研究,涵盖非形式化与形式化(如LEAN)两大方向。Chi
2025年7月17日
其他

本地LLM万字救场指南来了!全网超全AI实测:4卡狂飙70B大模型

Ada运行DeepSeekR1-7B、Qwen3-8B、Qwen3-14B的模型的情况,另外还加上了Qwen3-32B的模型来做测试。DeepSeekR1-7B模型测试input128/output
2025年7月3日
其他

首个高考数学满分AI诞生!海淀名师审大题,给出惊艳超高分

确认提交投诉你可以补充投诉原因(选填)确定
2025年6月17日
其他

协和4+4的另一面:浙江范式用AI定义医疗未来!AI「智愈」时代来临

正把一项项尖端研究变成日常诊疗流程。甚至更进一步去想,有了iMedImage这个工具和平台,会有越来越多的医生成为研究员和科学家,开发更多的智能模型,实现对人类医学的贡献。让我们一起想象这样的明天•
2025年5月3日
其他

何恺明ResNet登顶,Transformer加冕!Nature独家揭秘25篇高被引论文

Scholar则努力将同一作品的所有版本归类并汇总引用。研究软件:科学家的「工具箱」除了AI领域,研究软件相关论文在本世纪引用榜单中表现亮眼。排名第二的论文由Thomas
2025年4月16日
其他

Llama 4全网首测来袭,3台Mac狂飙2万亿!多模态惊艳代码却翻车

4发布后排名瞬间跃升,甚至超过了DeepSeek-V3,Meta再一次回到牌桌。业界首个1000万上下文,RAG已死?Meta宣称Llama-4-Scout-17B-16E测试中好于Gemma
2025年4月6日
其他

刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座

Scout:参数规模较小,适用多种任务,支持1000万token上下文,全球领先。为了让不同模型适应不同的任务,针对多模态、超大参数规模等问题,Meta开发了一系列新的后训练方法。主力模型Llama
2025年4月6日
其他

奥特曼官宣:免费GPT-5性能惊人,o3和o4-mini抢先上线!Llama 4也鸽了

犀牛【新智元导读】刚刚,奥特曼接连抛出重磅消息:GPT-5不仅将免费开放,还将整合多项尖端技术。o3和o4-mini即将在几周内亮相,还有一个神秘的开源推理模型要来。然而,另一边Meta的Llama
2025年4月5日
其他

OpenAI要Open了!奥特曼开源首个推理模型,ChatGPT一小时暴增百万用户

确认提交投诉你可以补充投诉原因(选填)确定
2025年4月1日
其他

Midjourney V7内测图首曝,电影级画质干翻GPT-4o!人物蜡像感消失,AI生图迎最强地震

elephants甚至是,自己的一张手绘图,GPT-4o就能直出一张创意海报。家居设计,根据指令逐一完善图片。还有无人机广告,4o都展现出无可比拟的优势。Midjourney
2025年3月31日
其他

0行代码打造3D游戏,氛围编码席卷全网!开发30分爆赚28万

coding」(氛围编程)让3D游戏制作变得轻松。无需编写代码,借助AI工具就能打造游戏,甚至还能盈利!从骑马大战飞龙的奇幻冒险,到水上摩托艇的惊险竞速,再到多人海盗船的探索之旅,Vide
2025年3月16日
自由知乎 自由微博
其他

邀请码炒到10万?OpenManus深夜开源打脸!Manus X账号遭冻结,平替光速上线

use、基本的智能体和规划。就像在Manus中那样,任何人都可以使用OpenManus,把自己的想法变为现实。无论在手机上还是OS上,如果想做Deep
2025年3月7日
其他

美国博士offer一夜变废纸!陶哲轩抗议LeCun建议欧洲抄底,川普新政搞崩学术圈

LeCun:「你怎么不考虑去欧洲?」对此,LeCun表示:「这些对他这个『老头子』来说,都已经无关紧要了。」而来自荷兰的教授Martijn
2025年2月24日
其他

世界首个「AI CUDA工程师」诞生!AI自己写代码优化CUDA内核,性能狂飙100倍

CUDA工程师」能实现各种操作,包括归一化方法、损失函数、特殊矩阵乘法,甚至是完整的神经网络架构。17,000+个已验证CUDA内核数据集研究团队随论文一同发布的「资料库」(The
2025年2月20日
其他

比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核

Level-1问题解决率,是用来评估LLM为特定计算任务生成高效GPU内核能力的数值正确指标,它是一系列测试LLM
2025年2月15日
其他

历史分水岭:DeepSeek GitHub星数超越OpenAI!大佬揭秘仅用450美元训推理模型

2.5模型,范围从0.5B到32B)进行指令微调。实际上,这个蒸馏过程中的SFT数据集,和之前用来训练DeepSeek-R1的数据集是一样的。为什么开发蒸馏模型?可能有两个关键原因:1
2025年2月7日
其他

谷歌反击,最强Gemini 2.0全家桶砸场DeepSeek!物理模拟编码惊人Jeff Dean站台

Pro编码能力太疯狂了!我最喜欢的一点是,你可以直接用Prompt让它做特定修改,它会精准编辑,而且不会弄乱其他部分。下面是他制作的一个太阳系模拟演示。提示:Using
2025年2月6日
其他

OpenAI紧急直播,ChatGPT疯狂开挂「深度研究」!10分钟爆肝万字现AGI雏形,刷榜人类最后考试

Research就将在Pro中推出了(每月100次查询),之后还会很快在Plus、Team、Education和Enterprise版本中上线。帮PM完成深度市场调查报告从一个按钮「Deep
2025年2月3日
其他

o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭

other另一个动漫小人射击游戏。还有网友通过o3-mini-high制作的太阳系3D模拟。网友adi让o1和o3-mini分别建造一个巨大的、令人惊叹的、史诗般的漂浮城市。prompt:build
2025年2月2日
其他

OpenAI称有DeepSeek「偷窃」证据?美军已发起攻击!Anthropic CEO喊话加强芯片管制

Srinivas写道,很多人以为中国克隆了OpenAI的成果,他们明显对模型训练方式的理解很片面。DeepSeek已经找到了强化学习微调的方法,他们的「DeepSeek-R1
2025年1月30日
其他

刚刚,特朗普与奥特曼惊天启动星际之门!4年狂砸5000亿美金,孙正义任董事长

的使用,利用这些额外的计算能力来训练领先的模型并提供出色的产品和服务。在OpenAI看来,这一新的里程碑对实现AGI至关重要,将使富有创造力的人们能够找到利用AI促进人类发展的方法。
2025年1月22日
其他

微软打响裁员第一枪!AI智能体引爆2025失业潮,硅谷巨头停招程序员

Console中为了API密钥而耗费时间……成千上万的用户因此而愤然离场。4)LLM看不到你的数据库几乎每个项目都需要一个数据库。然而,在构建项目时,数据库总是在不断变化。以下循环是常有的事:1.
2025年1月9日
其他

15大机构十年研究证明:无约束AI必然超越人类,创造能力也更强!

生理上,如果一个神经元被激发,其轴突将总是产生一个统一幅度的电冲动,其高度无论刺激的强度或持续时间如何都保持不变。神经元轴突要么完全传递最大响应穿过突触到下一个神经元,要么一点都不传递。3.
2024年12月26日
其他

Anthropic预测:2025是智能体系统年!年终总结分享最佳实践

Protocol,允许开发人员通过简单的客户端实现与各种第三方工具进行集成。提示链(Prompt
2024年12月24日
其他

AI博士NeurIPS现场崩溃后悔读博,NYU教授痛心发文!五年前高薪又自由,如今沮丧又焦虑

Cho的一篇博客,成为圈内热议的话题。这篇博客的题目十分触目惊心:《我在NeurIPS’24上感受到了焦虑和挫败》。他表示,在NeurIPS
2024年12月23日
其他

刚刚,DeepMind最强「基础世界模型」诞生!单图生1分钟游戏世界,解锁下一代智能体

guidance)会被用于提高动作的可控性。值得注意的是,上文中的演示均由未经蒸馏的「满血版」基础模型生成,从而充分地展示技术潜在的能力。当然,也可以实时运行经过蒸馏的版本(distilled
2024年12月5日
其他

3个月估值10亿,李飞飞空间智能首个模型诞生!一张图生成3D世界,视频游戏要变天

几何精确性:这个生成的世界遵循基本的3D几何物理规则。它们具有真实的立体感和空间深度,与某些AI生成视频的虚幻效果形成鲜明对比。可视化3D场景最简单的方法是,就是使用深度图(depth
2024年12月3日
其他

微软发明全新「LLM语言」,AI智能体交互效率翻倍!

model作为发送方,微调版本作为接收方,选择了下面四组模型。单从模型参数来看,绝对是亲生的,相似度差别都是小数点后三位的水平:那么对于相同输入,中间的计算结果有多大差别?这里的E
2024年12月1日
其他

Grok 3证明黎曼猜想,训练遭灾难性事件?数学家称不夸张,两年内AI将解出千禧年难题

2024的三道题的。从某种角度来说,IMO数学竞赛题跟「猜想界的皇冠」黎曼猜想距离有多远,那离AI证明黎曼猜想也就有多远。谷歌DeepMind研究人员,AlphaProof负责人Rishi
2024年11月18日
其他

深度解析Recraft V3:突破文本渲染限制,「文生图」黑马是怎样炼成的?

V3排名第一最近,Recraft团队在其官方网站上分享了其在文本渲染技术方面的一些实现细节。接下来的部分,我将详细分析这些技术细节,探讨Recraft如何实现其出色的文本到图像渲染效果。图3
2024年11月14日
其他

奥特曼专访自曝OpenAI掌握AGI密钥,2025年降临!1人1万块GPU缔造十亿独角兽

Tan对奥特曼展开了一次访问,谈论了OpenAI的起源,公司的下一步发展,以及他对于创始人该如何驾驭一个庞大公司的建议。在所有人都在认为奥特曼又在炒作的同时,德扑之父、OpenAI研究员Noam
2024年11月10日
其他

苹果一篇论文得罪大模型圈?Transformer不会推理,只是高级模式匹配器!所有LLM都判死刑

如果整个任务的解决方案过程可以用一个图来描述,那么其中的子任务就是该图中的子图。图的结构描述了哪些步骤依赖于其他步骤,而这种依赖顺序限制了子图如何被展平成线性序列。3.
2024年10月19日
其他

OpenAI惊天剽窃!20岁创始人自曝代码结构被抄袭,多智能体Swarm陷争议

B."}],)print(response.messages[-1]["content"])Hope
2024年10月13日
其他

倒计时!奥特曼罕见长文预言:ASI几年内降临,人类奇点将至

Domingos也认为,ASI只是一个白日梦。AI比人类更聪明了吗?最近,在一项标准化门萨智商测试中,AI模型首次显著超过了人类智商的中位数——100。位于峰值的,就是智商得分为120的OpenAI
2024年9月24日
其他

8秒生成犯罪现场报告,美警使用AI工具写文书,竟比人脑回忆还准

One的使用领域非常敏感,因此对新技术的引入也有许多人抱有疑虑。LLM固有的偏见问题如何解决?如何确保工具的正确使用?技术的使用范畴和使用门槛谁来限制?种族偏见俄克拉荷马城社区活动家Aurelius
2024年8月31日
其他

一周打完1000场官司,中科院发布首个AI法庭AgentCourt!

AI在法律领域的应用也带来了一系列伦理问题,如决策过程的透明度、AI偏见的控制等,需要社会各界共同探讨。参考资料:https://github.com/relic-yuexi/AgentCourt
2024年8月30日
其他

大厂围堵AI创业曝「死亡名单」,前谷歌大佬出走几乎无一幸免!

科技大厂就在前不久,我们刚刚报道过「25亿独角兽CEO带头跑路,连夜打包30个员工卖身谷歌」的故事。在短短5个月内,这是第三起AI初创公司卖身大科技巨头的交易了。Naom
2024年8月27日
其他

世界首个AI科学家连发10篇论文,横扫「顶会」!一篇仅需100元,自主科研效率完爆人类

AI的研究者们甩出的这些演示,显示出AI科学家在机器学习研究的不同子领域进行学术研究的能力,是多么游刃有余。无论是扩散模型、Transformers还是Grokking,没有它不能发的paper。1
2024年8月14日
其他

买不到GPU,马斯克自曝AI巨兽Dojo!自研超算挑战英伟达,约等于8千块H100

乔杨【新智元导读】多年来,马斯克一直在公开谈论Dojo——这台超算将成为特斯拉人工智能雄心的基石。他最近表示,随着特斯拉准备在10月推出Robotaxi,AI团队将「加倍投入」Dojo。
2024年8月4日
其他

25亿独角兽CEO带头跑路,携30员工卖身谷歌!AI大佬:AGI泡沫几周就要破

Information自2021年开始记录以来的任何一个季度——共有多达55家。在这之中,融资最多的公司基本都在训练基础模型。比如刚刚提到的xAI,筹集了6.4亿美元的开源模型开发公司Mistral
2024年8月3日
其他

一枚「弃子」打破80年黎曼猜想纪录!菲尔兹奖得主MIT大拿联手,陶哲轩转赞

Montgomery甚至表示,如果有魔鬼答应让数学家们用自己的灵魂来换取一个数学命题的证明,大多数学家想要换取的将会是黎曼猜想的证明。80多年的纪录,忽然被打破了1940年,一位名叫Albert
2024年7月16日
其他

大模型最强架构TTT问世!斯坦福UCSD等5年磨一剑, 一夜推翻Transformer

2k的所有观察结果仍然成立,唯一的例外是Mamba的表现略好于TTT-Linear。在32k上下文中,TTT-Linear(M)和TTT-MLP(M)的性能均优于Mamba,与Pile
2024年7月9日
其他

爆火AI惨遭阉割,1600万美国年轻人集体「失恋」? Character AI被爆资金断裂,00后炸了

Freitas,曾在谷歌参与早期聊天机器人的开发。但是,这些初创公司需要承担训练和运行AI模型的高额成本,以及来自科技巨头和OpenAI这类大型初创公司的竞争。今年三月份,Inflection
2024年7月2日
其他

OpenAI服务受限?别担心,来这里丝滑玩转700亿参数Llama3,还有100元券免费薅!

3推理:https://github.com/meta-Llama/Llama3#inference选一块A800的卡,计费方式已经默认选择了更省钱的潮汐计费。在公共镜像中找到Llama
2024年6月26日
其他

这个AI工具,让美国年轻人疯狂上瘾!Character AI每秒被查询2万次,占谷歌搜索20%

AI年轻用户的写照。一面认为聊天机器人有趣、有帮助,甚至像真实的朋友一样有支持性,但同时也清晰地知道自己有上瘾的感觉。Reddit一位用户发帖,描述自己的生活逐渐被Character
2024年6月24日
其他

GPT-5一年半后拥有「博士级智能」,Claude 3.5首超人类博士!全知全能ASI将成人类「新神」?

Sonnet已经将AGI的倒计时推至75%,成为了第一个测试分数高于最聪明的人类博士分数的模型。在研究生级推理(GPQA)、本科级知识(MMLU)和编码能力(HumanEval)上,Claude
2024年6月22日
其他

跨越AGI,Ilya官宣创业!我要的是「核安全」,SSI剑指安全超级智能

Ermon教授指导,在概率模型和强化学习方面做研究。2015年获得巴黎综合理工学院应用数学学士学位。入职OpenAI之前,他还在Facebook应用机器学习、谷歌大脑实习。Daniel
2024年6月20日