未尽研究

其他

首席科学家苏兹克沃辞职,OpenAI和大模型在进入一个新阶段

是我们这一代最杰出的头脑之一,是我们领域的指路明灯,也是我亲爱的朋友。他的聪明才智和远见卓识是众所周知的,而他的温暖和同情心则不那么为人所知,但同样重要。没有他,OpenAI
5月16日 上午 12:03
其他

GPT-4o演示科幻级语音助理,还要再看下凌晨谷歌的。苹果联手OpenAI欲出

GPT-4o的小美女CTO穆拉蒂,先是宣布推出GPT-4o,然后带着两个小哥,用一个插着线缆的手机和一台电脑,演示了ChatGPT的多模态功能,前后仅仅26分钟,把无数那些辛苦了一年、刚刚宣布赶上了GPT-4(turbo)
5月14日 下午 4:21
其他

AlphaFold3震撼发布:预测所有生命分子结构相互作用

在线教育课程。DeepMind还将与全球南方发展中国家的组织建立合作关系,为科学家提供他们需要加速采用和研究的工具,包括一些资金不足的领域,如一些被忽视的疾病和食品安全。
5月9日 上午 9:16
其他

苹果M4芯片,争夺主导AI用户体验

Elite芯片。不止于此。M4的发布,应该是苹果今年AI战略打响的第一枪。争夺端侧算力TOPSM4芯片采用了第二代3纳米工艺,拥有10个CPU内核和10个GPU内核。苹果最想强调的,是它的16核
5月8日 下午 12:03
其他

生成式AI变现的中国模式

在沉寂了许久之后,不少发布了国产大模型的中国企业,市值迎来了一波上涨。商汤科技最为典型,不到20个交易日,直线上涨了近200%,但仍然只是上一轮峰值的一半。与18个月前ChatGPT的问世催化了市场的交易热情不同,这一次,参与者或多或少交代了一点财务数据或业务细节。不管再怎么宣传国产大模型测评赶超GPT-4,市场都更相信商业承诺与兑现。美国的大模型产业仍然是“芯片-基础设施-应用”的三角结构,价值创造目前主要集中在底层的芯片公司,并开始向基础设施转移。中国还没有诞生英伟达,某种意义上,中国生成式AI的竞争压力,无论是于国内市场而言,还是于地缘格局而言,一开始就落到了基础设施与应用的商业化上。尤其是在大模型技术规模落地的早期,除技术成熟度外,基础设施完善、部署便捷性与成本平民化,都将决定它能走得多远。在美国,科技巨头成为基础设施的代名词。中国的基础设施商业化,与美国有点不一样。国产大模型已经进入“百模大战”阶段,在监管机构备案的国产大模型共117款,还不包括企业等并不面向境内公众提供服务的大模型。它们大致可以分为AI+、+AI、巨头等几大类,都在打造基础设施,商业模式也各不一样。巨头拥有用户、数据、模型与算力,已经建立起端到端全栈技术能力与商业模式,包括阿里巴巴、百度、腾讯与字节跳动等。它们的很多应用场景彼此重叠,最重要的大模型基础设施是旗下的云服务业务,通常既包括IaaS服务,也包括PaaS与SaaS服务。去年四季度,大模型已经为百度的智能云业务,带来6.6亿元人民币的增量。这既包括基于“千帆”构建、微调符合客户预期的模型,也包括调用文心大模型的推理需求。而且,客户在模型微调后的推理需求也在迅速增长。阿里巴巴的智能云服务,则有望受益于通义大模型,以及“魔搭”与“百炼”。AI+是AI
5月7日 下午 11:08
其他

AI战斗机首次空中格斗人类,美空军“FSB”加速部署千架

是一家跨学科的人工智能公司,开发针对国家安全问题的下一代任务自主性解决方案。EpiSci
5月5日 上午 10:55
其他

吸引李飞飞创业的空间智能,已经让机器狗遛瑜伽球|笔记

李飞飞在斯坦福大学的个人主页上显示,她将在2024年初至2025年底期间部分离职。这位顶着“AI教母”光环的科学家创业了。李飞飞创办的公司,将利用类似人类的视觉数据处理能力,使人工智能进行更高级的推理。据路透社报道,她最近完成了种子融资。投资者包括硅谷风险投资公司安德森·霍洛维茨,以及加拿大公司激进风险投资公司(Radical
5月4日 下午 7:32
其他

大模型轮到基础设施赚钱了

大模型何时赚钱,怎么赚钱?要想回答这个问题,最好是看下全部All
5月3日 下午 11:25
其他

训练Llama3产生万吨碳排放,单一算力集群向GW级电力扩展 | 笔记

Meta在开源了Llama3系列两个较小参数规模的版本后,扎克伯格放出口风,已经开始准备训练Llama4了,要继续砸100亿美元甚至1000亿美元在算力基础上设施上。小扎不差钱为自己的“星门计划”买得起数十万张GPU,但是数据中心会面临日益严峻的电力供应和二氧化碳排放问题。Meta为训练Llama3
4月22日 下午 10:19
其他

谷歌对齐阵形,加快部署最强AI到安卓软硬件生态

就在Meta发布Llama3-8B和70B的当天,谷歌CEO皮查伊,公布了公司组织架构的一次重大挑整。谷歌要以最快的速度,把Gemini部署到整个安卓的软硬件生态中超过30亿个活跃移动设备和用户中。而Meta也立即宣布Llama3支持的智能助理,立即加载到Facebook、Whatsapp、Instagram等主要应用上,服务总计逾30亿用户。苹果也在加紧在其20亿活跃设备上全面部署AI。自从OpenAI推出ChatGPT、GPT-4、Sora等基础模型和产品以来,微软与OpenAI的联盟,就从谷歌夺走了AI的主导权。谷歌反应迟缓、力量分散、人才流失、士气低下、产品发布掉链子,尽显大公司病。去年四月份,谷歌做了第一次组织调整,把DeepMind与谷歌研究中的谷歌大脑合并,成立谷歌DeepMind,对决OpenAI,加快大模型研发,专攻Gemini,至今年初全部推出,勉强赶上了GPT-4,Gemini成为谷歌所有业务的模型基座。今年以来,谷歌继续规模裁员,换帅的声音不绝于耳,甚至连退隐的联合创始人布林都重现江湖,进入开发团队看代码,并且劝阻谷歌员工不要跳槽。昨天,谷歌和Alphabet的首席执行官桑达尔·皮查伊公布了新的组织架构调整方案,以提高公司速度和执行力。谷歌DeepMind
4月20日 上午 12:02
其他

AI PC,联想发布了,巨头们要真正下场了

PC引领了对大模型与终端设备相结合的市场验证。通过端侧设备建立起个人AI用户体验,包括PC、手机、汽车、可穿戴设备和AI原生设备,正在汇成今年生成式AI应用的最大赛道。AI
4月19日 上午 12:39
其他

都在卷长文本,原来谷歌魔改了Transformer,推出了“无限注意力” | 笔记

首先玩了一个百万token的,中国的月之暗面一个月后推出Kimi智能助手,支持200万字超长无损上下文,在中国的大模型应用中异军突起。行业内的大厂们坐不住了,阿里巴巴的通义千问项目开放了
4月14日 下午 12:43
其他

DeepMind真的“发现220万种晶体”?AI是不是在向人类倾泻结构化噪音 | 笔记

去年11月,谷歌DeepMind在《自然》杂志上发布了一篇论文《扩展深度学习用于材料发现》。DeepMind使用一个名为GNoME(材料探索图神经网络)的模型,预测出了220万种新的晶体,其中38万种具有稳定的结构。过去的十年,世界各国的科学家用计算机模拟的方法发现了28000种新材料,加上人类利用传统实验的方法发现的大约20000种稳定性材料,人类发现的稳定晶体数量总共达到了48000个。无机晶体的发现在固态化学中具有基础科学和技术的重大意义。乍看起来,DeepMind的方法,几乎把人类发现的稳定晶体结构数据扩展了一个数量级,而伯克利大学很快用一种AI智能代理的方法,在实验室中去自动合成这些晶体结构,同步发表了论文。不出所料,DeepMind的论文引发了轰动。“这些材料可能推动未来技术的发展”,谷歌在其新闻稿中写道,这相当于“近800年的知识积累”,并且是“人类已知稳定材料数量的一个数量级的扩展”。另一篇同时发表的论文,由劳伦斯伯克利国家实验室的研究人员“与谷歌DeepMind合作……展示了我们的人工智能预测如何被用于自主材料合成”,谷歌写道。在这个实验中,研究人员创建了一个“自主实验室”(A-Lab),使用“计算、文献中的历史数据、机器学习和主动学习来规划和解释使用机器人执行的实验的结果”。研究人员使用人工智能和机器人,将人类从实验室中移除,并且在17天后发现了并合成了新材料,研究人员写道,这“展示了人工智能驱动的自主材料发现平台的有效性”。这两篇论文给人一种印象,科学智能(AI4Sceince)带来的范式革命,正在材料科技领域发生突破。不过,来自化学和材料学术界质疑的声音开始出现。包括普林斯顿、伦敦大学学院、加州大学圣芭芭拉分校的化学家和材料学家分析了DeepMind发现的一部分材料,他们认为,“我们尚未在那个子集中发现任何特别新颖的化合物”。用可信性、有用性、新颖性的尺度来衡量,还很难说DeepMind的研究是材料科学的突破。它的算法没有问题,但缺乏新颖性和有用性。AI工具能如此快速地从海量数据中进行科学发现,但科学研究中最重要的一个环节,依然是同行评议。当化学及材料科学家对DeepMind的这项研究花时间进行深入分析后,他们发现,那些用各种算法算出来的东西,可能是非常肤浅地模拟了微观自然中一些表层的现象,它们经不起人类用科学实验进行检测。一个更大的问题是,有多少假“科学智能”之名进行的研究,能否检验其科学性,有用性和新颖性。如果一个算法能完成人类数百年的研究工作,人类开始把大量的科学研究工作交给科研“智能体”,这样的科研成果一旦充斥于人类的知识库,我们是否将会被噪音彻底淹没?我们还有机会辨别吗?科学智能有很大的潜力,但它依然是一种方法,依然要依据科学研究的方法和规范,依然要受到人类科学家的控制。而AI进行科学研究的自主性,可能是一个反复实验的过程,AI领域流行的打榜和对比方法,可能最终还是要经过学科领域内的科学家的评议,才能产生最终的结论。长期来看,科学智能还是需要human
4月12日 下午 9:19
自由知乎 自由微博
其他

Meta,正在成为一家彻头彻尾的AI科技巨头。就等Llama3了 | 笔记

Meta公布了自研芯片MTIA的新版本,不仅用于社交媒体中内容与广告的排行和推荐,而且能用于未来更复杂模型的训练和推理。Meta去年5月份公布了7纳米的MTIA
4月11日 下午 3:43
其他

AGI:模型扩展、资本扩张与市场泡沫

尽管面临泡沫质疑,资金仍在涌向大模型。科技巨头正在为通往通用人工智能的基础设施添砖加瓦。英伟达创造算力硬件,微软、亚马逊与谷歌分发这些算力,四家公司的总市值从ChatGPT刚推出时的4万亿美元,迈向10万亿美元,成为推动美国股市上涨的主导力量。在风险投资市场,几乎只有人工智能相关初创企业才能享受到估值的提升。在估值不断上升中,人们开始担心,这一切是否能够持续。红杉资本年度演讲递出了“刀子”:去年企业投入500亿美元买的GPU,最终应用收回来30亿美元。暂时无法盈利的创新,甚至最终无法盈利的创新,算是一次泡沫吗?在创新最终盈利之前,市场必然需要迎来一次泡沫吗?这一切取决于我们是否把生成式AI的突破所代表的通用人工智能(AGI),看成是一次真正的技术革命。通用人工智能是技术革命当下,沿着扩展定律发展的GPT模式,冒出了通用人工智能的火花。人们越来越相信作为新一代“通用技术”的AGI正在到来,将广泛影响各行各业。金融科技公司Klarna用大模型技术处理了2/3的客户服务;首个AI软件工程师Devin可以用智能体独立完成相当数量的编码任务,危及码农饭碗;Sora将希望从理解文本信息扩展到理解物理世界。红杉资本估计,在探索通用人工智能的短短一年里,最终用户已经创造了30亿美元的总收入,这还不算云巨头以及Claude这样的大模型服务。要知道,SaaS市场用了近10年才达到这个规模。如此迅猛的速度与规模,让红杉资本确信,AI应用将有万亿级的潜力。如果将采购GPU的500亿美元按5年分摊,每年应该是100亿美元。我们处于佩蕾丝(Carlota
4月9日 下午 9:14
其他

特斯拉就剩下FSD了吗 |笔记

先是苹果放弃电动车,然后是特斯拉放弃Model2,它们有一个共同点,都是All
4月6日 下午 9:22
其他

xz后门黑客潜伏时间线,开源软件供应链安全分水岭 |笔记

Tan”的成为xz压缩库的贡献者,工作勤奋、责任心强,最终获得了提交访问权限和维护者身份。xz是非常基础的压缩组件,开源操作系统Linux的软件基本上都会默认安装。利用这些权限,Jia
4月3日 下午 2:46
其他

千亿美元投资,数百万芯片,星门超级计算机,OpenAI微软豪赌千万亿参数模型

微软正在计划投资1150亿美元、数百万芯片建造数据中心,支持OpenAI持续扩展其AI系统的规模达到千万亿级参数。这个被称为星门
3月30日 上午 11:34
其他

Wintel联盟忙着定义AI PC,但各做了一半

AI”部门。他本人是新部门的CEO,独揽Copilot、Bing和Edge等产品的研发。苏莱曼此前还是DeepMind的联合创始人及首席产品管,经验丰富。纳德拉还找刚从Stable
3月28日 下午 11:47
其他

Sora一旦推出,峰值算力需要75万张H100GPU

Sora何时推出?大约在年底。它非常受欢迎,一旦投入使用,不仅会对影视行业造成冲击,而且会在视频网站、社交媒体、电商平台,以及教育等领域得到广泛应用。它的物理世界模拟器的作用,以及“世界模型”的潜力也非常巨大。问题来了,它需要多大算力?风险投资机构Factorial
3月27日 下午 5:35
其他

Transformer还不够好,它的论文作者决定让大模型自主进化

AI马上就有大动作。21日当日,该公司就发布了EvoLLM系列模型,即一系列采用了进化模型融合技术(Evolutionary
3月25日 下午 9:39
其他

微软掏空Inflection,对GPT-5和OpenAI先留一手 | 笔记

最近微软对Infleciton的动作,把两位联合创始人和公司大部分员工招至麾下,再与Infleciton签署一项模型使用授权协议。微软为此支付的6.5亿美元,用来补偿Infleciton其他主要投资人。Inflection去年6月估值达到了40
3月23日 下午 11:40
其他

重磅报告发布:《从工具到平台AI PC:AI普惠第一终端》

在数据发生的地方,进行生成式AI推理,才能真正实现AI普惠。如果你看下当今市值最大的三家科技巨头,微软、苹果和英伟达,它们有一个共同的特征,都是诞生于个人电脑时代(PC)的初创公司。微处理器和PC,是信息技术革命最核心的通用技术。微软和苹果已经近半个世纪,英伟达刚过而立之年。它们有一个共同的基因,计算公司。个人计算、移动计算、云计算、空间计算,一波又一波,如今它们又同处于AI计算的浪潮之颠。AI计算席卷之处,所有的个人终端设备,都将成为个人AI设备。PC、手机、AR/VR、汽车、可穿戴、AI原生设备。AI
3月21日 下午 2:52
其他

黄仁勋祭出Blackwell,圈出百万亿美元AI新市场,英伟达已占四个席位

黄仁勋的主题演讲结束了。在短短两个小时里,他试图让投资者相信,一个由生成式AI驱动的价值100万亿美元的新行业开始了。英伟达将继续在这片新市场中占据主导地位。黄仁勋站在英伟达GTC大会的舞台上时,像一个摇滚明星那样面对来自世界各地的粉丝。他再次告诉全世界,不仅AI大模型的训练建立在GPU的基座之上,而且AI推理也无法摆脱英伟达的平台。英伟达推出了基于更强大的Blackwell架构的B200芯片及其算力集群,训练下一代大模型更快更省电;NIM将简化大模型部署,无论是在云端还是本地,让更多人用上AI推理;NeMo将注入企业数据,拓展日益枯竭的高质量数据的边界;GR00T尝试模拟物理世界,它是通往AGI有力候选途径,同时也能让具身智能再造日渐脆弱的全球工业制造。Blackwell证明扩展定律依然有效许多人工智能研究人员相信,拥有更多参数和数据的更大模型,可能会解锁新的能力。这就是大模型的扩展定律。英伟达的黄氏定律支撑着大模型的扩展法则持续生效。过去一年发布的最先进的大模型,都是在英伟达上一代Hopper架构上训练的。如今,大模型厂商们即将拥有更强大的Blackwell架构。黄仁勋拿出了B200,这款基于Blackwell架构的GPU体积庞大,由两个独立制造的裸晶(Die)耦合而成,互联速度10Tbps,共2080
3月19日 下午 12:04
其他

英伟达GTC是AI的新起点,还是转折点

Szegedy等。最值得关注的则是Transformer八子。他们将于北京时间3月21日(周四)的2时开始,与黄仁勋一起展开一场50分钟的圆桌讨论。自那篇著名开创性论文《Attention
3月18日 上午 1:00
其他

Sora年内推出,美国大选是个重要考虑因素。OpenAI透露更多细节

,今年全球各地将有40场大选,尤其是美国大选即将正式开打,基本上可以断定的是将由现任总统拜登对决前任总统特朗普。这一对老怨家,将给美国国内政局稳定带来诸多变数。OpenAI首席技术官穆拉蒂(Mira
3月14日 上午 9:31
其他

Devin,在AI推理的奇点上,砸掉码农的饭碗,仅仅是开始。它是怎么做到的

不久前Sora推出时,它自称是物理世界的一个通用模拟器;现在又出现了一个Devin,它自称正在解决AI像人一样推理的问题。而且它说:“通过解决推理问题,我们可以在广泛的领域内解锁新的可能性——代码仅仅是开始。我们希望帮助全世界的人们将想法变为现实。”Devin,世界上第一个AI程序员,已经被放到Cognition
3月13日 下午 10:23
其他

马斯克开源Grok的第一性原因

马斯克周一凌晨在其X社交平台发宣布,xAI将于本周内开源Grok。X的官方账号马上转发,称这是马斯克控告奥特曼等人不开源ChatGPT之后,马上采取的行动。开源,马斯克自己要说到做到马斯克在几天前把OpenAI及奥特曼告上法庭,罪名是对方违背创始协议,把一家非营利、开源、为惠及人而研发通用人工智能(AGI)的机构,变成了一家有营利部门、封闭、为创始人自己小圈子和科技巨头(目前就是微软)赚钱的企业。马斯克共计向OpenAI捐出4000多万美元。OpenAI也公开了四封当年的邮件,强有力地反击了马斯克的指控:
3月11日 下午 8:36
其他

黄仁勋的鱼与熊掌,训练推理都要在英伟达平台

在连涨6个交易日后,周五,英伟达股价在狂热的交易中骤然下跌,从当日涨超5%转为跌超5%,创下半年多来的最大跌幅。将AI视为未来几年内全球股市增长引擎的木头姐凯西·伍德,前一天在股东信中警告,现在的英伟达像极了在1997年到2000年期间,经历股价“抛物线”的思科公司。思科股价的崩溃,很大程度上因为在互联网泡沫时期,下游的互联网企业尚未建立起真正可行的盈利模式;英伟达的“思科时刻”,则在暗示大模型泡沫也将因为那些大模型企业或AI应用企业无法建立可持续的盈利模式而破灭。这种担忧一直存在,越来越明显。英伟达离市值泡沫还有三道防线,很重要的因素就在于它能不能进一步提升推理效率,以及将推理场景从云端扩大到更广阔的边缘与端侧。英伟达CEO黄仁勋肯定认为这一切都没问题。最近,他回到了他的母校美国斯坦福大学,详细谈到英伟达的市场价值定位、通用人工智能的发展、AI算力的增长,以及推理市场的生态问题。以下是黄仁勋对“推理是一个基于安装的问题”的详细解释,并不担心在推理领域遇到竞争。附文字记录问:你可能知道,最近有一些报道说,英伟达将在推理市场面临比在(模型)训练市场更激烈的竞争。但按照你的说法,这两个其实是一个市场。能否评论一下?是否会有独立的训练芯片市场和推理芯片市场,或者说你们会不断地训练并切换到推理,也许用一个芯片就能实现?黄仁勋:今天,当你给人工智能一个提示时,可能是ChatGPT,可能是Copilot,可能是你现在使用的一个服务或平台,比如Midjourney或是Adobe的Firefly,无论你何时提示,它都在做推理。当你这样做的时候,它会为你生成信息。它的背后是什么?100%都是英伟达的GPU。所以在你推理的时候,大多数时候你在使用我们的平台,所以今天世界上百分之百的推理都是通过英伟达进行的。那么,推理是难还是简单呢?很多人为什么选择推理?当你在英伟达系统中看训练的时候,当你盯着它的时候,你会说,这的确太难了,我不会那么做的。我们是一家芯片公司,这看起来完全不像只是芯片干的事。你必须努力去证明一些东西是有效的还是无效的,这是很自然的事情。你投入了20亿美元,然后你意识到这不是很有效——你投入了20亿美元,两年的时间——探索新事物的风险对客户来说太高了。所以很多竞争者倾向于说,我们不喜欢训练,我们喜欢推理。推理是非常困难的。我们来想一下,推理的响应时间必须非常短。但这还是推理中简单的部分,这是计算机科学的部分。推理最难的部分是,推理从业人员的目标是吸引更多用户将软件应用到更大的安装基础上。推理是一个基于安装的问题。这和在iPhone上编写应用程序没什么不同,之所以这么做的原因是iPhone拥有庞大的安装基础,几乎每个人都有一台苹果手机。如果你为iPhone写了一个应用,它会让每个人都受益。就英伟达而言,我们的加速计算平台是唯一一个几乎无处不在的加速竞争平台,因为我们已经在这方面研究了很长时间。如果你写了一个推理应用程序,你把这个模型部署在英伟达架构上,它实际上可以无所不在地运行着,你可以接触到每一个人,你可以使它产生更大的影响。所以推理的问题实际上是安装基础的问题,而这需要巨大的耐心,年复一年的成功以及对架构兼容性的专注等等。
3月10日 下午 6:25
其他

AlphaGo围棋战胜人类8周年,GPT-5在抄它的作业吗 | 笔记

首次战胜人类顶尖棋手之一、韩国九段李世石。在从2016年3月9日到15日,总共五番棋的对决中,阿法狗四胜一负。创造了人工智能发展史上的一个里程碑。OpenAI负责推理研究的科学家布朗(Noam
3月10日 下午 6:25
其他

Claude3发布,AGI从火花到火苗,就等GPT-5 | 笔记

Anthropic推出的大模型Claude3,终结了GPT-4整整一年的统治。成绩单Anthropic晒出了一张自己的成绩单,综合能力上全面超越,其中在数学、多语种数学、以及编程能力中,高出GPT-4一个分数档次。但是硅谷AI大神卡帕西(Andrej
3月5日 下午 1:47
其他

“这就是OpenAI的故事” | 马斯克诉奥特曼之二

OpenAI注定将成为我们这个时代最有故事的公司。去年十一月份的董事会政变事件平息才三个月,新的一幕又开始了。这一次主角更加劲爆,马斯克直接上场。他的律师团队以万字檄文,将奥特曼和OpenAI一起告上法庭。微软虽然没有列为被告,但这一幕大戏中扮演了幕后的最大受益者。里面有生成式AI简史,有两个男人之间的起承转合,有大哥的做局;有排比修辞,有象征比喻。洋洋洒洒,金句闪烁。有专业律师称之为:这份文件是公关烟火、有趣的阴谋,以及对AGI哲学的思考。(见下一篇文章《为什么输定了
3月3日 下午 3:33
其他

为什么输定了 | 马斯克诉奥特曼之三

没有违约。四,那么章程中的下一句话呢,OpenAI“将适时寻求将技术开源以造福公众。”Psst
3月3日 下午 3:33
其他

马斯克状告奥特曼五宗罪 | 之一

马斯克昨天向旧金山高等法院提起诉讼,被告是OpenAI联合创始人及CEO奥特曼、总裁布洛克曼,以及OpenAI及其所属盈利公司。马斯克在诉状中列举了奥特曼等被告违反OpenAI创办协议等五宗罪。2015年,OpenAI成立时,联合发起人为
3月1日 下午 11:59
其他

苹果做出了正确的决定|笔记

Pro,本质上还是人工智能。苹果在AI时代的机会,是在终端设备的AI计算。它是iPhone、Mac、iPad、Watch、Vision
2月29日 上午 12:58
其他

GPU的地缘战略性,及英伟达的业务脆弱性 | 专题

英伟达股票市值,一度超过了2万亿美元,正在逼近世界最大石油和天然气公司沙特阿美的市值。从目前全球半导体市场来看,其规模约为油气市场的十分之一,但是其重要性正在技术/产业革命的坐标上显示出来,成为“地球上最重要的公司”。英伟达的市值预计将很快超过沙特阿美,也显示出英伟达CEO黄仁勋所说的人工智能的应用正处于“临界点”上。作为全球市值最大的半导体公司,英伟达研发生产的GPU,在高端AI加速芯片中占据了垄断地位。一个国家的AI算力基础设施建立在先进GPU之上,也决定了其人工智能技术和产业的发展水平;而获取和保持GPU技术的领先性,成为短期内国家之间科技竞争的焦点。在“芯片战”中,几乎主要的禁运和限制措施,都是围绕着英伟达和GPU制定的。各主权国家对于人工智能风险及战略重要性日益关注,正在针对如何应用人工智能,迅速建立起一套监管和审查机制。全球几乎所有的大国,都在密切地关注着英伟达。黄仁勋也清楚地意识到了这一点。他主张每个国家都需要“主权AI”,每个国家都应该拥有其数据,用来产生智能。在一个大国竞争、地缘冲突、市场脱钩的世界里,这家引领新一轮技术革命的公司,不可避免地具备了经济性与安全性,也同时具备了战略性与脆弱性。英伟达这家公司在依然具有巨大的成长空间,但是在这样一个全球科技与安全的竞争时代,黄仁勋也深知其脆弱性的一面。在2024年的财报中,黄仁勋及英伟达管理层花了很大的篇幅,对面临的风险进很了深入的分析。我们在这里进行编译和解读(蓝色字体)。如下。(GH200
2月24日 下午 7:53
其他

谷歌推出开源模型Gemma,与OpenAI和Meta卷成团儿

哈萨比斯提出,将会进入产品和技术提前发布的节奏。这样,两家之间在开发管线安排与产品发布时机之间的安排,将会进入一个互相比照穿插的阶段。谷歌与微软/OpenAI的竞争,节奏正在带起。
2月23日 下午 8:09
其他

英伟达离市值泡沫还有三道防线

英伟达再次带来超出预期的财报,2024财年营收609亿美元,相较上一财年的270亿美元倍增还多,尤其是第四季财报,所有的指标都超预期。接下去的一年,它还能不能再次兑现营收翻番的预期?这得看它能不能进一步降低推理成本,不仅自己大口吃肉,开发者也要能够喝上汤。生成式人工智能正处于一个“临界点”,全球各大公司、行业及国家的需求,均呈现爆炸式增长。数据中心是英伟达的核心业务,占营收80%以上,人工智能又贡献了数据中心的40%。在财报电话会上,黄仁勋豪言,生成式人工智能开启了一个全新的投资周期,下一个万亿美元的人工智能生成工厂基础设施,预示着一个全新应用领域的开端。但生成式人工智能的应用仍处于“原始汤”的状态。美国红杉资本今年开春的调门小了不少,认为人工智能驱动的应用,将与SaaS等传统应用很不同。那些利用AI快速推出简单产品的团队,将在2024年遭遇重置。Transformers八子之一的Jakub
2月22日 下午 8:52
其他

Groq露峥嵘,可能同时挑战英伟达和谷歌 | 笔记

这几天,英伟达的市值刚刚超过谷歌,然后又被谷歌反超。就在英伟达即将发布季报之际(2月21日),一家名叫Groq的初创芯片及模型企业,突然卷起了一股波澜,被人惊呼要颠覆英伟达。怎么回事?让我们先打开这家公司的网站。出现了一个像谷歌搜索一样的主页面,甚至比谷歌更简洁。敲入一个问题,它以闪电般的速度,给出了一个完整的答案。每秒钟278个token!它号称是世界最快大模型,比GPT-4快18倍,测试中最快达到破纪录的每秒吞吐500
2月21日 下午 9:13
其他

从AI到股市,龙年开始了

一个春节的功夫,美国的科技巨头和独角兽们就将AI前沿推向了更远处。在美国AI科技公司的引领下,标普指数超过了5000点,创出了历史新高。英伟达市值超过谷歌,仅次于微软和苹果。尤其是OpenAI和谷歌DeepMind的巅峰对决,正在把大模型带入新一代,在国内再度引发一轮危言:我们和他们的差距是不是拉大了。过去的这个松弛的假期,8日,奥特曼7万亿美元融资计划曝光;9日,谷歌发布Gemini
2月19日 上午 12:20
其他

Sora是怎么训练出来的 | 笔记

一分钟长的文生视频大模型Sora,如此逼真。OpenAI再次震惊了世界。一分钟长的视频,是更漫长的征程的开端。OpenAI称他们所做的事情,是构建一个“物理世界的通用模拟器”。Sora生成的电影预告片OpenAI网站上的技术报告,主要提供了训练Sora的方法,以及对其能力和局限性的定性评估。技术报告的13位作者中,有4位华人。报告也明确地说,不提供模型和实现细节。尤其是公众和监管者最关注的数据来源。但是,这篇报告所列举的32篇参考论文,已经提供了所有的方法和技术。OpenAI用一句话概括:“我们利用了一种在视频和图像潜码的时空块上操作的transformer架构”。具体点说就是:这帮大牛训练了一个网络,用于降低视觉数据的维度。许多专家认为其视频来源是Youtube。这个网络以原始视频为输入,输出一个在时间和空间上都被压缩的潜在表示。Sora在这个压缩的潜在空间内接受训练,随后也在此空间内生成视频。他们还训练了一个相应的解码器模型,将生成的潜码映射回像素空间。应该掌握四个关键词:潜码(latent
2月17日 下午 2:08
其他

奥特曼的融资魔法 | 笔记

构建人工智能系统的新方法将会被发明出来,英伟达也要灵活适应。未来的智能将到处应用,将是分散化、民主化和个人化的,正如计算机演变的历史一样。这一笔融资的魔幻金额,看来是奥特曼在施展融资魔法。
2月14日 下午 3:02
其他

Gemini Ultra 除夕发布了,不等于说谷歌可以过年了 | 笔记

终于,谷歌与AI相关的无数产品,拥有了一个共同的名字:Gemini。它可能结束了谷歌许多部门都在搞AI,整个公司却不知如何与微软/OpenAI竞争的局面。谷歌赶着中国龙年的除夕,发布了号称唯一胜过人类专家水平的大模型Gemini
2月9日 下午 6:06
其他

巨头裁员,把人手转向不需要多少人手的AI

美国聚集人工智能(AI)的五大科技巨头,微软、苹果、Alphabet、亚马逊、Meta,2024年首度发布财报。投资者和公众开始在意,它们向AI砸了那么多钱,赚了多少钱;如果继续砸钱,是不是会继续裁员。美国经济表现仍然强劲,从最近一年的股价来看,硅谷似乎也在享受生成式AI带来的繁荣,但科技巨头和大厂,为什么在不停地裁员,一轮又一轮?硅谷面临着一个严酷的新现实是:裁员正是这些巨头受到资本市场认可的原因。云赚钱,云“洗钱”大模型先让云业务先赚钱了。微软最近一个季度的智能云业务当季实现收入259亿美元,同比增长20%,Azure与其他云营收增长了30%,其中AI贡献了6个百分点。谷歌云增长了26%,达到了92亿美元,并且首次实现全年盈利。亚马逊AWS部门的销售额达到242亿美元,同比增长13%,预期未来AWS的全栈式生成式AI服务,将带来数百亿美元的收入,相当于再造一个AWS。根据
2月6日 上午 12:02
其他

苹果Vision Pro,值得买吗

这个名称,想说明一切。苹果强调了两个最基本的概念,一个是计算,一个是空间。在它们之间,并不需要多余一层概念,而直接就是产品:Vision
1月21日 下午 1:45
其他

OpenAI回应《纽约时报》控告:训练数据是合理使用,提示有故意操纵

我们的目标是开发AI工具,赋予人们以往难以企及的解决问题的能力。全球各地的人们已经在使用我们的技术来改善他们的日常生活。如今,数百万开发者和超过92%的财富500强公司都在使用我们的产品。尽管我们不同意《纽约时报》诉讼中的指控,但我们认为这是一个机会,以澄清我们的业务、意图以及我们构建技术方式。我们的立场可以概括为以下四点,并在下文中进行详细阐述:1.我们与新闻机构合作,并创造新机会2.训练是合理使用,但我们提供退出选项,因为这是正确的事情3
1月9日 上午 9:21
其他

斯坦福家政机器人火了!又翻车了!多数是真人操控编排的

Aloha项目网址是:https://mobile-aloha.github.io/,有兴趣的朋友可以去看一看。
1月7日 下午 5:31
其他

一个三岁小孩,真的不需要多少数据,智力就胜过大模型吗?

我在机器学习(ML)的讨论中,经常对一个看法心怀小小的不满:人们声称人类在学习方面比我们目前训练的模型更有效率,这个论点通常是这样的:“我对我的三岁小孩所拥有的知识感到震惊。他比大语言模型更聪明,尽管接受的训练数据集非常小。显然,我们的模型缺少一些重要的东西,因为它们不能像我的三岁小孩那样学习!”但是,一个三岁孩子的训练数据集真的比典型的语言模型小吗?出于好玩,我想在餐巾纸上计算一下,把数字简化到我们实际能推演的水平。首先是LLM(大型语言模型)本身——我们用Llama
1月6日 下午 9:07
其他

CES 2024前瞻:端起AI

2023年,人人都在谈论人工智能,它们在云端;2024年,消费电子厂商希望大家相信,人工智能可以装进电脑、手机与汽车里,甚至以往从来没见过的新的硬件里。超过4000家展商,包括1200多家初创企业,将会在1月9日至12日参加拉斯维加斯的CES
1月3日 下午 10:05