黄仁勋自述坚持61年成就英伟达;神秘gpt2-chatbot模型引爆全网|钛媒体AGI
今天。通用人工智能(AGI)领域又公布了一系列重磅消息。
4月30日消息,近日,美国哥伦比亚广播公司(CBS)《60分钟》节目发布比尔·惠特克(Bill Whitaker)与英伟达CEO黄仁勋(Jensen Huang)的对话交流。
黄仁勋表示,他在15岁时,曾在美国连锁快餐店Denny’s餐厅做洗碗工,在这里萌生了创业年头,如今成长为美国科技巨头CEO。“没有什么特别的,只是61年中每一天的努力工作。想做出卓越的事情,应该都不容易。”
与此同时,今天凌晨,一款神秘的“gpt2-chatbot”模型引爆全网,宣称能力超越一众开源模型,被认为是GPT-5,几乎所有人都在谈论它,服务器都被挤爆了。
OpenAI CEO奥尔特曼(Sam Altman)看热闹不嫌事儿大,直接发帖表示:我确实对gpt2情有独钟。
国内 AI 领域也有重大消息。五一休假之前,月之暗面今早突然推出新功能Kimi+智能助手,用户可以通过Kimi+获取个性化的购物推荐,了解产品信息,并获取相关资讯。这一新功能有望提升用户的购物体验,使AI成为更加全面的生活助手。
黄仁勋:AI 取代不了人类,我坚持61年才成就英伟达
迄今为止,全球仅有4家公司市值超过了两万亿美元:微软、苹果、谷歌母公司Alphabet,以及GPU(图形处理器)芯片龙头英伟达。
实现市值从1万亿到2万亿美元这一里程碑式的跳跃,英伟达仅用了8个月时间,而另外三家科技巨头均耗费了至少两年。
黄仁勋近日接受《60分钟》节目专访时谈到,今年3月英伟达GTC大会演讲中,他其实非常紧张。
“我本质上是一名工程师,而不是演员。每当我走上台前,感受到那股狂热的氛围,我都几乎要喘不过气来。说实话,我可能是有史以来最胆小的一个人。每次上台,我都还是会感到害怕。有时候,我甚至希望这一切能快点结束!”黄仁勋说。
Blackwell的推出被视为未来新一轮工业革命的核心引擎。黄仁勋称,Blackwell每秒能进行千万亿次的计算,这是一个令人难以置信的数字。在这样强大的性能下,他希望Blackwell能做出一些超出期待的事情,这才是英伟达不断追求创新的真正意义所在。
黄仁勋还向CBS介绍英伟达的AI技术。“一旦它(GPU)学会了计算天气,其速度将比超级计算机快出3000倍,而能耗却能降低1000倍。”黄仁勋介绍道。
黄仁勋坦言:“在药物发现、材料设计等领域,AI正展现出巨大的潜力。我们需要AI来帮助我们探索那些我们无法独自涉足的宇宙角落。”
随着AI行业的发展,未来 AI 机器人大规模应用后是否会抢走人类的工作?对于这一问题,黄仁勋似乎并不担忧。
黄仁勋表示,有些工作中,人类仍然扮演着不可或缺的角色。
“人工智能会帮助企业更具生产力,收入会随之增加,我还从来没见过一家公司在收入增加时不雇用更多的人。人们还是会希望工作过程有人类的参与,因为人类有良好的判断能力,在某些特定状况下,机器人是无法理解的。”
在采访最后,黄仁勋回忆起创业之初的经历。
谁能想到,这样一家全球科技龙头企业的创立想法,竟萌生于圣何塞州的一家美国连锁快餐店Denny’s。巧合的是,黄仁勋在15岁时,就曾在一家Denny’s餐厅做洗碗工。
平淡的生活始终没有磨去黄仁勋对于技术理想追求的热情。1993年,已婚并有孩子的黄仁勋和他的两个朋友——英伟达联合创始人Chris Malachowsky和Curtis Priem,设想了一种处理视频游戏图形的全新方法。
“当时我们就坐在餐厅的那个位置,三人商量后决定创办这家公司。但坦白来说,当时我不清楚该怎么做”,黄仁勋说。
不出意外,创业并非一帆风顺,最初的尝试甚至让公司在1996年就陷入了破产危机。好在两位合伙人和一众天才工程师后来找到了正确的方式,从视频游戏中汲取了灵感,并研发制造出突破性的GPU,让整个行业开始了变革。
成立8年后,英伟达被纳入标普500指数。但黄仁勋的野心不止于此,他致力于开发革命性的、由GPU驱动的超级计算机的软硬件,使芯片能力远远超出视频游戏领域。在当时的华尔街,对于早期开发者来说,这是一个冒险的赌注,也是一个启示。
现在的英伟达就是大家看到的那样,非常成功。当记者提问到,这一切的成功该归因于运气还是远见时,黄仁勋说,“是基于远见的运气。”
“我们在当时发明了技术(软硬件技术),而该技术在后来工程师们研究机器深度学习时,发现并证明非常适合人工智能的研发。”
从洗碗工到科技巨头CEO,黄仁勋最后总结表示,“没有什么特别的,只是61年中每一天的努力工作。想做出卓越的事情,应该都不容易。如果你想要实现非凡的成就,就不能轻易妥协。这条路并不容易。”
神秘gpt2-chatbot模型曝光、能力太强被疑GPT-4.5,引爆全网
4月30日,今晨在大模型基准对比网站( http://chat.lmsys.org)上,一种神秘、全新 AI 模型"gpt2-chatbot"突然出现,能力很强,但是他自我描述为GPT-4,引起广泛关注。
网友们猜测,它是否是OpenAI即将发布的GPT-4.5,或者是一种全新的AI系统。
初步体验显示,gpt2-chatbot的能力水平大约在GPT-4左右,语音输出与GPT-4有些类似但又略有不同。从一些截图来看,它在规划和列出待办事项方面似乎比GPT-4做得更好,会主动列出潜在的网站和搜索查询词。不过,也有人认为这种增强只是通过针对性微调GPT-4就能实现。
有人声称,已获取了gpt2-chatbot的系统提示词,但消息真实性仍有待验证。
此外,一些用户发现,gpt2-chatbot在某些特殊标记方面与其他OpenAI模型存在相同弱点,并且似乎使用了与OpenAI其他模型相同的词汇切分方式,从中推测它可能出自OpenAI之手。而更令人振奋的是,这个模型展现出突破长期遵循的约束条件的能力。
有人猜测,gpt2-chatbot可能是OpenAI的开源模型的一个预览版本,是四年前的gpt-2微调版本,不过也有人认为这是下一个版本的GPT模型,或是公开测试版的GPT-4.5或GPT-5,目前看来较为可能的猜测是,它其实是经过大规模数据集训练的OpenAI 2019年GPT-2模型。
有网友组织了更详细的测试,有如下发现:
它使用OpenAI的tokenizer,对OpenAI使用的特殊token有反应,且对Claude/Llama/Gemini使用的特殊token没有影响。
当咨询紧急情况/法律相关问题时,它会给出OpenAI的联系方式。
针对OpenAI模型的提示词注入攻击有效,且它从未声称自己来自OpenAI之外的组织。
基于以上种种信息,不少人猜测它就是匿名发布的GPT-4.5,或GPT-4原始版本经过不同的对齐训练。
就在上午,奥尔特曼发推文确认,这是一个名为GPT2的一个模型:我确实对 GPT2 情有独钟,但他没有明确说明这个模型与OpenAI的关系,以及是否为下一代模型产品。
这样一下子,是OpenAI匿名发布新模型炒作的可能性更大了一些。
试玩地址:https://chat.lmsys.org/;https://rentry.org/gpt2
Kimi上新,Plus让智能助手增强生产力属性
今早,月之暗面突然推出新功能Kimi+智能助手,引发关注。
具体来说,用户可以通过Kimi网页版打开就能使用kimi+功能,平台将Kimi+集成在了左侧边栏,原会话模式、个人设置不变,新增回到首页、Kimi+、我的智能体等icon(图标)。
Kimi+,也就是智能体(AI Agent)。在红杉AI Ascent 2024活动上,吴恩达博士提出“基于GPT-3.5构建的智能体工作流在应用中要比GPT-4好”的重要观点,可见智能体的重要性。
简单来说,Kimi+就是Kimi在各个平行宇宙的分身,在各个领域都拥有Kimi的本领,帮你“打怪升职”。
而用户使用Kimi+,可获取个性化的购物推荐,了解产品信息,并获取相关资讯。这一新功能有望提升用户的购物体验,使AI成为更加全面的生活助手。
截至发稿前,Kimi+首批上新了23个智能体,分别是官方推荐、办公提效、辅助写作、社交娱乐、生活实用4个领域。
当前,Kimi+只支持网页版,APP和小程序暂不支持。即使在APP和小程序上,通过历史会话继续提问,也无法召唤出Kimi+。看来想要APP和小程序体验Kimi+,还得要等待版本更新。
试用体验:https://kimi.moonshot.cn/kimiplus-square
Med-Gemini:基于Google Gemini的多模态医学大模型,可理解手术视频
今晨,Google发表了一篇论文详细介绍了其Med-Gemini多模态医学大模型。
该模型不仅具有多模态能力和长文本处理功能,还能够处理医学图像、手术视频、基因组学、超长健康记录、心电图(ECG)等多模态数据的对话。可以处理和分析手术视频,识别手术过程中的关键步骤和事件。Med-Gemini包含五个不同版本:Med-Gemini 1.0;Med-Gemini 1.5;Med-Gemini-M 1.0;Med-Gemini-L 1.0;Med-Gemini-S 1.0
论文显示,模型在10个测试中达到了新的SoTA性能。其中,在医疗问答、总结和文件起草等多种模式中都表现出色,超过了 GPT-4 模型的表现;而在模拟美国医学执照考试(USMLE)风格的问题解答中,Med-Gemini显示了91.1%的准确率,这是该任务的新高。同时,在包括新英格兰医学杂志(NEJM)的图像挑战在内的7个多模态基准测试中,Med-Gemini的平均性能超过了GPT-4V,平均相对提升了44.5%。
ChatGPT 记忆功能全量上线
今晨,OpenAI在X发帖宣布,“记忆”功能向ChatGPT Plus用户全面开放。
现在,ChatGPT能记住你和GPT互动的所有内容,能够将其学到的东西在聊天之间保留下来,使其能够提供更相关的响应。随着你与ChatGPT的互动,它将通过记住对话中的细节和偏好而变得更有帮助。而你可以控制ChatGPT的内存、可以重置它,删除特定的或所有记忆,或在设置中关闭此功能。
而如果你想进行一次没有记忆的对话,可使用临时聊天功能。
但是,“记忆”功能目前尚未在欧洲和韩国推出。未来,“记忆”功能也将在未来扩展到团队、企业以及即将推出的GPTs版本中。
“记忆”功能不仅能够记忆用户的明确指示,还能在对话中自动捕捉细节来提升个性化服务,并随着用户使用ChatGPT的频率增加而变得更加精准,让用户将逐渐感受到其带来的便利和效率。以下是“记忆”功能的几个实际应用示例:
会议记录偏好:如果您告知ChatGPT您喜欢会议记录中包含头条、项目符号和行动项的总结,ChatGPT就会记住这点,在未来的会议记录中按照你的喜好来总结。
个性化营销创意:一旦您告诉ChatGPT您拥有一家社区咖啡店,那么当你需要设计一条庆祝新店开业的社交媒体帖子时,ChatGPT就会给你提供更适合你的创意。
生日贺卡定制:如果您提到自己有一个喜欢水母的幼儿,当您请求ChatGPT帮助创建生日卡片时,它可能会建议一个戴着派对帽子的水母设计。
教学计划辅助:如果您是一名幼儿园老师,喜欢50分钟的课程加上后续活动,ChatGPT会在帮助您创建教学计划时考虑到这些偏好。
机器人全面进化:会跳舞、会亲嘴、会变形
日前,一段关于机器人变形的相关视频引发关注。
Robosen线上发布了一款 Megatron的40 周年限量版变形金刚机器人,可以自动变形,支持自动变身,动作娴熟,逼真,非常酷。
除了Robosen之外,波士顿动力今晨也发布了一段新视频,展现开始给机器狗装皮肤,并且完成跳舞、亲嘴等动作,非常像人类跳舞。
实际上,当前人形机器人产业火热,无论是国内还是国外,“具身智能”和人形机器人都被认为是下一个ChatGPT时刻。
行业普遍认为,具身智能是实现AGI的必经之路,而人形机器人是具身智能最适合的载体。
在中关村论坛上,银河通用机器人创始人、智源具身智能研究中心负责人王鹤认为,AI大模型更像是机器从互联网上“读万卷书”,而具身智能赋予了智能体身体,和物理世界交互、从中学习的能力,从而“行万里路”。
对于人形机器人落地,智元机器人联合创始人、上海人工智能研究院院长宋海涛认为,未来3-5年都是人形机器人向产业渗透、寻找场景的时期,5-8年才会迎来大规模商用。
小米机器人团队负责人许多称,短期内限制人形机器人落地的是硬件,移动、操作还无法实现高精度,这也导致了收集的数据可用性差。“人形机器人上肢抓取精度还在10厘米级别,距离工业机器人0.01毫米的误差精度尚远,收集了100条数据可能就几条能用来训练,数据的闭环或许比我们想象的慢。”
小红书自研通用大模型“小地瓜”将上线
(本文首发钛媒体App,作者|任颖文、林志佳,编辑|林志佳)