今日荐文
OpenAI狂飙突进!仅12个例子就能打造专属AI专家,核心技术竟来自字节?OpenAI深夜炸场!一口气放出o1模型全家桶,月费200美元的ChatGPT Pro被狂槽:Altman只想躺在印钞机上数钱
12 月 7 日晚,阿里合伙人樊路远在公司内网发布了道歉声明。他表示,因为昨天是内部交流,本意是想活跃气氛,但言语上没有把握住尺度,导致伤害了员工的感情,对此他会自罚三个月工资,并进行反省。
12 月 6 日,阿里合伙人,阿里巴巴大文娱集团董事长兼首席执行官、阿里巴巴影业集团董事局主席兼 CEO 樊路远在广州内部会议上的发言“火药味”十足,他重点提及灵犀团队缺乏阿里精神和阿里文化等问题,以及该团队在未来的战略目标,在这次内部演讲中,樊路远强调“阿里血脉”论,批评灵犀团队文化。但此番“爹味”发言也引发争议。
樊路远在 2007 年加入支付宝,历任蚂蚁金服集团支付宝事业群总裁及财富事业群总裁等职位,并在 2010 年带领团队首创快捷支付,2013 年推出互联网金融产品余额宝。他在 2017 年 8 月加入阿里文娱,担任阿里影业董事长兼 CEO,后转任阿里大文娱事业群总裁,兼任优酷总裁;2018 年 11 月,正式掌舵阿里大文娱;2023 年 3 月,任大文娱集团 CEO。2024 年 1 月起,他代表阿里集团分管灵犀互娱。
以下是内部道歉原文:
老樊给大家道歉
对不起,大周末给大家添堵了。昨天灵犀互娱五年的讲话,因为是内部交流,就想着跟大家随意点儿,活跃下气氛。结果说着说着我自己说开了,尺度没收住。很多用词比喻确实讲得不合适。我给灵犀互娱的同学们道歉,对不起。
我性格比较直接,大大咧咧,也爱开玩笑,尺度有时还把握不好,这么多年因此没少挨批评。以前有人给我起了一个外号叫“大炮”,我还理解成敢说敢做透明直接,但我今天才意识到这个绰号的真实含义,观点鲜明,不绕圈子固然值得鼓励,但不顾及别人感受,缺少共情心,口不择言,则会炸了膛,炸了锅。
现在回过头看,大家骂得都对。我只顾逞口头快,没有顾及到大家的感受,不小心就会伤害了大家的感情。再次向大家道歉!我会自罚三月工资,专项加入到灵犀互娱同学的团建基金中。未来,也请大家监督我,帮助我,老樊必须改变。
其实在昨天我真正想分享的是阿里的精神,拼搏,创新,坚持,感恩!现在看来可能还起了反效果。但我依然坚定地坚持这种精神不能丢。我也真心相信,灵犀互娱一定可以成为行业领先公司。我希望与大家一起不断创变、破旧立新,不破楼兰终不还!
此前的近一个月里,月之暗面创始人杨植麟,以及其联创兼 CTO 张宇韬被循环智能时期投资人提起仲裁一事,已经被讨论已久。但月之暗面一方始终噤声,对外表示一切以法律结果为准。
而在 12 月 5 日,金沙江创投董事总经理朱啸虎的朋友圈发文,彻底将此案推向舆论高点。
朱啸虎的控诉主要集中在以下几点:
此前舆论热议的“同意豁免”争端,确实存在——拿到循环智能几个投资方的同意豁免书之前,杨植麟的新公司就已开始创立,并且融资。
但争端远远不止此项。此次发声的矛头,指向了另一位关键角色——前金沙江合伙人张予彤,以及其在月之暗面与金沙江创投之间尚未厘清的关系。
“张予桐(彤)向基金合伙人,其他循环智能投资人 / 股东故意隐瞒并欺骗自己在新拆分的公司有巨大的免费股份(900 万股,相当于初始股份的 14%,远超孵化月之暗面 2 年的母公司循环智能拿到的 9.5%)的事实,违反了基金合伙人对 LP 的受托责任。”朱啸虎的朋友圈原文表示。
“受托责任”一项,是朱啸虎此次控诉最为关键的一点。简单而言,即是张予彤在尚未正式离职金沙江创投之时,即用个人身份 / 亲属身份,获得新拆分的公司股份,且并没有让金沙江创投知情。
12 月 6 日晚,月之暗面创始人杨植麟正式发布个人回应,关键点如下:
离开前公司“循环智能”重新创业,杨植麟获得了每一位董事的签字同意和所有必要手续;
循环智能的股东对新公司的看法并不一致,循环智能的数位老股东没有参与,但决定成立月之暗面时,该走的流程都谈妥了,包括:无偿给予了老公司循环智能一定比例的股份;豁免杨植麟和张宇韬(前循环智能联创)的全职义务;约定了两家公司的合作关系;
授予张予彤股份,是对其作为联合创始人的支付对价,此项决策与他的重新创业、以及老股东不投月之暗面的决策,均互相独立。
杨植麟发布声明后约一小时后,金沙江创投董事总经理朱啸虎再度于朋友圈回应:
第一,书面沟通是不够的,需要严格的按照公司章程,股东决议(每一轮股东多数的签字);董事决议有利益冲突的董事必须明示并申请回避,不能隐瞒欺骗。第二,利益冲突必须第一天就披露,900 万股是第一天就给的,并不是后面陆续给的,而且不是简单的没有披露,而是设计了很多方式(代持,投很少的钱来欲盖弥彰)来隐瞒欺骗。虽然是月之暗面,但希望所有的行为都能在太阳底下,堂堂正正。
以下为杨植麟回应全文:
最近围绕我和循环智能早期投资人之间的事情有一些讨论,我想从我的角度把一些事实和想法还原出来。
22年底是一个历史的拐点。AGI技术的几个重要因素同时被满足:(1)互联网发展20余年积累大量高质量数据(2)超大浮点数运算的算力基础设施变得成熟(3)Transformer架构可以被有效地规模化训练。我决定创办月之暗面,希望探究有效的产生智能的方法,探索智能的上限。我跟登月伙伴们都十分相信这个技术趋势,认为这是接下来10年甚至此生唯一值得做的事情。从大量实验中获取世界的真相并继续迭代,是我们重要的快乐来源。
循环的股东对新公司的看法并不一致。红杉和真格选择主导投资新公司,金沙江、博裕、万物、靖亚、华山没有参与。朱啸虎先生指出了大模型创业公司面临的挑战,我虽然不认同结论,但我认为一些挑战客观存在,是非常有价值的提醒。我理解并尊重没有参投的这些机构的决策。
2023年2月,我跟循环CEO陈麒聪达成了一致,月之暗面单独成立公司,循环无偿获得月之暗面一定比例的股份,沟通过程有书面记录。当时恰巧碰上硅谷银行倒闭事件,循环大部分现金存在硅谷银行,我帮忙对接了三家愿意在公司第一轮融资时就购买老股的机构,并同意循环出售数百万美元月之暗面老股来缓解现金流危机。这个过程循环的股东都知情。同时,我以0元的价格放弃了我在循环一半的股份,由麒聪安排给在循环继续奋斗的兄弟。
循环董事会决议通过了月之暗面成立新公司的安排,循环的每一位董事(包括循环团队董事和外部投资机构委派的董事)均签字同意。循环和月之暗面签订了协议,内容包括循环的占股安排,豁免我和宇韬的全职义务,约定了两家公司的合作关系,等等。根据循环交易文件的约定,我完成了离开循环重新创业的所有必要手续。
大模型创业不光需要技术能力,也需要业务、战略、融资能力,这些方面我的经验不多,所以需要在团队上做补充。在我的朋友圈中,张予彤是最合适的人,她既对业务和战略有深刻的洞察,也有丰富的投融资经验,更重要的是,她愿意走出舒适区而选择冒险、选择相信和支持我。所以我邀请予彤作为联合创始人加入月之暗面,股份按照多年兑现(vesting),兑现的条件是持续性为公司提供多年的服务及产出业绩。
迄今,予彤在业务、战略以及多场融资战役中对公司做出了重要贡献。月之暗面授予予彤股份的本质,是其作为月之暗面联合创始人对公司后续多年持续工作的对价,跟循环及其股东对于我离开循环重新创业的决策是独立的,跟部分股东没有投资月之暗面的决策也是独立的。
我过去、现在、以后都感谢循环的老朋友们。麒聪和发哥是我在创业路上最初的战友和老师。所有循环的投资人、月之暗面的投资人支持了我们的创业梦想,对此我充满感激。对于循环的五家投资机构,我在感恩的同时,也相信分歧会有合理的解决方式。
在我们讨论这个问题的时候,大洋彼岸的团队正在发布新的AI产品。对我来说,最重要的是,和团队继续全力以赴把Kimi的技术和产品做好。今天Kimi作为一个AI产品,受到很多用户的喜欢,但还处于AGI之路的初级阶段,还有很大的智能提升空间,这也是我们前行的动力。我们有充分的信心持续通过规模化来产出更高级的智能。在强化学习时代,因为技术范式的变化,模型的迭代会更加快速,我们会夜以继日地战斗。See you on the dark side of the moon.
在比特币价格终于突破 10 万美元 / 枚前夕,美图公司公告,截至 2024 年 12 月 4 日,已售出所持有的全部加密货币,出售获利约 7963 万美元,约合 5.71 亿元人民币。
据美图 12 月 4 日晚间公告,公司自 2024 年 11 月开始在市场上出售旗下加密货币;截至 12 月 4 日,累计已售出 3.1 万枚以太币和 940 枚比特币,未来将专注核心业务发展。具体来看,公告显示,美图公司自 2024 年 11 月开始在市场上出售其已购买加密货币,截至 12 月 4 日,已售出所持有的全部已购买加密货币(合共约 31000 单位以太坊和 940 单位比特币,总现金对价分别约为 1 亿美元及 0.8 亿美元。
同时,董事会建议将其出售获利净额的约 80% 用作支付特别股息,即每股派付 0.109 港元的特別现金股息;剩余净额则作为一般营运资金,以扩展集团以付费订阅制为主的影像与设计产品业务。
据悉,美图公司这些加密货币于 2021 年 3 月和 4 月购买,当时共花了 1 亿美元。
据媒体报道,苹果正与百度合作,计划为中国市场销售的 iPhone 加上人工智能功能,双方计划于 2025 年在中国推出“苹果智能”功能。但合作过程中却遇到了一些障碍,尤其是在数据隐私和使用问题上存在分歧。
知情人士透露,苹果与百度的工程师正在共同优化百度的大模型,以更好地满足 iPhone 用户的需求,但该模型在理解提示词和对 iPhone 用户提出的常见场景做出准确回应方面遇到了困难。
此外,双方在是否应使用 iPhone 用户数据来训练和改进模型的问题上产生了分歧。百度希望保存并分析从进行人工智能相关查询的 iPhone 用户那里获取的数据,而苹果的隐私政策严格禁止收集此类数据。
据报道,苹果为使用百度人工智能模型支付了高达 100 亿美元的费用,并同意承担重新训练和微调模型以满足其要求的计算成本。
对于百度而言,其面临的最大挑战在于如何为 iPhone 用户可能提出的问题提供更加相关的回答。例如,当 iPhone 用户请求“苹果智能”推荐一家餐厅时,百度的模型可能会基于训练数据给出答案。苹果期望的则是根据用户的 iPhone 使用情况,如已下载的应用程序、消息记录及其他活动,来提供更加个性化的答案。
另外,苹果公司 CEO Tim Cook 近期在接受采访时,针对外界关于苹果可能将 AI 功能作为付费服务提供的说法进行了回应。Cook 明确表示,苹果从未考虑过对 Apple Intelligence 进行收费。他认为,AI 是智能设备的一项基础功能,就像多点触控一样,是设备不可或缺的一部分。Cook 的这一表态平息了外界对于苹果 AI 服务可能收费的猜测。
12 月 4 日上午,华为 Mate70 系列和 Mate70 RS 非凡大师正式线下开售。Mate70 系列在线上官网开售后迅速售罄,而在线下深圳万象天地华为旗舰店各机型都没有现货,需要预约登记购机,收到相应短信才能在线下门店提货。此外,华为终端 BG CEO 何刚也现身该旗舰店,协助首批预约的用户领取新机。
对于 Mate70 系列各个版本的线下分货情况,有多位渠道商透露,“与去年 Mate60 系列中,华为核心渠道商主力推 Pro 和 Pro+ 不同,目前华为对线下渠道商的分货以 Mate70 标准版为主,Pro 版本分货比较少。”
需要指出的是,Mate70 系列并非发售直接搭载纯血鸿蒙系统。华为常务董事、终端 BG 董事长、智能汽车解决方案 BU 董事长余承东曾在发布会上表示,“Mate70 系列和 Mate x6 系列为大家提供了鸿蒙 4.3 和原生鸿蒙 5.0 两个版本,供大家选择。明年华为推出的新手机、新平板将全部搭载原生鸿蒙了。”而据华为商城官网显示,目前仅 Mate70 Pro(12GB+512GB)的鸿蒙 NEXT 先锋版搭载原生鸿蒙 5.0 操作系统,其他 Mate70 系列发售时搭载鸿蒙 4.3 系统。
何刚还在现场给用户演示了 Mate70 系列的隔空传送图片、隔空滑动等 AI 功能。有华为门店员工解释称,AI 隔空传送、小艺圈选、小艺智能体等 AI 功能需要在原生鸿蒙 5.0 系统的加持下才能实现。
12 月 4 日上午消息,安天科技董事长肖新光发布全员信启动全员降薪计划,公司将根据团队和人员综合情况和外部产业和市场环境,重新调整相对应职级薪酬。据悉,今年 10 月以来,包括安天科技集团创始人、董事长肖新光在内的现有内部董事会成员,也已经带头执行零薪酬。
肖新光在全员信中透露,长期以来,公司运营成本处于高位,市场阵地开拓缓慢。2020 年到 2024 年已累计亏损 11.22 亿元。同时因未能成功完成上市对赌,出现少数投资人发起仲裁情况。为维持公司的生存能力,我们将启动全员降薪。
“这次降薪,是我们的非常之策,同时也是市场规律下的必然选择。”肖新光表示,自己要向同志们做出深刻的检讨。“自 2017 年后,由于我管理缺位,迷信通过全面放手放权,让管理经营班底能有效推进企业转型成长,导致了公司巨大的资源消耗。”据悉,肖新光将全面回归管理指挥位,在安天员工、投资人和客户的支持下,快速重构我们的治理体系和管理体系,组建一个精干彪悍、新老搭配的新班底。
当地时间 12 月 6 日,美国哥伦比亚特区联邦巡回上诉法院维持一项裁决,即如果字节跳动不能在明年 1 月 19 日最后期限到来前剥离 TikTok,后者将在美国被禁。预计该裁决将被上诉至美国最高法院。
TikTok 在社交媒体平台 X 发布声明对此回应称:“美国最高法院在保护美国人言论自由权方面有着良好传统,我们期待他们在这一重要的宪法问题上也能做到这一点。遗憾的是,TikTok 禁令是基于不准确、有缺陷和假设性的信息制定和推动的,导致了对美国人民的公然审查。如果不阻止 TikTok 禁令,明年 1 月 19 日,美国国内和世界各地超 1.7 亿美国人的声音将被压制。”
美国最大民权组织之一——美国公民自由联盟(ACLU)发布声明指出,“这一裁决开创了一个有缺陷且危险的先例,它赋予了政府过多权力来压制美国人的网络言论”。ACLU 表示,禁止 TikTok 公然侵犯了第一修正案赋予数百万美国人的权利,他们使用这款应用表达自己的观点并与世界各地的人们交流,“政府不能关闭整个平台,除非该平台会造成极其严重和迫在眉睫的危害,而现在没有任何证据证明这一点”。
时隔两个月,字节模型遭攻击事件又有新后续。今年 10 月份,字节商业化内部模型训练遭实习生田某攻击一事闹得满城风雨,最后田某便被开除并被要求赔偿字节的侵权损失 800 万元及合理支出 2 万元。据悉,2024 年 6 月至 7 月,田某因对团队资源分配不满,通过编写、篡改代码等形式恶意攻击团队研究项目的模型训练任务,造成资源损耗。
本以为这个瓜会以字节的“雷霆手段”告一段落,没想到事件迎来了大扭转。田某和字节合作的论文被人工智能顶级会议 NIPS 被评为了 Best Paper。让田某又火了一把的 NeurIPS,是被称为“人工智能超级顶会”的存在。被认为是难度最大、水平最高、影响力最强的会议之一。
网友们也是纷纷下场吃瓜:有人感叹:有点小说那意思了,昨日的我你爱答不理,今日的我你高攀不起。也有人劝字节及时止损,抓紧请“老师”回家。更有人支持田某直接下场创业。不过也不乏理智的网友:优秀永远也不能成为作恶的通行证。
在这篇 Best Paper 中,田某和其所在团队首次提出了一种新的图像生成框架,这个框架在图像合成的质量、多样性、数据效率和推理速度方面首次超越了强大的扩散模型,并且具有很好的扩展性和零样本任务泛化能力,并且这个项目已经在 Github 上积累了 4.4k 多颗星。此外,早在 2023 年,田某的一项工作就曾被 ICLR 评选为 Spotlight 论文。
近日,知名母婴品牌宝宝树创始人兼 CEO 王怀南有关言论引争议。12 月 2 日,王怀南发视频称:“退了公司所有员工群,确实没法忍受这帮人了。周日有一个同事在直播间声嘶力竭奋斗了好几个小时,让员工去参与互动,结果呼声甚少。作为一个创始人自己真的不能理解,吆喝没人来,使劲驱动也没人来,那种失望和绝望让自己退群且不想再加回去了。”
12 月 4 日宝宝树集团发布声明:王怀南先生作为宝宝树创始人,目前不参与宝宝树集团的日常经营管理工作;王怀南先生目前的创业项目是米茶公社品牌,宝宝树集团与米茶公社品牌在业务运营、管理架构以及财务投资、人员团队等方面均无任何关联。
近日,三星电子宣布了 2025 年年度主管人事变动,半导体部门器件解决方案( DS ) 迎来大规模裁员。三星电子计划单单对 DS 部门就裁减 100 多名主管,这标志着其半导体部门主管队伍空前缩减。业内知情人士于 11 月 28 日透露,这次人事调整是在三星电子 11 月 27 日的总裁级任命后进行的。
经常因臃肿不堪的领导结构而饱受批评的 DS 部门是此次裁员的重点。在该部门的大约 400 名主管中,预计将有 100 多人离职,其中许多人在存储器行业拥有丰富的经验。离开三星电子半导体部门的主管大多是五六十岁的人,这让坊间猜测他们会投奔竞争对手。
12 月 4 日消息,据报道,OpenAI 宣布,已从竞争对手谷歌 DeepMind 聘请三位高级计算机视觉与机器学习工程师:Lucas Beyer、Alexander Kolesnikov 和 Xiaohua Zhai。这三人将加入 OpenAI 在瑞士苏黎世新设立的办公室,专注于多模态人工智能(multimodal AI)的研发。
此外,OpenAI 在社交媒体上宣布,从当地时间周四开始将进入一个持续发布新功能的周期。公司在推文中写道:12 天、12 场直播,一堆大大小小的新东西,OpenAI 的 12 天活动期从明天开始。
公司 CEO Altman 进一步解释称,从周四太平洋时间早晨 10 点(北京时间周五凌晨 2 点)开始,每一个工作日都会进行一次直播,展示一个新产品或者样品,其中会有一些大型新产品,也会有一些“圣诞小礼物”。
据科技媒体 The Verge 援引知情人士透露,这些新产品中包含用户们期待已久的文字转视频工具 Sora 和一款新的推理模型。除此之外,OpenAI 可能会给 ChatGPT 语音模式增加一个“圣诞老人”语音,已经有用户在代码里发现语音模式的按钮可以变成雪花的形状。
英特尔于 12 月 4 日提交给美国证券交易委员会(SEC)的文件显示,刚刚离职的公司前 CEO Pat Gelsinger 将获得约 1200 万美元的离职金。该文件显示,Gelsinger 离职后,将获得 18 个月的底薪,总计约 190 万美元。同时,他还将获得 340 万美元目标奖金的 1.5 倍,分 18 个月支付。此外,作为 CEO,Gelsinger 还将获得 11 个月的年度奖金。综上所述,这些将使得他的离职奖金总额达到约 1200 万美元。
据悉,英特尔关于新 CEO 人选的讨论还处于早期阶段,尚未确定任何候选人。英特尔日前宣布,执行副总裁兼首席财务官 David Zinsner 和 Michelle Johnston Holthaus 出任临时联席 CEO,同时公司董事会正物色新的 CEO 人选。
12 月 2 日消息,当地时间周一,美国特拉华州一名法官再次否决了特斯拉 CEO Elon Musk 的创纪录薪酬方案,尽管此前股东们支持恢复这一方案。尽管今年 6 月特斯拉股东们在年会上投票支持这一方案,但特拉华州衡平法院法官 Kathaleen McCormick 仍决定坚持 1 月份的最初裁决,即该公司董事会在 2018 年通过该计划时受这位亿万富翁企业家的影响太大。
12 月 3 日,据报道,微软将在英国面临一起逾 10 亿美元的反垄断诉讼,指控微软报复数千家使用亚马逊、谷歌云计算服务的英国企业,要求他们支付更高的许可费来使用 Windows Server 软件。反垄断律师 Maria Luisa Stasi 周二向英国竞争上诉法庭(Competition Appeal Tribunal)提起诉讼,为受影响的英国企业和组织寻求超过 10 亿英镑(约合 12.7 亿美元)的赔偿金。
12 月 5 日,人人影视宣布将二十年数据开源分享。人人影视表示:“人人影视成立之初就是想把自己翻译的字幕分享给更多爱好者,历时二十年人人影视翻译了几万集的影视字幕,本着字幕组分享的宗旨,我把全部字幕文件和对应数据库打包一起分享出来给大家。”
此外,人人影视还回应了网站还在不在的问题,人人影视称:“其实还在,新的论坛为什么用户不互通,是因为老网站的程序和架构太老了,没人去维护了,保持原样挂在那里就可以了。开发新花费又比较高,加上现在也没时间去折腾这个,大家都还有自己的生活和工作要做。”
12 月 3 日早间,有消息称腾讯天美工作室群旗下《星之破晓》(破晓)项目将被裁撤。有媒体通过内部信源了解到,网传解散不实,项目接下来会有调整,但并未解散,待明确方向后再做投入。“目前就是天美工作室群下的 J5 工作室停摆了,接下来怎么做还不知道,以及部分人将活水到《怪猎》项目”。
据另一内部信源称,这次调整略显突然,或与内部的一场汇报有关。高层在看到相关数据和进展汇报后做出了及时止损的判断,“之前内部一算账,发现做一个《破晓》能做两三个《黑神话:悟空》了,觉得投入产出比不符合预期”。其补充道,“如果没有意外,正式服会在明年 1 月正式上线,所以说感觉突然”。
据公开报道,《破晓》是天美王者 IP 衍生的第一款重磅作品,分别于 2023 年 8 月 18 日、2023 年 10 月 19 日进行了两次安卓计费删档测试,并于今年的 5 月 10 日上线了不删档先遣服。项目上线后一直面临着较为严重的定位困惑,“可以说是边做边想边改”接近项目的行业人士称,“一开始有点像任天堂大乱斗,后来感觉又变了”。
此外,《星之破晓》官方发公告称,经团队讨论,决定对产品进行重新调整,因此先遣测试服将于 12 月 6 日停服,并向玩家全额退还测试期的充值。
12 月 3 日,索尼 PlayStation Blog 官方发起了 2024 年度最佳游戏投票,共有 19 个奖项类别。最终获奖者完全由玩家投票决定,投票将于北京时间 12 月 14 日 15:59 结束,并将在几周后公布结果,奖项级别包含铜杯、银杯、金杯和白金杯。其中,最佳 PS5 游戏类别被定义为本日历年度新发布的游戏,而不是之前发布的游戏更新版本。
今年的提名名单截止日期是 11 月 30 日,在此日期之后发布的游戏没有资格入选,但将有资格在明年的奖项中获得提名和投票。国产 3A 大作《黑神话:悟空》获得了其中两项提名:最佳 PS5 游戏、最佳图形展现。此外,《黑神话:悟空》开发商游戏科学获得“年度工作室”提名。
12 月 6 日消息,OpenAI 启动了为期 12 天的“shipmas”新品发布周期,将推出一系列新功能、新产品以及相关演示。活动首日,OpenAI 推出了完整版 o1 模型,并新增了月费为 200 美元的 ChatGPT Pro 订阅。完整版 o1 模型,于 12 月 6 日开始向 ChatGPT Plus 和 Teams 用户开放,下周向 Enterprise 和 Edu 用户开放。
OpenAI 还推出了 ChatGPT Pro 订阅服务,每月费用为 200 美元,可以无限使用 OpenAI 的 o1、GPT-4o 以及 Advanced Voice 模式等等。ChatGPT Pro 订阅服务用户还可以独家享受特别版本 o1 模型,该版本使用更多计算资源来为最难的问题提供最佳答案(称为 o1 pro 模式)。
第二日活动的主题是新功能“强化微调”(Reinforcement Fine-Tuning),企业组织将能够通过“强化微调”微调 o1 mini,满足他们的特定需求。强化微调并不是单单教模型模型输出,它的运作方式是,当模型发现一个问题的时候,研究者给模型空间区仔细思考这个问题,然后评估模型给出的最终解答,运用强化学习,研究者可以强化产生正确答案的思路,抑制产生错误答案的思路,只需要“几十个例子”(a few dozen examples)、甚至 12 个例子,模型就能以有效的新方式学习特定领域的推理。
另外,OpenAI 正考虑取消与微软的通用人工智能(AGI)相关条款,以吸引更多投资。根据现有协议,当 OpenAI 实现 AGI 时,微软将无法使用这一技术。至于 OpenAI 是否达到了 AGI 则由 OpenAI 董事会来判断。
12 月 5 日,字节豆包大模型团队开源最新代码大模型评估基准 FullStack Bench,在业界首次囊括编程全栈技术中超 11 类真实场景,覆盖 16 种编程语言,包含 3374 个问题,相比此前基准,可以更有效地评估大模型在现实世界中的代码开发能力。
代码评估基准是衡量大模型编程能力的标准工具,也是推动模型优化的关键驱动力。不过,当前的代码评估基准覆盖的应用类型和编程语言较为有限,难以反映真实世界中代码开发场景的多样性和复杂性。因此,字节推出了 FullStack Bench,一个专注于全栈编程和多语言编程的代码评估数据集。它包含 3374 个问题,每个问题均包括题目描述、参考解决方案及单元测试用例,总计 15168 个单元测试。
12 月 4 日消息,DeepMind 最新基础世界模型 Genie 2 登场,只要一张图,就能生成长达 1 分钟的游戏世界。从此,我们将拥有无限的具身智能体训练数据。更有人惊呼:黑客帝国来了。
谷歌研究人员表示,相信 Genie 2 可以解锁具身智能体的下一波能力。从第一人称的真实世界场景,到第三人称的驾驶环境,Genie 2 生成了一个 720p 的世界。给定一幅图像,它就能模拟出世界动态,创建一个可通过键盘和鼠标输入的、可操作的一致环境。
12 月 3 日,腾讯宣布,混元大模型上线并开源文生视频能力,参数量 130 亿,支持中英文双语输入。官方宣称,腾讯混元视频生成大模型可以生成超写实的高质量视频,生成的画面不容易变形;在镜面或镜子场景中,可以做到镜面反射动作和外面完全同步,光影反射基本符合物理规律。
据介绍,腾讯混元视频生成大模型采用 DiT 架构,适配了新一代文本编码器提升语义遵循,更好地应对多个主体描绘,实现更加细致的指令和画面呈现。腾讯表示,本次开源包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费使用和开发生态插件。
12 月 3 日,李飞飞空间智能首个项目突然发布:仅凭借 1 张图,就能生成一个 3D 游戏世界的 AI 系统。值得注意的是,生成的 3D 世界具有交互性。能够像玩游戏那样,自由地移动相机来探索这个 3D 世界,浅景深、希区柯克变焦等操作均可行。
可探索的 3D 世界里,这些场景在浏览器中实时渲染,配备了可控的摄像机效果和可调节的模拟景深(DoF)。你甚至可以改变其中物体颜色,动态调整背景光影,在场景中插入其他对象。
此外,之前大多数生成模型预测的是像素,而这个 AI 系统直接预测 3D 场景。所以场景在你移开视线再回来时不会发生变化,并且遵循基本的 3D 几何物理规则。
12 月 4 日消息,行业首个 AI 公文智能体“学习强国公文助手”在文小言 APP 正式上线,由“学习强国”学习平台与文小言联合打造。据了解,“学习强国公文助手”智能体具备“学习强国”文汇检索能力,内容覆盖文汇、重要活动、重要会议、指示批示等多个板块。此外,“学习强国公文助手”智能体未来还将上新公文润色能力。
12 月 5 日,百度副总裁、移动生态商业体系负责人陈一凡在 2024 百度热 AI 营销大会上表示,百度旗下新搜索文小言计划接入更多生活服务类功能,预计明年可覆盖法律、票务、电商等 30 余行业。此外,百度商业系统升级为“百度伴飞”,目前已有超 7 成客户在使用百度 AI 营销服务。
12 月 4 日,据报道,苹果机器学习和人工智能高级总监 Benoit Dupin 在亚马逊网络服务大会上透露,苹果在其许多云服务中使用了亚马逊网络服务的定制人工智能芯片。苹果还在评估使用亚马逊最新的 AI 芯片来预训练 Apple Intelligence 模型。
12 月 3 日,亚马逊旗下云计算公司 AWS 与开发者平台 GitLab 宣布推出一款结合双方的 AI 助手工具 GitLab Duo 与 Amazon Q 的集成产品,GitLab 用户能够使用 Duo 的聊天功能访问 Amazon Q Developer 提供的多种代理,帮助简化工作流程、加速代码交付和增强安全性。
12 月 2 日,人形机器人公司魔法原子(MagicLab)发布视频公布产品进展:人形机器人 MagicBot 已进驻工厂产线,进行多项作业训练。视频中,多台 MagicBot 人形机器人在执行产品检测、物料搬运、零件取放、扫码入库等工作,彼此之间实现了小范围协作。
12 月 13 日至 14 日(下周五至周六),AICon 全球人工智能开发与应用大会将在北京盛大开幕!本次大会汇聚 70+ 位 AI 及技术领域的顶尖专家,深入探讨大模型与推理、AI Agent、多模态、具身智能等前沿话题。此外还有丰富的圆桌论坛、以及展区活动,带你深入探索大模型的最新实践与未来趋势。年度最后一次 AI 盛宴,让我们一起见证 AI 未来。