查看原文
其他

智能晚报|阿里巴巴减持小鹏;字节跳动Seed大模型使用GPT数据训练;Gemini中文语料疑似来自文心一言...

江睿杰、杨秋秋 新皮层NewNewThing 2024-03-08

「每周一三五更新」


撰文:江睿杰、杨秋秋

编辑:吴洋洋

Key Points


商汤科技大股东可能更换


字节跳动Seed大模型因使用GPT数据训练,被OpenAI暂时「封号」


Gemini中文语料疑似来自文心一言


DeepMind让两个模型协作完成数学问题


HeyGen拟注销国内主体


阿里巴巴减持小鹏汽车,持股降至7.5%



商汤科技大股东可能更换

12月18日,商汤科技发布公告称,汤晓鸥通过AmindInc.所持有的69.06亿股公司A类股份(超级投票权)的不同投票权已终止,预期将按照一换一比例转换成公司B类股份(普通投票权)。

汤晓鸥是人工智能科学家、香港中文大学信息工程学系教授,也是商汤科技创始人和控股股东。12月16日,商汤科技发布讣告,称汤晓鸥因病救治无效,于2023年12月15日23时45分去世。

汤晓鸥生前是商汤科技第一大股东和实际控制人

商汤科技采用同股不同权的股权结构。去世前,汤晓鸥在商汤科技持股20.63%,但拥有68.28%的投票权,为商汤科技的第一大股东和实际控制人。将汤晓鸥所持A类股份转换为B类股份后,汤晓鸥原有股票在商汤科技的持股和投票权都将变为20.63%。

根据公司章程和相关法规,股东去世后,其股权将被继承人或指定继承人继承,这意味着商汤科技的控制权可能会发生变动。

除了汤晓鸥遗留的20.63%持股,目前商汤的其余大股东分别为:

  • 软银:2022年以来几次减持后,软银目前持有12.99%的商汤股权;

  • 徐立(商汤科技联合创始人、CEO):3.39%投票权;

  • 王晓刚(商汤科技联合创始人、首席科学家):2.52%投票权;

  • 徐冰(商汤科技联合创始人):1.28%投票权。

淘宝此前也是商汤的股东之一,不过根据7月21日的港交所公告,淘宝已出售所持有的所有商汤B类股份,清仓前,淘宝投资商汤超过5年。

汤晓鸥曾发明DeepID系列人脸识别算法,并创立中国第一家上市AI公司

1968年,汤晓鸥出生于辽宁鞍山,1990年从中国科学技术大学毕业后,他前往美国罗切斯特大学和麻省理工学院分别攻读了硕士和博士学位。毕业之后,汤晓鸥进入香港中文大学任教,担任信息工程系教授,并创办多媒体实验室(MMLab),继续从事计算机视觉相关领域的研究。

2014年3月,汤晓鸥带领团队发表原创的人脸识别算法,准确率达到98.52%,首次超越人眼识别能力(97.53%)。2014年6月,MMLab发表DeepID系列算法,逐步将人脸识别准确率提升至99.55%,推动了人脸识别技术的进一步落地。

2014年,汤晓鸥又和同样来自MMLab的徐立、徐冰、王晓刚等人,共同创立人工智能公司商汤科技。IDG资本、阿里巴巴、淡马锡、软银中国、鼎晖投资、万达等参与融资,总计高达52亿美元。

2021年12月,商汤科技于港交所正式上市,成为中国第一家成功上市的AI公司,市值一度突破3000亿港元(约合2454亿元人民币)。

商汤成立至今未曾实现年度盈利

商汤科技的主要业务涵盖智慧商业、智慧城市、智慧生活、智能汽车四大板块,上市以来先后推出了智能汽车解决方案独立品牌商汤绝影SenseAuto、首个家庭消费级人工智能产品AI下棋机器人「元萝卜SenseRobot」象棋版和围棋版,以及今年7月的「日日新」大模型,并发布了基于该大模型的生成式AI产品系列,包括「商量SenseChat」「秒画SenseMirage」「如影SenseAvatar」等。

自上市以来,商汤科技尚未实现年度盈利。根据财报,2023年上半年,商汤净亏损额为31.4亿元。

亏损原因之一是研发投入一直保持在较高水平。2022年,商汤科技研发费用高达40.14亿元,甚至出现高过同期营收的状况。此外,应收款项的现金收回情况成为拖累商汤利润表现的另一个主要原因。截至今年6月末,商汤科技的应收账款总额达77.26亿元,主要来自于智慧城市业务的客户。

截至12月18日收盘,商汤科技股价报1.12港元/股,跌11.11%,距离高点已跌去超8成。




字节跳动Seed大模型因使用GPT数据训练,被OpenAI暂时「封号」

据技术网站The Verge 12月16日报道,有内部文件显示字节跳动曾秘密使用OpenAI的技术来开发自己的大语言模型。OpenAI随即声明称已暂停字节账号并开始调查。字节跳动方面则于12月17日回应称,相关做法仅在2023年年初的小范围研究中使用,将严格遵守OpenAI规范。

字节跳动到底用OpenAI的模型接口做了什么?

The Verge的报道指控称,字节跳动内部代号为Seed的大语言模型项目在模型开发的几乎所有阶段都使用了OpenAI的GPT输出的数据。这些数据被用于训练和评估字节跳动自身的模型。报道称,Seed项目组对GPT的使用非常频繁,经常触及API接口调用次数的上限。同时为了洗白嫌疑,项目组还有意对数据做了脱敏处理。

OpenAI方面已经介入调查,初步表示字节跳动对其接口的调用量非常少。不过这一评估没有将微软Azure云服务内置的GPT服务的调用统计在内。

根据OpenAI在3月14日发布的使用条款,用户不得利用GPT开发和OpenAI有竞争关系的产品。微软Azure云服务也有类似规定。

字节跳动称项目仅为研究性质,没有计划上线

12月17日,字节跳动回应称,相关情况发生在今年年初,当时有部分工程师将GPT的API服务应用于较小模型的试验性项目研究。该项目开发的模型仅为测试用途,没有计划上线,也从未对外使用。

字节称,公司内部在4月引入了GPT API调用规范检查,明确要求不得将GPT模型生成的数据添加到字节大模型的训练数据集里,并培训工程师团队在使用GPT时遵守服务条款。9月,公司内部检查时采取了进一步措施保证合规,例如分批次抽样检测模型训练数据与GPT的相似度、避免数据标注人员私自使用GPT。字节方面称,将在未来几天里再次全面检查,以确保严格遵守相关服务的使用条款。

字节跳动已发布两款大模型

「火山」大模型:字节跳动今年6月发布该模型,首次进入生成式AI赛道。该模型面向企业用户和开发者提供服务,抖音内部当时已经开始用该模型来完成代码纠错、文本分类等工作。

「云雀」大模型:在toC服务方面,字节跳动自研的「云雀」大模型8月通过了《生成式人工智能服务管理暂行办法》备案。同月,基于该模型的AI对话产品「豆包」开启对外测试。

11月末,字节跳动成立新AI部门Flow。该团队曾负责开发「豆包」,此外,该团队还在海外上线了另一款AI对话产品Cici,其他多款AI产品也在孵化中。有推测认为,字节跳动在收缩游戏业务的同时,正在加码AI产品开发。

链接:

https://openai.com/policies/mar-2023-termshttps://www.oschina.net/news/271501/bytedance-china-openai-microsoft-competitor-llm




Gemini中文语料疑似来自文心一言

12月18日,有用户表示,Gemini-Pro疑似使用了文心一言的语料库训练。在Google Vertex AI平台与Gemini-Pro开展中文对话时,Gemini-Pro表示,自己是百度文心大模型,是由百度公司开发的。当被问及「你的创始人是谁」时,Gemini-Pro回答「我的创始人李彦宏」。用户强调,在这段对话之前,没有任何前置对话。即使用户尝试纠正Gemini-Pro的回答,它仍然坚持自己是来自清华大学的大语言模型。在Gemini官方开发环境入口AI Studio中,Gemini Pro更是承认,其中文数据的训练使用了百度文心一言。

此前,Google发布的Gemini演示视频,因「使用视频的静态图像帧,并通过文本提示制作」受到质疑。对此,Google表示,视频完全真实,但为了简洁缩短了部分内容。




DeepMind让两个模型协作完成数学问题

《自然》杂志12月14日刊发的论文显示,Google旗下的DeepMind开发的大语言模型FunSearch能够为卡牌游戏「神奇形色牌」(Set)提供超过人类数学家和计算科学家的解决方案,而且这些方案能够迁移到其他数学与计算科学领域。

什么是「神奇形色牌」?数学家为什么关注它?

神奇形色牌诞生于1974年,这套牌中每一张都有4个特征维度:数量、图案、纹路以及颜色,每个维度有3种花色,穷尽各个维度一共可得3⁴=81张牌。

该卡牌游戏的玩法是寻找成套的3张牌——这其实是典型的组合问题,而组合数学是离散数学的重要分支。数学家已经证明,如果累计翻牌数达到21张,就一定能找到至少一组成套的牌。但当每张牌的特征维度扩展到3个以上时,最低翻牌数的确认尚没有统一的方法。此次DeepMind的研究得到了比之前数学家研究更优的解决方案。

大语言模型到底是怎么解决数学问题的?

大语言模型在数学问题上的表现通常不太好。GPT-4在小学数学问题测试集(GSM8k)上也只能得到87.1分。但是DeepMind这次改变了使用大模型的方法,采用双模型协作的新方式。

具体来说,研究者利用FunSearch(全称为「searching in the function space」,意为「函数空间搜索」)大模型提出指令,要求另一个负责写代码的大模型(未具名,暂称为「X」)写一段简单的计算机程序代码,这段代码负责解决特定数学问题。FunSearch负责检查解决方案是否比已知的其他方案更好,如果解决方案不够好,它会反馈给X要求X继续改进。

该研究把使用大模型的重点从「直接解决具体的问题」转向「能否给出有效的解决方案」,然后通过对所有方案(比如神奇形色牌组合)的穷举、对比来得出最优方案。这种方式有助于减少幻觉的干扰,因为即使一个大模型出现幻觉,也会被另一个发现。这种方式也有望拓展大模型应用的范围,将其用于更复杂、更现实的问题中。

 参考链接:

https://www.nature.com/articles/d41586-023-04043-w

https://www.nature.com/articles/s41586-023-06924-6




HeyGen拟注销国内主体

据天眼查信息,自2023年12月11日起,HeyGen背后的创业公司——诗云科技因决议解散,拟向公司登记机关申请注销登记。此次国内主体的解散,被业内认为与诗云科技于11月获得的风投有关。

今年11月29日,诗云科技获得Conviction领投的560万美元风险投资。作为交易的一部分,硅谷投资人Sarah Guo将接替红杉中国种子基金在HeyGen董事会的席位。意见指出,HeyGen的产品主要面向海外用户,与其中国起源保持距离能够在一定程度上帮助公司更好地接触外国客户、避免海外政府的打压。

新皮层曾报道,HeyGen是一款面向C端用户的视频制作工具。

此前,诗云科技已经完成了两轮融资:红杉中国种子基金和真格基金参与的天使轮投资,以及由IDG资本领投、红杉中国种子基金和真格基金跟投的Pre-A轮融资。




阿里巴巴减持小鹏汽车,持股降至7.5%

美国证监会12月15日文件显示,阿里巴巴旗下的淘宝中国控股有限公司计划售出2500万股小鹏汽车的股权,总价值约3.91亿美元。减持后阿里巴巴的持股比例由10.2%降至7.5%,仍然是小鹏汽车的第二大股东。截至15日美股收盘,小鹏股价下跌7.54%。阿里巴巴集团相关负责人表示,公司此前在第三季度财报对外沟通会上已明确将变现手头资产回馈股东,此次减持系执行之前的策略,阿里巴巴仍相信小鹏的前景。


-END-

若想了解更多当日资讯,请点击阅读往期智能晚报

智能晚报|Midjourney推出独立网站;OpenAI再砸百万美元孵化AI公司;Gemini模型开放API调用,暂时免费...

若想了解更多当日头条,请点击阅读往期头条新闻

大公司|Google发布Gemini,暗示GPT-4不是「原生」多模态

我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。 

和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。

在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与「智能」相关的议题。请注意,我们说的智能,不只是 AI。


与记者交流,可添加微信(请备注公司名称和姓名):

王杰夫 微信号: wjfsty

张司钰 微信号: helianthus351

吴洋洋 微信号: qitianjiuye

喜欢就关注我们吧,记得设为星标」

继续滑动看下一个

智能晚报|阿里巴巴减持小鹏;字节跳动Seed大模型使用GPT数据训练;Gemini中文语料疑似来自文心一言...

江睿杰、杨秋秋 新皮层NewNewThing
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存