在这股AI大模型的风口中,5年亏损超438亿元的商汤科技,抢到了先机,推出了自研的AI大模型体系,站到了与阿里、百度、华为等巨头同台竞争的位置。但要成为中国版Open AI,商汤还差多远?
发酵了一个季度,年初被ChatGPT引爆的AI大模型,在近期迎来了集中爆发。被誉为中国“AI四小龙”之一商汤科技,也抢到了先机,交出了自己的AI大模型体系——“日日新SenseNova”。
在4月10日的技术交流日上,商汤科技董事长兼CEO徐立展示了“日日新”体系下的语言大模型“商量”,AI文生图创作“秒画”、2D/3D数字人生成“如影”、大场景/小物体生成“琼宇”“格物”等一系列生成式AI模型及应用。公开资料显示,其服务于大模型的AI大装置SenseCore,共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。甚至在英伟达A100的储存量上,商汤也达到了上万张,占到了与BAT同台竞争的位置上。不过,强大的算力背后,商汤也付出了巨额的代价。据商汤财报,在2018年—2022年之间,其研发费用率从45.9%飙升至105%。在2022年,商汤全年净亏损60.45亿元。据公开数据, 2018年至今,商汤累计亏损达到了438亿元。在资本“输血”的路径上,商汤与OpenAI有着相似之处。但不同于微软对后者的坚定支持,商汤扛着“AI第一股”的光环登上了港交所,又在半年后,上市前投资者、基石投资者股权解禁时,迎来了投资者的退出套现,股价下挫,市值腰斩。ChatGPT刮起的AI大模型热潮,无疑是商汤的一次跃升机会,而商汤又会如何抓住呢?
在4月10日的发布会上,商汤一口气展示了多个产品。
在“日日新”这个大模型体系下,商汤有与ChatGPT相似产品“商量”(SenseChat)。这是一个1800亿参数的中文大语言模型,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。在现场,徐立演示了其创作广告语,与用户一人一句续写儿童故事,解答法律、医疗问题,编程等功能。将超长文本《专利法》“投喂”给“商量”后,再向它提问。可以看到,“商量”能够理解《专利法》的文本,而后对用户的问题进行解答,回答的内容并非复制《专利法》的大段内容。在医疗咨询上,当用户提出症状后,“商量”并没有给出病情诊断。而是进行多次询问,根据用户的患病时长、其他症状等,才给出了可能的病症和求医科室建议,更加类似人工的问诊。 商汤表示,目前“问诊助手”功能已在包括新华医院在内的多家医院落地,未来有望面向更多医院开放。在编程的能力上,徐立表示,内部实测代码编写效率提升62%,在HumanEval测试集上,准确率达到了40.2%。在AI的辅助下,新一代软件开发的”二八定律”正在形成,未来将会是80%AI生成+20%人工。目前,“商量”还未开启内测,其能力对比ChatGPT、文心一言如何,还需要后续观察。不过,发布会上,商汤还展示出了其他让人眼前一亮的生成式AI模型及应用。“秒画”为文生图创作平台,它的逻辑与Midjourney类似,用户选定风格后,输入提示词即可生成相应的图片。其一大亮点在于可以由用户自添加批量图片,自训练图片风格。在展示中,徐立尝试创作一副港风美女图,在平台自生成效果并不如意后,在平台自添加进了数十张八九十年代香港女星照片。而后“秒画”生成的图片风格便更接近于用户想要的效果。据商汤方面介绍,“秒画”可以做到2秒生成1张512K分辨率的图片,用户可基于单卡A100自训练。基于平台发布的模型,可设置to B服务API(应用程序编程接口),结合商汤大算力对外提供服务。“如影”是商汤推出的AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。在应用场景中,不乏直播带货、名师教学、宣传视频、短视频等。“琼宇”、“格物”均为3D内容生成平台,分别指琼宇大空间3D内容生成应用、格物小物体3D内容生成应用,可基于3D内容生成技术实现对空间、物体的复刻与交互,快速生成大到城市、小到花朵的建模。商汤方便表示,两者结合,可以高效、低成本生成大规模的三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间,可在商业广告、直播间等场景下应用。从几款产品展示出来的效果来看,商汤的图片生成能力、打造数字人能力,以及制作视频,3D建模的能力,都达到了不错的效果。不过,作为面向B端的技术,目前“日日新”大模型体系开放面向政企客户的API接口。何时开放内测,还未能确定。
在国内,商汤可能是最早将人工智能大模型写入招股说明书的上市公司。作为中国“AI四小龙”之一,商汤对AI大模型的研发,也并非起于当下。
在2019年时,商汤便推出了10亿参数量规模的视觉模型,彼时,商汤已经使用了上千张GPU卡进行单任务训练。在过去两年里,商汤还训练了百亿参数规模的超大视觉模型。在今年3月,商汤又推出了多模态多任务通用大模型书生(INTERN)2.5,具有30亿参数。训练这些模型的基础,包括当前推出的大模型“日日新”,均得益于商汤AI大装置SenseCore的搭建。在2015年,商汤开始研发深度学习训练框架SenseParrots,并逐渐以此为核心、持续研发,搭建起了AI基础设施SenseCore。据2022年财报,SenseCore AI大装置基于2.7万块GPU的并行计算,系统实现了5.0 exaFLOPS的算力输出,可支持最多20个千亿参数量超大模型(以千卡并行)同时训练。到目前,SenseCore已支持8家客户进行大模型训练,总共提供了7000多张GPU卡。支持了超过10个大模型训练项目,包括语言大模型、文生图模型、视觉大模型、多模态模型等自研模型和客户自定义模型。 这一轮国内的AI大模型竞争中,算力竞争是一个十分重要的元素。商汤联合创始人、首席科学家王晓刚曾表示,2021 年,商汤在上海的临港建立了AIDC的超算中心,有5000P 的算力,1万块的A100,而且可以实行数千卡的大规模的并行的训练。商汤公布的一份纪要中提到,要训练像ChatGPT这样的生成式AI,所需的算力至少需要1万张英伟达A100加速卡的支持。在目前,国内只有6家公司具备这样的硬件实力,分别为商汤、百度、腾讯、字节、阿里、幻方。这也意味着,在算力的硬件储备上,商汤站到了与BAT同台竞争的位置上。此外,不仅是英伟达的专用显卡,商汤也在采购并适配国产的GPU。在去年,商汤已在AI大装置中适配了许多寒武纪、海光的GPU卡。消息人士表示,商汤AI大装置当前的算力中,有10%左右的算力,是由国产GPU卡提供的,商汤也一直在进行适配。不过,相比于资金实力更加雄厚的大厂,商汤仍有不小的差距。相关消息显示,当前阿里云云上至少有上万张A100,整体能够达到10万张,阿里集团所拥有的量级为阿里云的5倍。短期来看,商汤在国内AI大模型研发上算力不弱。但从长期来看,商汤如何能持续获得高端GPU,如A100、A800,存在不确定性。毋庸置疑的是,国内的AI大模型正在开展一场“追逐战”,百度的文心一言、阿里的通义千问、华为的盘古、京东言犀,以及商汤的日日新纷纷加入战场。在未来,或还将有更多的“入局者”。中国到底需要多少个AI大模型?氪信科技CEO、粤港澳大湾区数字经济研究院计算金融CTO工作室负责人朱明杰曾告诉全天候科技,AI大模型是一个基础设施,可以理解智能手机时代中的手机系统,如iOS、安卓。朱明杰认为,AI行业不需要太多的“系统”。而从当前来看,“入局者”们都不想放过成为AI“顶层设计者”的可能性。这场争分夺秒的追逐战,也难以避免。
相比之下,商汤比起入局的互联网、科技巨头而言,还有许多“内忧”未曾解决。
商汤基础设施优势的代价,是高比例的研发投入。在2022年,商汤在研发支出上合计40亿元,同比增长11%;研发人效相比去年进一步提高90%,人均每年研发模型数9.35个;累计商用模型数提高了93%至6.7万个。截至2022年12月31日,公司的研发队伍达3466人,占员工总数的68%。但高昂的研发投入,暂时还未“兑换”成同等比例的营收,商汤仍在持续亏损。据财报显示,在2022年商汤净亏损60.93亿元。在2018年至2022年5年中,商汤累计亏损总金额达438亿元。商汤能够发展至今并在2021年底登陆港交所,一定程度上离不开“资本输血”。在上市前,商汤经历了12轮融资,累计融资金额达到了52.2亿美元,在它的背后,曾经站着软银、阿里、银湖、IDG、中国国有企业结构调整基金、上海国际集团、赛领、鼎晖等资本方。这似乎也与OpenAI的成长路径有所相似。在2019年,微软宣布和OpenAI建立独家合作伙伴关系,投资总额10亿美元。这笔资金放在如今爆火的AI行业来看,也是一笔“巨款”。而10亿美元还只是开始,截至目前,微软多次注资,已陆续向OpenAI投资130亿美元。在当前,OpenAI估值接近300亿美元。相比于投入的金额,当前OpenAI的营收还微不足道。根据研究机构PitchBook的数据,OpenAI今年有望产生2亿美元的收入,较2022年增长150%。但不同于微软对OpenAI坚定的支持,商汤已经经历了投资人的撤离变现。在去年6月30日,商汤科技上市前投资者、基石投资者股权基本解禁,涉及股份占公司总股本的73%。在短短一天之内,商汤科技的市值蒸发了915亿港元。而后半年,阿里、软银、环球资本等投资方已纷纷减持套现。今年以来,在AI大模型热潮之下,商汤的股价有所回温。当前的市值为1104亿港元,距离最高时的3200亿港元,仍有2000亿的差距。商汤的确抢到了AI大模型的先机,但作为一家市场化的企业,在发力“日日新”大模型体系的同时,商汤更需要推进自身业务结构转型。截至2022年末,商汤的业务主要分为智慧生活、智慧城市、智能汽车、智慧商业四大板块。其中,智慧生活与智能汽车增速显著,但智慧商业、智慧城市下滑也十分明显。在过去一年中,增长业务并未拉齐下滑业务,商汤实现营业收入38.09亿元,同比下降18.97%。目前,商汤的“日日新”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市四业务板块。但大模型能够为这四块业务带来多少的增值,也还有待市场检验。*本文为全天候科技原创作品,未经授权不得转载,如需转载,请在后台回复“转载”二字,获取转载格式要求。