查看原文
其他

商汤ChatGPT「商量」炸场!秒生6K神图,代码提速62%,现场直播怼脸

新智元 新智元 2023-04-12



  新智元报道  

编辑:桃子 好困
【新智元导读】「日日新SenseNova」大模型体系发布,商汤正式官宣入局!

商汤正式加入ChatGPT战局!
就在昨天,商汤在发布会现场一口气来了个全套的,大模型文生图、代码生成、做视频、2D/3D数字人....
话不多说,直接上图。
一个人类站在非常有未来感的建筑面前,畅想平行宇宙种种可能。
只需5分钟真人视频素材,活灵活现的数字人就来了。
还有代码翻译实时演示,码农狂喜。

日日新,又日新


这些让所有人惊呆的大模型能力,便来自商汤的「日日新SenseNova」大模型体系。
「日日新SenseNova」这一名字取自《礼记·大学》中,汤之盘铭曰「苟日新、日日新、又日新」。
它寓意着在模型的迭代速度及处理问题的能力上可以日日更新,不断解锁AGI更多可能。
在这一大模型体系中,商汤自研了中文语言大模型商量SenseChat、以及包括AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型与应用。
商量SenseChat:妙解复杂问题,创作一流文本
商量SenseChat是商汤最新研发的中文语言大模型。
模型训练使用了大量数据,并充分考虑了中文语境,能够更好地理解和处理中文文本。
活动现场,商量SenseChat不仅能进行单轮对话,而且多轮对话,超长文本理解能力上表现出色。
在单轮对话上,理解句子含义,判断句子合理性不在话下。
另外,还能够进行逻辑推理,比如正确完成非命题和命题的逻辑问题。
问它旺仔的爸爸有三个孩子,老大叫大毛,老二叫二毛,老三叫什么?
在多轮对话中,商量SenseChat还具备出色的语义理解、创造力和共情能力。
能够为你提供情感上的抚慰,比如「如何提高自我认识,更好地了解自己?」
它还可以进行共同创作,比如与人一人一句共同创作儿童故事。
最后,在超长文本理解上,商量SenseChat能够帮助用户快速通过与大模型互动来获取知识、寻找答案。比如,让它快速阅读理解《专利法》。
此外,商汤直接把商量SenseChat用在了代码开发上,推出了AI代码助手。
更刺激一点在于,他们这次竟然上了现场实时演示,而且还是镜头直接怼屏幕的那种。
据了解,全新的AI代码助手为码农提供了代码补全、注释生成代码、测试代码生成、代码翻译、代码修正、代码重构、复杂度分析等功能。
与此同时,AI代码助手还支持中英文,以及多种编程语言,并能够快速适应码农个性化编码风格。
在内部实测中,AI代码助手可以让代码编写效率提升62%,HumanEval测试集一次通过率40.2%。
商汤科技董事长兼CEO徐立称,下一代软件开发范式是AI for AI,并提出了全新的二八定律:代码= 80% AI生成+20%人工。
除了写代码,商量SenseChat已经用在医疗场景中,比如问诊分诊、医疗知识科普、疾病鉴别诊断。
未来,将继续拓展在药物治疗、手术方案等方面的问诊能力,帮助医生进一步提升诊疗效率。

真·全能AI


除了发布中文语言大模型,当前,最火的就是生成式AI了,商汤在该领域也展开了全方位的布局。
基于「日日新SenseNova」大模型体系,商汤自研了包括秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings等一系列生成式AI模型及应用。
文生图创作平台「秒画SenseMirage」
文生图有多强,其实你刚刚也见证到了。秒画SenseMirage能够展现光影真实、细节丰富、风格多变,还能支持6K高清图的生成。
该模型基于超10亿参数自研文生图生成模型,支持二次元、三次元等多种生成风格。
另外,用户还可以自主训练,可基于单卡,5分钟内定制属于自己的LoRA 模型@20张训练图片。
对创作者来说,生成模型开源社区汇聚了1万+开源模型,结合自研模型及训练能力,为其提供了更加完善的内容生产工具。
AI数字人视频生成平台「如影SenseAvatar」
谈到元宇宙,就需要数字化分身Avatar。
如今,无需专业拍摄设备,通过文字驱动,你就可以快速、高效打造一个高度逼真的数字形象。
如影SenseAvatar仅需要5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。
甚至,只需提供一个粗略的想法,文案也有了。此外,它还能支持百种语言,让你轻松创作跨国际化内容。
除了打造短视频,「如影SenseAvatar」还可以轻松制作教育、企业,娱乐文化等领域的视频。
3D内容生成平台「琼宇SenseSpace/格物SenseThings」
格物SenseThings可基于3D内容生成技术实现对空间和物体的复刻与交互,并支持再编辑再创作。
除了数字人,基于NeRF,商汤的琼宇SenseSpace可以进行场景生成,复刻和还原真实空间。
琼宇SenseSpace生成的场景不仅支持自由漫游,还支持实时交互和编辑。
比如进行城市生成,高度还原场景细节。

甚至有厘米级的重建精度,可通过实时渲染和互动带来超真实感的场景。
多源数据融合带来超精细化的清晰度和细节效果。
另外,格物SenseThings可以进行物体3D内容生成。
它能够良好支持复杂结构物体复刻,并做到光照精准复刻,材质完美还原。
以上是日日新SenseNova大模型体系带来的强大内容生成能力,不论在图片、还是数字人、视频上,直接打破了人类创意天花板,将重塑行业生态。
释放大模型这么多能力,商汤的底气在哪?

5年磨一剑,直指AGI

2023年,由AIGC及ChatGPT引领的新一轮人工智能热潮已箭在弦上。
其实,早在2018年,商汤就开始着手AI大模型研发。只不过,这个概念,今年才被炒火。
到现在,这家AI公司已经5年多的技术沉淀和实践经验。已经打造了CV、NLP、AIGC多个AI大模型。
2019年,商汤最先推出了10亿参数量规模的视觉模型,实现了当时业界最好的算法效果。
那时,商汤已经具备了千卡并行的系统能力,使用了上千张GPU卡进行单任务训练。
在2021-2022年,商汤还训练了百亿参数规模的超大视觉模型,这相当于千亿参数语言模型的训练量。
目前,商汤已成功研发了320亿参数量的全球最大的通用视觉模型。
该模型已经实现了高性能的目标检测、图像分割和多物体识别算法,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。
今年3月,商汤还开源了多模态多任务通用大模型书生(INTERN)2.5,有30亿参数。
商汤这家前沿AI科技公司,不仅有着深厚的算法积淀,最重要的是还有强大的基础设施——SenseCore AI大装置。
在急需算力的当下,商汤SenseCore AI大装置以5000 Petaflops超大规模算力和出色的并行计算能力,为大模型研发提供强大的算力基础设施。
现有27000块GPU,可输出5000 PetaFlops算力,能够以最大4000卡规模集群进行单任务训练,并可做到7天以上不间断的稳定训练。
算法,算力有了,数据怎么来?
一直以来,商汤在智慧城市、智慧商业等领域的长期耕耘,积累了海量真实世界的高质量视觉数据。
徐立表示,模型的能力应考量包括参数量和数据量。而参数量和数据量的乘积即计算量,即模型的能力可以用所依赖计算量来做标定。这就是新时代下,算法、数据和算力的新公式。
发布会现场,商汤基于「日日新SenseNova」大模型体系和AI大装置SenseCore,面向商业伙伴提供API。
其中包括图片生成,自然语言生成,视觉感知通用任务与标注服务,客户可以根据自己想要的内容进行调用。
在推进AGI布局上,商汤向所有人展示了大模型+大算力的战略布局。
未来,商汤还将继续推进「日日新SenseNova」大模型体系的建设,将AGI作为核心发展目标。
日复一日,在大模型研发实现AGI突破,让AI惠及每个人。




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存