产业观察:SISPARK企业加入“百模大战”?
今年以来,生成式人工智能持续火热,而其背后的技术支撑——大模型成了人工智能界炙手可热的“高频词”。据《经济观察报》记者统计,目前在国内已经出现了106个大模型,包括通用和垂直、开源和闭源等不同类型,由ChatGPT引发的这场大模型“军备竞赛”正在吸引越来越多的中国企业参与其中。
作为苏州国家新一代人工智能创新发展试验区的运营机构,SISPARK(苏州国际科技园)聚焦以人工智能为引领的数字经济产业。
在这样一次智能革命浪潮来临时,SISPARK相关企业都是以什么样的方式入局大模型赛道的呢?
据不完全统计,截至2023年7月,SISPARK相关企业已发布2个通用大模型、4个特定领域的行业大模型和2个基于大模型的业务产品。其中,讯飞苏州和云从科技的母公司发布了通用大模型;思必驰、智慧芽、企查查、百图生科等行业“独角兽”发布了针对细分领域的行业大模型;美能华、清睿智能等创新型企业发布了基于大语言模型的业务产品。基于预训练大模型的产品的频繁发布,凸显出越来越多的SISPARK企业正在试图抢占人工智能最新技术应用的制高点。
赋能千行百业
通用大模型是基石
在 ChatGPT 推出仅两个月后,月活用户就突破了1个亿,成为史上用户增长速度最快的消费级应用程序,这背后的推手就是通用大模型。
那什么是通用大模型呢?它为何有这么大的魔力?据行业专业人士介绍,通用大模型是生成式人工智能的“大脑”,通过海量数据的训练,使其建立起基本的认知能力和强大的泛化能力。
在智能涌现的时代中,通用大模型的适用性较广,够处理多领域、多任务,能够完成人类所能够完成的任何智力任务,因此成了众多科技巨头的必争之地。
科大讯飞星火认知大模型
2023年5月6日,科大讯飞召开讯飞星火认知大模型成果发布会,并在SISPARK旗下载体——人工智能产业园设置了分会场。据SISPARK企业——讯飞苏州公司总经理、讯飞苏州研究院常务副院长支洪平透露:“讯飞苏州并没有直接参与星火大模型的研发,但是讯飞苏州研究院有AIGC领域的布局,和大模型有基于plugin的文图生成的整合研发。”
“认知大模型已成为通用人工智能的曙光,我们有信心实现‘智慧涌现’。”科大讯飞董事长刘庆峰在发布会上激情地说道。
星火认知大模型拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
云从科技从容大模型
从容大模型能够实时学习并同步反馈结果,具备上下文学习能力,实现更好的交互性,特别在金融、游戏等交互场景,多轮对话技术在人机协同操作系统中会得到更充分地应用,从容大模型展现出面向C端市场的巨大潜力。大模型将带来内容和交互方式的变革,AI开始将内容和入口即时交互,同时开始像人一样思考和工作。
解决细分领域痛点
基于行业数据打造专属大模型
通用大模型的优势体现在一个“广”字上,广泛应用于各种人群和场景。但对于对精确度和容错率要求严格的应用场景,企业不需要通用大模型的“全能”能力,而更需要模型的精度和质量。因此,大模型商业化落地的关键是建立能够解决细分领域痛点的行业大模型。
“所谓的行业大模型,一般有两个类型:第一就是使用行业特定的数据,基于已有大模型进行fine-tuning , 也就是对于局部的一些参数做改动。还有一个类型是自适应LoRA模型,然后这个大模型能够对某个专门的行业能够做得更好一些,但本身也是可以能够回答其他的任何问题的。”清睿智能创始人朱奇峰在接受采访时表示。
思必驰、智慧芽、企查查等行业独角兽企业,积累了海量的业务数据,利用自身庞大的专业数据库进行预训练,打造自己的专属行业大模型。
1
思必驰——语音交互领域
2023年7月12日下午,SISPARK毕业企业——思必驰在苏州工业园区发布了拥有百亿级参数的通用大模型“DFM-2”(Dialogue Foundation Model-2),思必驰联合创始人、首席科学家俞凯在当天的发布会上称之为“相对大规模的行业大模型”。
△思必驰联合创始人、首席科学家俞凯
在思必驰看来,人工智能技术和大模型产品应用落地的主要矛盾,依旧为技术厂商的通用型技术与B端企业高度灵活的个性化需求之间的矛盾。通用语言大模型在行业应用中往往会面临着私域知识难包含、不准确,判别式任务精度及时效性不足,数据安全和计算可信问题,以及成本高、速度慢等问题。很难有通用的语言大模型能够把这些问题都解决掉。
思必驰则基于通用人工智能技术和自身在智能汽车、智能家居、消费电子、数字政企等不同场景的业务数据积累,不断发展完善自身的规模化定制能力和产品标准化能力,支持客户自主构建“千人千面”的个性化语音交互解决方案,实现了人机口语对话系统的“柔性批量制造”。
2
智慧芽——科技创新情报领域
2023年4月4日,SISPARK企业——智慧芽正式对外宣布其最新AI产品“智慧芽GPT”的新特性。“智慧芽GPT”是基于知识产权与研发创新场景开发的大语言模型(LLM)技术,其具备的AI能力将颠覆传统IP与研发人员的工作流,引领行业发展的全新范式。
△智慧芽GPT数据覆盖
三项基于该GPT技术的突破性功能将同步上线,分别是“专利检索专家”、“技术交底书助手”和“技术研发助理”。其中,“专利检索专家”能够为IP人员自动撰写专利检索式;“技术交底书助手”能够为研发人员自动撰写标准化技术交底书;“技术研发助理”则致力于为研发人员高效检索技术文档并提炼总结核心信息。
3
企查查——商业查询领域
2023年5月20日,SISPARK毕业企业——企查查在当天举行的江苏发展大会上发布了全球首款商查大模型“知彼阿尔法”。这款大模型是基于企查查在商业查询领域近十年可信数据积累后进行大规模预训练的成果,用AI技术赋能企信大数据创新。
△2023年5月20日江苏发展大会
企查查发布全球首款商查大模型“知彼阿尔法”
据介绍,相较于传统商查平台,基于知彼阿尔法商查大模型构建的产品实现了三个方面的变革。首先,在人机交互方面,它运用自然语言对话实现了复杂查询步骤,降低用户门槛,让用户能够以描述的方式提出需求。其次,在技术方面,它实现了秒级响应,将企查查企信数据整理归纳,呈现完整答案,并通过接入超算平台提升查询速度。最后,新增的"多轮对话"功能赋予商查平台逻辑思考能力,引导用户深入分析,充当用户的助手和引路人。这些变革使得知彼阿尔法商查大模型成为一款更智能、高效的商业调查工具。
4
百图生科——生物计算领域
2023年4月,百度创始人李彦宏牵头创立的生物计算平台企业、SISPARK企业——百图生科正式对外发布其“生命科学版ChatGPT”——由生命科学大模型驱动的“人工智能生成蛋白(AIGP)平台”。根据不同模块的输入和要求,该平台可快速设计和生成具有特定性质的蛋白质,有了AI大模型的加持,人工合成蛋白质的周期得以大大缩短。
据介绍,AIGP平台由百图生科组织近300位AI+BioTech专家组成的跨国技术团队共同打造,其背后的核心引擎是百图生科自主研发的的生命科学大模型xTrimo,该模型拥有千亿参数,可从跨物种、跨模态的生命信息中学习蛋白质构成,发现其功能如何相互作用、如何组合和调控细胞功能的关键规律。
具体业务场景落地
基于大模型打造小体量产品
大模型成本惊人难以入手,而行业模型虽然能更垂直,但每家企业的应用场景各不相同,具体应用上仍困难重重。基于大模型打造面向业务端的小体量产品则更加聚焦于具体业务,训练参数量也会相对小得多,可以在本地化部署的同时能够保证数据的安全。
美能化、清睿智能等创新型企业,选择在已有大模型的基础上,针对自身特定业务微调模型,形成针对具体业务的定制化产品。
美能华——小星助手专家系统
SISPARK企业——美能华结合大语言模型、智慧搜索和语义计算,推出了小星助手专家系统。与chatGPT基于互联网数据的答复相比,小星助手专家系统生成的AI助手的答案具有“可控”的特性,因为它的回答是基于专家的私域资料生成的,所有的答案都可以追溯其来源。这种可控性质使得AI助手的回答更加可靠和可信,避免了因为互联网数据来源的不可控性而可能带来的误导性答案。
△美能华AI法务助手
清睿智能——教学应用Aryn GPT
6月27日在苏州工业园区举行的2023全球人工智能产品应用博览会上,SISPARK企业——清睿智能推出教育行业第一个大模型系列教学应用Aryn GPT。作为基于最新Transformer模型机构,模型参数超过100亿的通用大语言模型,ArynGPT技术支持下的智能教练Aryn具备了通用人工智能的问答能力。她可以接受学生关于任何话题的询问和对话,人文、科技、天文、历史、生活常识她无所不能聊。多轮对话能力支持,让整个对话过程更加生动有效,在练习口语和听力的同时扩大学生各方面的知识。
△全国教育大会上ArynGPT亮相引起关注
展望未来:落地才是硬道理
从以上大模型的发布情况来看,SISPARK企业选择布局的基本上都是侧重行业应用的模型或产品。从AI for Science 到AI for Industries的转变,反映了企业技术实用主义在人工智能创新上的典型思路。
这与苏州建设“国家新一代人工智能创新发展试验区”(以下简称“人工智能试验区”)的思路不谋而合。作为人工智能试验区核心区,苏州工业园区正在持续以场景开放为牵引,以应用示范为突破,不断加快推动人工智能创新技术落地;围绕场景应用进行顶层设计和创新试验,构建出一套完整的人工智能产业发展新机制,打造出以“AI+制造”为特色,以“AI+医药”、“AI+金融”、“AI+文旅”为重点,以交通、环保、知识产权等领域为示范的“1+3+N”人工智能应用体系,加速场景应用落地,推动垂直产业深刻蝶变,继而实现人工智能赋能实体经济转型升级、实现高质量发展的美好前景。在这其中,各类大模型正在扮演类似于水、电、燃气供给的基础设施。
大模型是行业热点,但是在追逐热潮中应保持冷静头脑,量力而行。通用大模型的研发,对算力等资源消耗十分巨大,需要极高的资金、技术投入。
因此,体量较小的本土企业应该扬长避短,利用自身在垂直领域的既有优势,定向开发行业大模型,提高自己在原有业务领域的竞争力。
可以看出,SISPARK相关企业更多地选择从自身的行业细分赛道上的基础优势切入大模型赛道,正在成为大模型产品研发的新趋势,这也跟苏州作为中国乃至全球工业大市的属性密切相关,相信SISPARK企业在应用端和产业化方向发力,一定能够更好地在大模型赛道上有所作为。
编辑:黄玥
校对:田硕勋
审核:肖楠
企业动态丨云创智行新品亮相深圳
Chat@SISPARK丨集成电路设计全链条服务推进研讨会
EDA及IC设计服务专场在SISPARK举办
企业动态丨苏州新添ATR智能金融联合实验室