查看原文
其他

2024科大讯飞全球1024开发者节刘庆峰演讲实录来了!

科大讯飞
2024-12-11

10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞董事长刘庆峰公布讯飞星火大模型应用成绩单,获得多项第一,并发布讯飞星火4.0 Turbo。与此同时,国产超大规模智算平台“飞星二号”正式启动。

大模型发展进入新阶段,科大讯飞正在引领大模型规模化应用时代,面向未来,刘庆峰认为人工智能产业发展有五个关键词:顶天立地、自主可控、通专结合、端云联动、软硬一体。


刘庆峰说:“坚持这五个关键点,我们的人工智能就有大未来,就能真正地解放生产力、释放想象力,改变产业格局和竞争格局,带来科研范式的变化,带来各行各业的变化,最重要的是满足老百姓对美好生活的期望!这就是我们未来的发展方向。”


以下为刘庆峰演讲实录:



尊敬的各位领导,各位院士专家,各位企业家、开发者,女士们、先生们,还有线上的朋友们,大家好!

非常高兴大家再一次来到世界声博会暨科大讯飞全球1024开发者节。


在过去的两年中,以大模型为代表的通用人工智能开启了一个全新的时代,而这个时代的大幕才徐徐拉开。今年的诺贝尔奖、物理学奖、化学奖都颁给了人工智能强相关的专家,一个是AI for Science ,一个是Science for AI,“人工智能改变科研范式”正成为科技界的共识和梦想。


科大讯飞从星火大模型发布的第一天起,就强调“解放生产力,释放想象力”的理念。今天,大模型的发展不仅在通用底座能力上不断进化,而且在长链条逻辑推理、思维链能力以及多模态上不断发展。


今天是一个通用模型和专用模型相结合——“通专结合”,端测模型和云端模型相结合,软件和硬件相结合的、全新的大模型落地时代。本次,讯飞在大模型底座上不断前进,发布讯飞星火4.0 Turbo;展现多模态交互是怎样从超拟人语音变成超拟人数字人,实现语音、视频、图文联动的全新多模态交互的;也将展现讯飞在多语言大模型上是如何给世界提供第二种选择的,我们将首发除中英外8个语种的全新多语言大模型;另外,也将展示大模型是如何在工业、教育、医疗以及各个民生场景中落地的。


大模型发展新阶段
AI应用正日益进入场景化深水区


AI应用正日益进入场景化深水区。今年1024科博展,56个合作伙伴和科大讯飞研究院以及讯飞各事业部的产品团队一起给大家呈现精彩纷呈的应用落地产品。


给大家看几个例子。


第一个,科大讯飞的语音翻译技术已经拥有80多个语种,覆盖了全世界200多个国家和地区。最近我们把技术跟硬件进一步深度结合,继讯飞翻译机之后,今天正式发布科大讯飞多语种AI翻译透明屏。



科大讯飞多语种AI翻译透明屏的作用是什么?合肥正在成为新一线城市,包括大众在内的国际企业也不断增加在合肥的研发布局。如何让国际人才(比如德国的工程师、科研人员)留在这里,让其子女有更好上学的地方,有更好的医疗条件?他们到医院就医问诊时,能不能用外语自由交流?科大讯飞多语种AI翻译透明屏,把讯飞的麦克风阵列、透明屏显示技术以及翻译技术整合在一起,可以实现多语种的面对面交流,你在这边说德语,我在那边说汉语,都可以看到翻译的文字,交流无障碍。

第二个,在工业场景,除了做AI办公、AI会议、AI客服,还能做什么?我们用AI助力汽车的整车检测,目前已迈出非常关键的台阶。我们从空调检测做起,在合肥海尔(公司)的生产线上,空调外观怎么样?声音是否超标?遥控器红外、语音交互是否合格?AI设备能自动给出检测结果,大幅提升效率、降低成本。年初到现在,我们已经完成了300多万台空调全自动检测。再到汽车检测,今年科博展上大家也能看到,我们能够实现智能座舱人机交互效果的全自动评测,可覆盖汽车车控、导航、媒体系统等1383个功能点,满足90%以上的智能座舱人机交互场景全自动检测需求。AI汽车检测还能助力国内汽车厂商出海,我们所有检测能力都是多语种的,例如人机交互检测,原来需要数十天的检测任务,现在只要1个人做两-三天就能完成,测试提效10倍。



第三个,是针对每个孩子的产品,基于星火大模型打造了软硬件一体化的儿童机器人——阿尔法蛋围棋机器人。我们原来有一个超九段的围棋机器人,给我们拍了相关推荐视频的柯洁(中国围棋九段棋手)明确说过,这个机器人确实比他强。现在我们通过软硬件一体化创新,成功实现降本,让围棋机器人能够走进千家万户。它能够像人一样对弈,万一对方悔子、耍赖,都可以自动调整应对。为什么?因为有大模型矩阵式的全程记录。而且,原来你是三段水平它就是四段,你是五段它就是六段。现在它变得更加人性化,你是三段,它可能是四段也可能是二段,让用户更有娱乐体验。


AI技术正在不断以大家喜闻乐见的、能接受的、更加具备工业鲁棒性的形式进入到每一个领域的深水区,不断地往场景、实用发展。


还给大家看一个非常人文的、有人性关怀的例子。大家可能都有印象,当年表演《千手观音》的邰丽华团队就用了科大讯飞的技术。不久前,在联合国教科文组织总部举办的庆祝中法建交60周年暨中法文化旅游年活动中,讯飞的技术又为残疾人艺术团提供了很好的服务,不仅进行现场翻译支持,而且通过语音识别技术让听不见声音的聋人“看见声音”,通过语音合成让看不见文字的盲人“听见文字”。

今天,我们又进一步提升,与华为联合研发了声音修复技术。这张照片里的是中国残疾人艺术团一个非常优秀的舞蹈演员魏菁阳,她在几年前推出舞蹈作品《我的梦》,和当年的《千手观音》一样引起了巨大震撼,大家都非常喜欢。不过她因为先天的听力问题,说话不够流畅,但是她愿意对外沟通交流,我们来听听她说话是怎样的。



今天的AI技术不仅赋能工业、科研这些重要场景,也可以帮助到每一个特别的你——无论老人、孩子,还是特殊群体。过去一年,科大讯飞取得各方面的进展,既是研发和产品的努力,更多亏了各个生态伙伴、开发者们的全情投入。

我们可以看到,讯飞AI开发者大赛参赛情况再一次创新高。今年有来自全世界14个国家348个城市的35000多支团队参加开发者大赛。原本我们的赛题每一年都在不断地变多,但在去年决定,就放108个赛道(包含72个算法赛、36个应用赛)。围绕这108个赛道,来了35000多支开发者团队,其中围绕大模型直接相关的参赛团队达到了9000多支。



为了使比赛里的各种应用创新,能够实实在在地应用,我们联合了清华大学、中国科学技术大学、中国农业大学等30所科研院校等44家企业、机构发布了赛题,使得开发者第一时间就能与顶尖机构、企业对接,成果能够更快地应用落地。


今年讯飞星火杯大模型应用创业赛也加入讯飞AI开发者大赛中。讯飞星火杯大模型应用创业赛原本是针对中国高校的大赛,也是团中央唯一点名支持的大模型比赛,今年有来自全球533所高校的1656名大学生开发者加入到这个比赛中。参加活动的大学生数量反映了活动是否有前景和希望。比赛前20强中,我们可以看到很多耳熟能详的名校,包括部分海外学校。



过去一年,在全国产算力底座的支持下,科大讯飞的大模型技术到底发展得怎么样?大模型只是一个底层技术创新,还是真的能够与应用对接?现在给大家看一下我们这一年来的成绩单。



特别提一下智能硬件,今年1-9月,讯飞星火赋能的智能硬件GMV同比提升50%,总销量增长50%。截至10月23日,今年的“双11”大促我们全渠道GMV同比增长280%,且正处于一个非常重要的快速增长阶段。



讯飞星火App是唯一一个基于全国产算力平台训练出来的大模型App,安卓下载量达2亿,苹果iOS评分4.8分,是可下载大模型App中的第一。



来看具体应用,PPT制作是用户使用最多的功能,是最受大学生欢迎的智能文档工具;视频制作有437万的创作者加入其中,是中国信通院评选的首批“卓越级”可信虚拟人平台;新媒体运营,已有上千万的新媒体制作出来的文案、图片发布,文章质量由第三方评价为行业质量第一,平均阅读量提升了24%。


我们一直说讯飞星火大模型的基本理念是要“解放生产力,释放想象力”。今天大模型的应用方向正在百花齐放——有人专注娱乐,有人专注游戏,有人专注社交,而我们最专注的是学习和办公、赋能工业和科研。所以,我们79%的使用场景围绕办公与学习,现已成为白领人士和大学生的首选AI助手。


讯飞星火4.0 Turbo
国际14项主流测试集9项超越,提效50%



今天讯飞星火4.0 Turbo正式发布,相比较在今年6月27日发布的讯飞星火4.0,有哪些新的变化?



首先是底层能力的全面提升。在做大模型之前,科大讯飞与认知智能全国重点实验室、中科院人工智能产学研创新联盟、长三角人工智能产业链联盟,共同定义了本轮通用人工智能的七个主要维度的能力:文本生成、语言理解、知识问答、逻辑推理、数学、代码和多模态。根据鲜活的真实数据背靠背测试,讯飞星火4.0 Turbo在这七个能力上已经全面超过了GPT-4 Turbo,数学、代码能力已超越GPT-4o。最重要的是,要让大模型更深入地进入到各种应用场景,它的单次使用效率,训练速度以及成本是非常关键的。我们这一次,不仅是性能提升,效率也提升了50%。


在国内外14项中英文主流测试集中,讯飞与美国现在最重要的三个主流大模型相比,已有9项实现了超越。



特别想给大家看的是讯飞星火在数学方面的进步。数学能力是工业、科研这些硬核场景的基础。今年北京中考之后,相关教育协会和三方媒体对中国大大模型和GPT-4o等国外模型做了测评,在这些测评中,讯飞星火大模型都是第一名。



最近特别受关注的是9月底发布的OpenAI o1,它会带来更多超常的思维链、有数搜索以及自我反思评价等等,这些技术我们都已经验证完成,预计今年底可实现类o1的高难度数学能力显著提升,在产品中实现。


代码能力也非常重要,它是连接工业、连接虚拟和现实世界的重要桥梁。今年6月27日发布的讯飞星火4.0的代码能力跟GPT-4 Turbo相比还有6个点的差距。而现在,无论是在国际上公开的HumanEval测试集上,还是真实应用场景上,我们都已经实现了超越。



代码和数学都是硬碰硬的真本事,容不得半点主观判断和包装。针对每一个想要在自己的电脑上随时随地生成代码、节约成本、提高效率的个人使用者,我们还专门推出了7B版本,很小的模型装在电脑上,就可以本地运行。



定义多模AIUI标准
首发语音视觉虚拟人交互“三合一” 


大家还很关注多模态能力,关注具身智能。今天,在万物智能时代,不仅是语音,整个人机交互领域都将上一个全新的台阶。


我们已定义了万物智能时代的人机交互标准,叫AIUI,并且通过了国际组织的认定,已经在去年5月正式发布了国际标准,包括远场高噪、全双工、多语种多方言等多个方面,这次又升级新增了多模态、超拟人、个性化。



多模态原先主要做的是语音和图文,现在要进一步升级到视频,而且是连续视频,手机、机器狗、汽车等终端在任何环境中可以自然流畅地识别视频流,新增超拟人,不光有声音还有形象,而且还能个性化,能够定义我们自己的特征。


当我们从语音交互拓展到音视频流的实时多模态互动的时候,就可以使它的情境感知更全面。因为不光有语音,场景、文字、物体、姿态、着装都可以看到,任务理解就会更精准;因为有语音、有手势、有行为,还有情绪,就可以使得我们的游戏、学习、购物、美食、知识问答、绘本伴读更有趣;更重要的是,在具身智能机器人以及汽车等越来越多的领域,可以实现全新的人机交互的升级,做很多原来做不成的事。



只与机器进行语音交互还不太过瘾,所以,我们首次发布超拟人数字人此前,科大讯飞与央视新闻合作打造了虚拟人AI记者助理“小白”, 模仿了白岩松。央视用人工智能给《创新中国》这个纪录片配音,是中国乃至全球所有国家级媒体中第一次用AI做配音,新华社、《人民日报》也都与我们合作。如今,我们又更进了一大步。

它提升在哪些地方?原来我们的虚拟人是给一张照片就可以有嘴型;今天,我们把嘴型、表情、动作全部贯穿起来,所有的表情动作整体化地用我们的大模型技术自动生成,而且实现了表情动作的语义贯穿,统一文本、语音和表情,实现跨模态的语义的一致性。



一段视频展示下我们的超拟人数字人有多生动。大家看完肯定觉得不解渴,想要看一下真实的使用情况。接下来,我们有请大家的老朋友,也是我们科大讯飞研究院的院长刘聪,给大家来真机演示一下。


大家可以看到有了刚才这些能力,当我们跟手机交互、跟各种设备交互的时候,有个虚拟人在后台就会觉得生动很多,似乎远端有一个专家、一个朋友在进行指导。在生活中,基于视频流的全自动沟通,也会让我们的各种应用情境和场景需求得到极大地满足。


今天还有一个彩蛋要给大家,那就是个性化定制,用一张照片就可以生成自己的虚拟人。之前发布过可以定制自己声音的能力,一句话就可以复刻自己的声音。那我们下面再请刘聪给大家再做进一步的展示。



可以看到,科大讯飞一直在不断朝着“打造每个人的AI助手”努力,从声音的一句话复刻,刚才说到的自然度4.2分,这是什么概念?4.0分就是真人的水平;播音员最好的是5.0分,绝大部分是4.5分左右;我们现在达到4.2分的声音复刻。只要一对比就能看出来,今天的超拟人形象技术具有明显的优势,我们还有各种人设可选。


今天,在1024现场,我们正式把超拟人数字人的能力对外开通,所有的开发者、行业伙伴都可以申请使用,我们也会给不同场景下的需求提供最高性价比的解决方案。



首发星火多语言大模型
 为世界提供第二种选择 


刚才看到的是超拟人数字人和我们重新定义的万物互联时代的多模AIUI。这背后是科大讯飞特别重要的看家本领之一。由科大讯飞作为第一完成单位的“多语种智能语音关键技术及产业化”项目,今年获得国家科学技术进步奖一等奖。这是中国人工智能领域过去10年以来的首个国家科学技术进步奖一等奖。


我们不仅要让语音识别在安静的手机办公输入场景中做好,更重要的是在各种高噪声的工业场景和复杂的生活场景中做好。我特别高兴地给大家报告,科大讯飞在今年9月份国际最权威、最难的高噪场景的语音识别大赛CHiME(Computational Hearing in Multisource Environments)再次获得冠军。这个比赛每两年一次,由谷歌微软等作为主办方举行,我们已经连续五届获得冠军,我们今年领先第二名的优势比两年前进一步扩大,在工业领域、在复杂场景上的水平跟国际同行相比越来越领先,开始逐步进入无人区。大家刚才看到的我们跟华为联合做的声音修复技术,也是最领先的。



我们还首次实现了中国方言全部地级市全覆盖,包含全国288个地市共202种方言。当然这还不够,我们说的是地级市的方言,比如我的家乡宣城为例,泾县不同乡村方言都不一样,我们还要不断地丰富更多的民族语言,更多更细的方言领域。但是,今天为什么能做到202种方言且技术水平处于国际领先?因为我们的多语言多方言的训练方法和大模型技术以及配套标注训练的自动化工具全球最领先。



今天还有一个特别重要的事情,我们首次发布星火多语言大模型。大家都在说,大模型会彻底地改变产业形态和竞争格局,会带来科研范式的重大变革,决定一个国家未来的安全和在全球的话语权。大模型越用越聪明,是自我迭代的,就像PC和互联网诞生一样,会成为社会最基本的底层能力和工具。如果中国的大模型厂商都只做中文,全球没有第二种选择,我们就必然会被锁在中国范围之内。所以,科大讯飞作为中国唯一的认知智能全国重点实验室承建单位,有使命、有责任要做多语言大模型。经过10个月的努力,科大讯飞在有限的算力下,通过算法的提升,尽量用更少的数据训练出更好的效果。



星火多语言大模型,首批除了中英文之外,还新包含了俄语、日语、阿拉伯语、韩语、法语、西班牙语、葡萄牙语、德语这8种语种。这8个语种的整体效果已经达到了GPT-4o水平的96%,相当于我们在今年年初推出来的讯飞星火V3.5的水平。GPT-4o在不断地提升,我们也在不断提升,科大讯飞有部分语种已经在通用能力上超过了GPT-4o。比如说英语,大家可以看到讯飞星火是81.9分,GPT-4o是84.1分,是在所有语种中最好的,因为英语的语料最多,应用也最多。今年高考之后,三方媒体测试了各模型语文作文写作能力,讯飞星火大模型是第一名,其英语写作和各项能力在国内的所有大模型中,领先优势是非常显著的。



本次我们发布多语言大模型,不光要在通用底座能力上提升,还要能够真正解决社会刚需。在汽车、家电、办公以及翻译这些典型领域中,真实效果已经超过了GPT-4o(当然也跟我们的训练策略和优先次序有关)。这8个语种首次推出,今天正式对外开放,所有的开发者和行业伙伴都可以介入使用。现在有很多国家和地区都希望在大模型基础上至少有一个备份,或者有人帮他做自己的主权大模型。



一段视频展示下,依托我们现在正式开放的星火多语言大模型,怎么在办公本上把一段录音变成摘要,重新进行文案创作;怎么把翻译机这个翻译工具变成一个随时随地的翻译、导游和咨询;怎么把汽车上丰富的大模型能力向全球提供。



今天,大模型已经进入到关键应用落地、更复杂的深水区。所以当我们推出一个新的模型,一定要有对应的场景,让大家看得见摸得着。下一步,我们不光是要把这8个已经开放的语种能力不断提升,对标全球最好的水平,还要针对真实应用场景做到全球最好,并且不断扩大我们的语种范围,我们一定要代表中国给世界第二种选择。

短片最后看到的是汽车。今天,奇瑞控股集团有限公司党委书记董事长、总经理尹同跃也来到现场。奇瑞一直把科大讯飞的核心技术应用在车上,把多语种技术推向全球。目前,我们智能语音交互的装配量已经超过了6000万辆车,其中包括了大量前装出口。去年,中国汽车出海500多万辆,多语种技术很多是由科大讯飞提供。我们把大模型进一步跟汽车结合,在奇瑞星纪元上率先使用。去年讯飞星火V2.0发布会上,我们与奇瑞联合发布了在星纪元上的应用,然后越来越多的车企都开始与科大讯飞合作,包括广汽、江淮、大众、长安、长城、一汽等。现在,无论是语音的汽车端使用量,还是大模型的市场占有率,科大讯飞在汽车行业都是非常领先的。


给大家看一个数据,之前我们用智能语音技术和汽车交流时,主要是导航、命令、控制、音乐等方面,每天交互7次左右。有了讯飞星火大模型加持后,汽车交互的基础应用提升了,且增加了很多新的能力,如用车助手、旅行家、美食家、儿童故事等越来越丰富的场景,整个交互次数提升了一倍还多,从7次到18次。这个18次的提升都是实实在在的、可以带来全新的功能体验及服务价值。汽车在无人驾驶时代一定会成为一个移动的办公和娱乐场景。大模型在前台能听会说,后台能理解会思考,可以带来全新的车类增量空间。



科大讯飞不仅为汽车合作伙伴提供各种车内的交互,还通过智能体平台打通了重要的外部信源:例如汽车里面点咖啡支付,就是和支付宝打通;再比如和爱奇艺,我们把很多内容服务在交互沟通中通过智能体关联推荐给到用户。通过智能体平台,所有的开发者们都可以和大模型链接,便捷地完成各种应用创新,开发出更多好玩的、有价值的智能体,从而形成共同的智能体生态,来服务于汽车厂商——扩展汽车空间中给用户服务的范围和内容。



很多车主在开车过程中,遇到网络不通,大模型在后端的使用成本也很高,有时用户还有个人隐私的需求,做出一个汽车的端侧模型放在本地是否能解决这些问题?


今天,我们首次发布汽车端侧星火大模型。这个模型到什么程度?现在主流模型一般是175b的,也就是1,750亿的模型参数,GPT-4是上万亿的参数,我们现在这个端侧模型只有1.3b,13亿的参数比现在通用模型降低了两个数量级。在刚才的汽车场景展示中,实际效果只下降了1%,响应时间是40毫秒,这是什么概念?正常人1秒钟可以说3到4个字,每说一个字都要100-200毫秒,现在响应时间只要40毫秒——即使在一些复杂场景,需要调试信源,用到后端,端云融合也降低到1.3秒——使用非常丝滑。



技术效果和响应速度都是全行业领先的。今天虽然是汽车端测星火大模型的首发,但是已经开始应用,从今年四季度开始,奇瑞、广汽、长城都已经有明确的车型会上线,并陆续上市开售。这是一个真正在汽车领域让大模型“能听会说、能理解会思考、能看会认”的非常重要的里程碑。



大模型赋能民生刚需

发布教育、医疗、司法、政务等领域AI助手 


大家都知道科大讯飞是有教育情结的。我们一直强调:教育绝不是注满一桶水,不是填鸭式教学,而是要点燃孩子心中求知的渴望。我们一直跟中国教育科学研究院(以下简称中国教科院)合作,今天我们也邀请到中国教科院院长李永智来到现场。我们一直强调,用人工智能赋能教育,首先是要用基于最近发展区的学科知识图谱技术,来培养孩子应用知识的实际能力;能力之后是基本素养的培养,这就需要根据大模型最新的长链条逻辑推理以及思维链能力并结合专家的教育理念,优秀教师一线的教学经验,全学科、跨领域的知识以及孩子们学习过程中“问题链”的解析,最后形成学习能力链,从而精准地定位孩子的薄弱环节,找到最近发展区,让孩子学得更轻松、更自信。同时,开始启发式讲解与探究式学习,让孩子学会主动提问。科学研究表明,学会提问就成功了一半。



从知识到能力、到素养,大模型在不断地赋能教育,这中间既要有多年的数据积累,更需要有技术不断地进步,还有实用过程中的打磨。



在今年1月9日,我们与中国教科院以及华为达成战略合作,在讯飞星火教育大模型的基础上开展“基于生成式人工智能的中小学智能教师示范研究”,以老师为抓手来解决教育人工智能赋能的根本问题。华为提供算力,讯飞提供大模型,教科院提供教学理念和指导。


今天,我们首次发布基于“问题链”的高中数学智能教师系统。稍后,教育专家、中国教科院基础教育研究所所长李铁安会做专题的底层逻辑分享,也会有相关产品的演示。



我们还会进一步邀请全国的优秀教师参与共创。今年上半年,中国教科院已经请了首批上海、合肥以及重庆代表东、中、西部最优秀的数学教研员在科大讯飞联合研发,后来拓展到12个区域,400多位优秀教师、50多位教研员。我们要进一步拓展到更多区域,让更多的教师参与共创。未来的教育,一定不是机器学习现有的作业题目、考试,而是学习老师的思维以及优秀教师讲课的底层逻辑。



10月25日,在第84届中国教育装备展上,科大讯飞将正式发布软硬件一体化以及最新的教师助手——讯飞星火智慧黑板2.0。我们定义未来的智慧黑板,在更安全的国产算力基础上,助力教育更公平、教学更高效。无论是坐在课堂的中间,还是后排或两侧,都能看得清、听得见。



除了讯飞星火智慧黑板,科大讯飞AI学习机也是大家喜欢的学习工具。基于人工智能的精准学,我们把学校内部的能力同步到学习机上,实现了2570年前孔子的话:“有教无类,因材施教”。基于真实数据的学习、全球领先的推荐技术以及大模型最新的基于数学思维链的能力,科大讯飞在学校内部已经实现了个性化的作业,分层又精确。


同样知识的学习,练习量可以减少45%,相当于省掉一半的题目;作业时间减少28%,留下来的是更难、更适合且应该掌握的作业;学完之后,错题解决率提升20%,孩子学得更好,就更有自信了。



今天,我们把这个能力开放在科大讯飞AI学习机上,首次发布AI作业过滤器以前是因材施教的推荐,现在是主动的AI筛选。


家长也好,老师也好,都希望孩子能够真正减负,可以省掉无效、低效、重复的学习,过难的题目可以等他把前期知识点掌握后再去学。但是没有科学的办法,大家都不敢轻易给他减负。现在有了科学的作业过滤器给孩子减负,老师看到后更放心、家长更安心。该功能预计在11月中旬在部分机型上灰度上线。


面向医疗领域,科大讯飞一直希望能够用人工智能打造每个医生的诊疗助理,每个居民的健康助手。在过去一年中,我们又取得了非常大的进展。


首先是智医助理。我们帮助村医工作室、乡镇卫生院、社区医院来提升基层医生的能力水平,减少错诊、误诊和错误用药。我们已经累计提供8.6亿次的辅助诊断,提醒不合理处方8100多万个,如不需要吃的是无适应症用药,不能在一起吃的是危险性用药。此外,有的药孕妇、孩子不能吃,有的药有基础疾病的人不能吃,我们都能及时提醒基层医生。


现在,我们从基层医院又进一步推到了等级医院,包括中国科技大学附属第一医院(安徽省立医院)等省级医院;以及北京协和医院、四川大学华西医院等国内顶尖医疗机构,累计提供了5000多万次AI患者服务,6亿多次的疾病诊后随访——患者做完手术回到家,不知道自己的状况是否合适,需要及时向医生反馈并咨询相关康复问题,AI直接帮助你沟通,跟踪诊后相关康复情况,给出相关建议。中国每年有2.5亿次出院患者出院后脱离管理,我们的AI能力能把这些工作真正落到实处。

再看个人健康助手讯飞晓医App,手机上可以下载。看病前可以询问讯飞晓医App进行医疗信息快速查询;每年6亿-7亿人服用的药,45%是非处方药,服用前咨询讯飞晓医App,避免错误;体检报告上传讯飞晓医App,可以提供体检报告解读、健康档案管理等功能。截至目前,累计下载量1500万次,1.1亿人次咨询。讯飞晓医App目前已有98%的好评率。


今天,我们在此基础上进一步提升医疗大模型的能力,医疗海量知识问答、医疗复杂语言理解、医疗专业文书生成、医疗诊断治疗推荐、医疗多轮交互、医疗多模态交互等六大核心场景能力显著提升并在业界持续领先。



我们下一步要推荐的,不是大模型全自动做诊疗,而是人机协同。我们要从更有温度的人文关怀出发,持续学习顶尖医生的能力。


除了辅助问诊以外,大家一直希望我们进一步加大医学影像的AI研究。中国的影像科医生非常辛苦,总数也相对不足,每年有40%影像数据的增长,但是影像科医生只增长4%;拍片的质量参差不齐,信息不完整率接近40%,扫描不规范占比1/4,有的是设备的问题,有的是基层医院医生的能力水平和训练度不够的问题。根据《中国公共卫生》的相关统计,2018年重复的医学影像检查发生率为41%,实际上如果有很好的技术支撑,则不用再做检查,其中有接近30%的重复率可避免,在国家卫生健康委、国家多部委联合下文后,重复的医学影像检查发生率有所好转,但依然在30%以上。



在安徽,我们用人工智能率先实现了中国目前为止应用规模最大的影像云平台。安徽省卫生健康委、医保局用非常开放的、拥抱新技术的态度,推动全省所有的公立医院全部联网,使得在全省任何医院的一次检查、全省通用,不用再重复检查。一次检查一辈子保存,可以随时查看变化情况。为什么能做到?因为我们能够用人工智能判断检查质量、拍片质量是否达标,我们也能用人工智能帮医生进行相关辅助诊断。


安徽影像云平台不光让老百姓可以实现一次检查全省通用,避免重复被放射的损伤,而且可以对比前后康复情况。目前,平台已接入1967家医疗机构,累计远程影像会诊811万+次,服务医生患者超7000万人次,影像数据归档量超过1亿,日均新增影像10万+,这是一个对患者、对社会、对医院都非常有帮助的技术。



讯飞星火医疗大模型的能力结合安徽省医学影像云平台的海量数据,在此基础上,我们今天正式发布讯飞星火医学影像大模型。



在安徽省卫生健康委的指导下,随机抽样安徽省最优秀的1000多名影像科医生,与人工智能比较影像质量的判断。比较结果是:单个技师的准确率是81%,技师们联合诊断的会诊准确率是91%,人工智能是92%。


AI助手加入,可以帮助诊断准确率从76%提到90%。接下来,请看相关演示。


今天医院90%的数据是影像类数据,能否让最顶尖的影像科医生提质增效?能否让基层医生具备顶尖影像科医生的能力,而且能够把影像科医生和具体诊断的临床医生结合起来?多模态能力的提升、数据的积累以及专业医疗大模型的提升,使这些成为可能。


今天,讯飞医疗将与安徽省卫生健康委以及认知智能全国重点实验室联合发布全谱系全模态医学影像大模型开放合作计划。一张影像可能包含共计近300种不同类型的病种——通过大模型的能力,我们可以寻找到每一种可能性。当然,我们想要进一步做深做透,需要全国更多优秀医生加入进来。



我们决定向全国所有优秀医生开放算力以及大模型的基本能力,大家可以调优、训练;也对相应数据脱敏后开放,供大家训练,形成共创模式。本次科大讯飞1024开发者节与原来最大的不同是,不仅有技术的开发者进来,还有专业人士通过我们的工具加入洪流中来。我们在此正式邀请全国医生科研团队参与共创。



我们还利用人工智能技术让司法守护和政务服务公平惠及每个百姓。例如最新发布的星火法律大模型2.0,可帮助加快庭审笔录制作,简易文书的制作效率可以提高10倍,复杂文书可以提高3倍,法律立案检索和相关法条咨询等功能都上了新台阶。



政务大模型也已在安徽使用,极大提升基层服务能力,使得老百姓办事审核时间缩短80%,登记效率提升5倍以上。今天,我们发布星火智办一体机,集成到十几个重要仪器设备,包括高拍仪、身份识读、指纹识别等,集成到一个窗口,后台可以集成工作人员的4500多个标准化事项。一个礼拜部署,两个礼拜就可以上线。这就是把大模型真正的服务能力软硬件一体化,极高地提升了整个社会运转和便民惠民的水平和能力。


AI赋能企业
讯飞星火正成为央国企的首选 



科大讯飞是今年1-9月份大模型市场中标数量、中标金额第一的厂商。 在企业领域,我们一直追求的是,打造每个岗位的AI助手、每个员工的人工智能助手。最近越来越多的央国企客户在使用我们的大模型底座,包括近期发布的三个通用大模型:联手中国石油、中国移动、华为共建的昆仑大模型,携手中国海油、中国电信打造的“海能”人工智能模型,携手中国绿发打造的泰山大模型,全是科大讯飞的大模型底座支撑。除了央国企以外,很多行业头部企业、地方明星民企也都在使用科大讯飞的大模型能力。



在众多企业伙伴中,凭什么科大讯飞能够建立一个企业真正能用的大模型?企业部署大模型,首先要建算力:要么自己搭建,要么去租。讯飞联合华为搭建了中国首个万卡的国产算力集群,我们熟悉各种算力,可以搭建最好的算力平台。有了算力,我们要整理数据。能否更高效、高质地整理数据,整理完数据能够训练模型?能否建立各种尺寸的模型满足企业的应用,落地到真正看得见、摸得着的场景?同时,企业大模型是否能够政治安全、应用安全,通过网信办备案以及各部委的基本审查,最后能够真的在运营中产生可以用统计数据证明的应用成效?在此想说,为什么我们中标数量第一,而且中标比例越来越高?因为很多企业只能做到第三步——训练模型,后面的几步与我们差距很大。即使能做到,他们实际上整理数据和训练模型的能力,与我们差距也很大。



给大家看几个具体数据。整理数据和训练模型是关键应用的第一步,我们有了专门的数据清洗工具链,这是基于大模型底层能力学习出来的。大家可以看到,我们自动清洗的数据合格率是96.2%,这是什么概念?最近有几家企业告诉我们,他们用了其他家的大模型,合格率只有30%~40%。用了这个工具数据清洗的效率提升24倍,再训练大模型。我们建立了SFT数据工具链,问答对自动构建合格率到82%。自动构建后,人工再审查,人机协同可以把效率提升到90%。



央国企客户数据显示,原先至少需要1—2个月时间来构建50万条高质量数据,现在两周能完成。我们建立了场景优化工具链,5大类13种场景可实现自适应模板匹配训练,平均效果提升30%;我们还有多模态知识零采编系统,企业应用中的40%是与自己外挂的知识库有关,例如企业科研的各种数据,工业的各种维修数据都不是大模型的底层数据,需要随时随地通过外挂知识库学习。这一种知识的采编原先非常复杂,很多企业因此被挡在了知识应用之外,在企业级应用中占比40%,而现在,我们自动采编工具达到了专家水平,可以做到93%的合格率,远超同行。知识学习过程中,知识采编效率提升5倍。


为什么我们能够成为行业第一?因为我们让大模型真正落地场景,整体数据和训练模型效率成倍提升,实用性大幅提高。



我们已有20多个行业大模型,覆盖300多个场景,其中有企业专用的,也有公有的。由科大讯飞牵头,安徽省大力支持的羚羊工业大模型荣获“2023年工业大模型先锋榜TOP20”榜单第一。每个企业搭建后,我们都会找到很多可复用的给其他企业。很多央国企头部企业在这个行业做完后,可推广给全行业,也可以不同行业相互借鉴。因此,科大讯飞在应用场景中已经形成了可以相互借鉴和复用的规模化效应。


什么叫“领先一步,超前一路”?今天,我们把央国企能力投射整个行业,投射未来,让所有企业节约成本,大幅提高效率,形成自我造血、良性循环、工具链,不断地优化基本收入来源和机制。



现已有越来越多央国企依托讯飞智能体平台举办AI大赛,让员工自己拖拖拽拽就可以形成财务、维修、客服、营销等各种各样的智能体。8月9日到9月30日,由国家能源集团举办的“国家能源杯”大赛中,共126个队伍参赛创新孵化了54个场景智能体;宝钢集团也举办“AI挑战赛”活动;华润集团也举办了“第五季黑客马拉松”活动,全是使用讯飞智能体平台让员工自己来孵化AI助手,且创新全局通用。今天,我们也邀请全国所有开发者参与这样的共创,针对性场景做好后,直接进入到科大讯飞场景库,可以提供给所有央国企,成为全国通用的能力。这也是科大讯飞独特的、奉献给开发者的核心能力和资源。


AI for Science成为科技发展新引擎

赋能科研是讯飞星火的重要使命 



科研能力代表一个国家未来的根本发展能力。今天的AI for Science,从真正落地角度来说,有三个台阶:一是科研基础工作提效,比如进行论文调研,最新国际前沿,迅速调研呈现综述报告,帮助基层科研人员形成代码助手,提高效率,让更多优秀的年轻人从简单重复的科研工作中释放出来,做更有想象力、更有创新的工作;二是科学任务建模,基于深度神经网络对科学任务进行端到端精准建模;三是科研方案设计,利用认知大模型学习领域科学知识并对科研实验方案进行辅助设计,进一步自主创新更多方法创意和灵感。



第一个台阶的例子,星火科研助手已在中国科学院下属116个院使用,2.0使得科研成果的调研效率提高10倍以上,论文研读效率的有效率超过90%,极大提高了科研工作人员的效率和学习进步水平。这次,我们又进一步升级了论文预审和推荐能力。讯飞星火的代码能力已在全国332所院校开通使用,学生主动提问增加了一倍,教师辅导工作量减少了80%。



再说第二个台阶的例子,使用人工智能助力当前科研攻关。举几个例子,一是跟中国科学技术大学生命学院刘海燕教授团队基于条件扩散生成模型的蛋白质主链设计,把原来需要6个月的实验提速到只需1天完成,已成功设计了48个自然界不存在的全新蛋白质;二是我们联合中国科学院动物所李鑫团队,基于GNN融合基因图谱的单细胞基因表达,在下游细胞类型注释、细胞聚类、单细胞扰动、Bulk细胞敲除等任务上超越scGPT,达到行业最高水准;稍后李建刚院士还会给大家分享如何使用大模型助力合肥人造小太阳——基于Transformer强化学习的托卡马克等离子体控制,把原来模拟器预测误差从7%降到3%,模拟器预测时间从10天降到1小时,具有里程碑意义。



我们还在开展化学/化工等领域的科学知识推演大模型攻关,在中国科学院AI for Science项目的支撑下,科大讯飞作为支撑单位在中国科学技术大学的化学大模型以及大连化学物理研究所的化工大模型进行联合攻关。



中国今天的AI for Science,科大讯飞的星火大模型是当之无愧的No.1。

AI for Science决定了中国科技未来发展的速度,决定了我们有多少优秀的科技人才能被释放精力、能做更有意义的创新。赋能科研就是讯飞星火最重要的使命!



“飞星二号”平台上线

星火大模型持续引领全国产算力平台发展 


今天人工智能的发展绝不是只有科大讯飞一家,只有生态的繁荣才有人工智能的大未来。



在这个人工智能生态中,科大讯飞不仅语音语义市场占有率是第一,开发者生态也是第一。大家可以看到,今天我们对外开放的AI的原子能力已经达到了759项,开发者总数增加到767万人,海外开发者增速翻番达到45万。讯飞星火多语言大模型现在正逢其时:大模型开发者在过去一年翻了好几倍,达到78.1万人。



下一步,拿什么奉献给我们的开发者及线上线下的伙伴们?我们要开放科大讯飞全场景资源助力开发者,不仅是开发,更要从产品开发走向商业成功。所以,如何帮助他们加速研发产品?如何让他们在研发过程中积累自己的个性化优势?我们要帮助开发者构建壁垒,共享市场资源,通过基金和落地支持来真正助力开发者实现商业成功。



举几个例子,今天讯飞开放平台上有700多项原子能力,但我们把它整合成各种模组,在汽车、在机器人的开发者拿过来就能用;麦克风阵列、视频阵列以及后台大模型一组装就能用。除了模组,我们还提供很多参考设计。所以通过云端一体、软硬件一体,我们把原子能力模组参考设计给每个开发者,现在已经覆盖了20多个行业。


在本次1024科博展现场,xbot咖啡机器人2小时就可以完成多模态交互集成。展会场景对话成功率从原来40%提升到90%。原先,开发者需要1-2周时间完成能力组建,之后还要打磨各种各样的问题。现在,我们把经过检验的成熟模组、参考设计给他,他直接用就行了。这是讯飞开放平台与所有AI开放平台相比,非常重要的一个特色:让开发者用最快的时间、最短的路径实现真正的产品成功。



实现之后,我们会把我们的线上线下渠道开放给大家,例如我们C端硬件线上线下的全球销售平台——大模型赋能的智能硬件,我们是多个品类的全行业第一。讯飞星火App安卓应用市场有2亿多次下载,有很多大学生和白领特别喜欢的功能,我们把这个流量开放给大家,大家做出来的东西都可以放上去。



从去年到现在为止,有3.65万的第三方开发智能体在我们平台上,增长超过200%。我们央国企场景以及教育、医疗、智慧城市的行业场景开放给大家,不仅让开发者,也让全国老师、医生等人都参与到整个平台中来,形成整个共创体系。


再进一步,我们会有基金(支持)。10月18日,科大讯飞董事会公布“讯飞牵头新成立AI专项基金,进一步加速前沿技术产业化进程”。之前,我们已投资参股了180家企业,包括商汤科技、寒武纪、中科海光、银河通用、三人行等,是多家创业企业首个天使投资人。



有很多创业者的阶段目标没达预期,我们会率先把原来定的过于苛刻的考核要求给放开,因为他们在努力,我们觉得他们有希望,所以放开来,我们要与更多优秀团队共同成长,不光是要靠技术也要靠资金。


中国移动是科大讯飞第一大股东,中移产业链发展基金上百亿,安徽的人工智能主题基金也是50亿,下一步到几百亿基金——这些都是可联动的创投基金,共同助力开发者成功。



我们也跟地方政府联合,为创业者提供更实实在在、看得见、摸得着的产业落地支撑。最大的就是合肥的中国声谷和科大硅谷,我们现在已经跟28个城市共建了产业加速中心。我们给技术赋能,有免费场地,有和政府谈好的优惠政策、当地首台套、当地的项目申报扶持、应用场景的扶持,现在又在多个城市共同探讨增加免费的算力支持或优惠的算力支持。整个组合起来,希望我们的开发者最终都能够取得商业成功。


只有生态繁荣才有人工智能大未来。但是,这种生态一定要建立在自主可控的平台之上。



我们中国有华为这样伟大的公司,也有像寒武纪、海光这样优秀的做自主创新的硬件芯片等方案的供应商。去年我们有幸跟华为联合做了中国第一个万卡算力集群“飞星一号”,在昇腾910B的基础上,一年来攻克了诸多疑难杂症,解决了500多次基础软硬件问题、模型适配问题等,使得我们大模型训练从对标A100/A800的20%~30%提升到90%以上。现在在更多的算法、更多尺寸的模型上,我们正在不断地适配。华为分管计算的董事、高级副总裁杨超斌,也是中国科大的杰出校友,到了现场。在国产算力上,针对大模型和人工智能最前沿的很多无人区问题,90%都是我们共同发现并解决的。我们也呼吁更多有志于未来安全可控发展的优秀团队加盟进来,这也是国家的战略需要。



我们还要不断地在模型新算法的适配,在更大规模的集群跃迁上不断努力。



今天,还是在合肥,由科大讯飞、合肥大数据公司和华为联合启动“飞星二号”,我们要从万卡到万P,不断地引领国产大模型底座的发展。只有在真正自主可控的平台上,才有中国人工智能的大未来。



就在昨天,我们在不断地探索人工智能未来究竟哪些事情最重要?在这里我想说五个方面。



第一,顶天立地。必须源头技术创新,要国际领先,对标全球最好的,底座模型对标全球最好的,专业模型做到全球第一,这是当前我们就能做到的;立地,必须大规模产业化,必须在场景中进入到真正的深水区。


第二,自主可控。所有玩概念的都不会有大未来,只有自主可控才有大未来。


第三,通专结合。通用模型和专用模型的结合,让它效率更高,专业领域效果更好。


第四,端云联动。


第五,软硬件一体。


我想坚持这五个关键点,我们的人工智能就有大未来,就能真正解放生产力、释放想象力,改变产业格局和竞争格局,带来科研范式的变化。


就在昨天,超过10万的合肥市民们参与了合肥天鹅湖的无人机表演,许下对未来的期望。下一个10年,希望AI能为你做什么?昨天,大家看到了去年很多人表达的对未来的希望,今年的我们已经放到科博展艺术馆展馆的许愿墙上面去了,涉及了教育、医疗、对未来外太空的探索以及陪伴机器人等各方面内容。我相信,每一个市民的期望,所有老百姓、社会的期待,就是我们未来发展的方向。



今天是一个全面共创的时代,不仅仅是科大讯飞的平台及基础底座能力的厂商、科研院所、开发者、教师医生等专业团队,每一个用户的每一次提问都是大模型进步非常重要的基石,聚沙成塔最重要的来源。你们对AI的愿望,就是我们未来努力的方向,期待着我们携手努力,解放生产力,释放想象力,在中国用人工智能建设美好世界,并且给世界提供第二种选择。


谢谢大家!


*数据来源于系统实际应用

继续滑动看下一个
科大讯飞
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存