科大讯飞的2022:夯实“根据地”业务,以技术创新点燃大模型产业落地的“星星之火”
数据智能产业创新服务媒体
——聚焦数智 · 改变商业
4月20日晚,科大讯飞正式公布2022年度及2023年度第一季度业绩报告。财报数据显示,公司2022年度实现营业收入188.20亿元,同比增长2.77%,实现毛利76.84亿元,较上年增长2.0%;归属于上市公司股东的净利润5.61亿元。2023年度第一季度科大讯飞实现营业收入28.88亿元,科大讯飞表示一季度攻关项目的新增投入影响了部分当期利润。
我们注意到,科大讯飞去年在教育、医疗等持续运营型根据地业务的合作平台拓展、新产品研发以及核心技术自主可控和国产化适配等方向新增投入约8亿元。科大讯飞表示,尽管上述投入在2022年尚未形成收入,影响了当期经营业绩,但对下一阶段盈利能力持续提升和产业领导者地位增强奠定了扎实基础。
此前科大讯飞发布消息称,”讯飞星火“大模型成果发布会将于5月6日召开,届时科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪将发布讯飞星火认知大模型,AI学习机、讯飞听见、智能办公本、智慧驾舱、开放平台等产品的最新升级成果也将同场亮相。
夯实根据地业务基本盘,以认知大模型引领技术创新在4月20日举行的“2022年度及2023年第一季度业绩说明会”上,科大讯飞总裁吴晓如首先介绍了科大讯飞去年的业绩情况,以及对今年的公司发展进行了展望。
吴晓如表示,尽管整体营收仅呈现微增长,但根据地业务仍保持良好发展,毛利同比增长25%,毛利占比提升至58%,2022年“双减”校内课后服务新增了130个区县覆盖,共覆盖280个市区县平台,学习机流水型线下门店新增769家,教育考试业务新增12地市中考和2个省市高考,个性化学习手册新增300所运营校,智慧医疗新开拓96个区县,医保控费已在多个城市验证,AI检出率是传统模式成效的3-5倍,智慧汽车新增合作车型110个。
按科大讯飞此前的解释,“根据地业务”是指各个行业赛道中真正能够创造长期价值的业务,典型的根据地业务包括考试、学习机、个性化学习手册、智医助理、医保控费、智慧汽车等。
科大讯飞在2022年年度报告中称,通过2022年的踏实布局,依托根据地业务和系统性创新,2023年公司将在更加扎实的基础上,更高质量、更从容地实现奋斗目标,开启高质量发展新阶段。
ChatGPT被称为AI的“iPhone时刻”,以ChatGPT为代表的生成式AI让每个人命令计算机解决问题成为了可能,对于有能力、有资源投入的国内知名企业自然不会错过这一次发展机遇。
近期各大厂商的大模型像雨后春笋一般涌现出来,可谓是你方唱罢我登场。从3月16日百度打出第一炮以来,至少有百度、阿里巴巴、商汤、360、毫末智行、知乎、昆仑万维等知名公司召开发布会,官宣自研的大语言模型,腾讯、华为、字节跳动等巨头亦有相关的模型或方案。
对于大模型上的创新,本身就处于人工智能第一梯队的科大讯飞,其一举一动一直受到业内外的广泛关注。
实际上,早在2014年,科大讯飞便启动了“讯飞超脑”计划,逐步突破机器阅读理解、逻辑推理、 分析归纳、知识表达等技术难点,实现机器从能听会说到能理解会思考。
2022年,科大讯飞在人工智能关键核心技术领域累计摘取16项国际人工智能大赛的冠军,其中13项涉及常识阅读理解挑战赛OpenBookQA、QASC、ReClor等专业领域知名竞赛。另外,Transformer算法已广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务并达到国际领先水平,已开源6大类、超过40个通用领域系列的中文预训练语言模型,相关模型库月均调用量超1000万。
来源:科大讯飞
科大讯飞之所以能在人工智能关键技术产生创新优势,与其在人工智能研发持续投入不无关系。我们从2021年和2022年的财报中可以看出,尽管收入增长有快有慢,但其研发投入始终保持在一定比例,2021、2022年研发投入占营业收入比例分别为16.03%和17.83%。
另外,从人员上更可以看出,科大讯飞始终坚持科技公司的本色,2022年研发人员更是达到了9281人,占全体员工人数的61.68%,是销售人数的2.71倍。刘庆峰在发布会上表示,一大半研发人员都会和认知大模型的突破带来的创新有关联。
科大讯飞大模型的竞争优势和切入点在于专业领域据悉,在5月6日科大讯飞“星火”认知大模型的发布,不仅包含通用大模型,更值得关注的是面向教育、医疗、办公、车载等行业的解决方案。
实际上,在ChatGPT全面爆发之前的去年12月,科大讯飞就启动了“1+N 认知智能大模型技术及应用”专项攻关,其中“1”指的是通用认知智能大模型算法研发及高效训练方案底座平台,“N”指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。在发布会上,吴晓如表示,科大讯飞有信心在国内认知大模型研发中处于技术前列,同时在教育、医疗等多个行业率先深度应用。
艾瑞研究表明,通用基础大模型在垂直专业领域的内容输出能力较弱且在产出结果的可信程度上不可控,需要垂直领域know-how与数据调优。与此同时,大模型产品也有机会嵌入各企业服务系统中进行升级改造,包括知识检索、数据分析、辅助编程、数字员工、交互硬件、数字人等企业级应用都有可能被重构。
科大讯飞在多年认知智能系统研发推广中积累了丰富的行业数据,为认知智能大模型的研发和专业领域优化提供了扎实基础,具备了行业公信力。并且,讯飞在牵头国家专项、国产化训练推理平台建设和优化方面持续投入,构建了扎实的竞争壁垒。
据了解,科大讯飞在多年认知智能系统研发推广中已积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用,尤其是在教育、医疗、翻译等领域,在严格遵守适用法律法规前提下,为训练实现达到人类专家水平的行业认知大模型提供了海量行业文本语料和用户反馈数据,也为基于大模型的创新应用研发和试点推广提供了专业场景保障。
以医疗行业为例,科大讯飞的“智医助理”是业内唯一通过国家职业医师资格测试的智能辅助诊断系统,辅助基层医生完成超过2亿份规范电子病历,电子病历书写规范率整体提升至90%以上,累计为基层医生提供5.3亿余次AI辅助诊疗建议。在医疗这种关系到人民生命安全的专业领域,容不得AI“一本正经地胡说八道”。
来源:科大讯飞
刘庆峰表示,从业内整体情况来看,更大规模的大模型已经接近临界点,而科大讯飞在认知大模型推动过程中,突破点恰恰在于专业模型,借助其在专业领域大量积累的语料,首先形成强有力的专业模型,然后再把专业知识、语料相互衔接,在统一框架下,通过专业的子模型协同训练,从而获得更高、更可信的成效,最后形成通用大模型。
“我认为科大讯飞今天做认知大模型,并不是跟随GPT,而是有自己的逻辑。一方面我们与OpenAI将有一个赶超的过程,讯飞会通过专用领域达到并跑,甚至将来领跑,我们再由专业领域回过头来,在整个通用领域形成各自的优势。科大讯飞有机会在业内做出优势、在行业做到领先,我们对这个目标充满信心。“刘庆峰如是说道。
发布会上,多家券商分析师都提到如何将大模型的能力运用在现有讯飞产品中,如何提升相关产品的商业价值。吴晓如表示,这方面正是讯飞发力的另一个重点,讯飞借助认知大模型将对现有的核心产品进行升级,全面提升产品应用的成效。他介绍说,星火认知大模型对讯飞现有企业服务产品提升主要有三个方面,具体包括:
人机交互体验显著提升:讯飞无论是在车载的交互、在很多行业的客服系统、智慧家庭等产品,目前语义理解的错误会大幅度下降,交付的效果会得到显著提升;
内容生成及批改辅导等产品功能跃升:包含英语的听说教学、AI学习机、讯飞听见、办公硬件等产品,都会受益于认知大模型技术;
个性化服务更加精准:主要包括因材施教解决方案、慢病管理、智医助理、个性化学习手册等精准服务,大模型都将显著提高现有产品的品质。
吴晓如继续表示,星火认知大模型的发布,除了会让产品成效显著提升以外,还会大幅降低现有讯飞产品的使用门槛。比如客服、英语听说,它们与多个内容资源都有所绑定,目前采用大量的定制资源,而当认知大模型全面发布之后,既会推动海量的客户来使用讯飞的产品,又可以广泛赋能开放平台百万级合作伙伴,如此将会带来互联网产业格局重塑的新机遇。
目前,科大讯飞已具有稳健良好的开发者团队基础,并围绕开发者群体持续构建生态。科大讯飞2022年度报告显示,截至该报告期末,讯飞开放平台已开放559项AI能力及场景解决方案,聚集398.1万开发者团队,总应用数达164.6 万,链接超过500万生态合作伙伴。
刘庆峰表示,科大讯飞将严格遵守网信办的要求,通过邀请的方式将大模型能力逐步开放给开发者,通过API赋能他们开发更多的应用。对于开发者,尤其是行业开发者来说,也会由此获得第一批将认知大模型通向产业应用的入场券。
讯飞认知大模型“1+N” 的技术红利未来会通过“平台+赛道”的商业逻辑逐步兑现。刘庆峰表示,讯飞在很多年前就一直在提“平台+赛道”, “平台”意味着开发团队通过API调用等方式获得星火大模型的各项能力,与平台之间按调用量付费、应用合作分成、流量分成及订阅付费等多种方式进行价值分享。“赛道”意味着大模型要赋能教育、医疗、办公、车载等行业,在这些领域形成专用模型技术领先和大规模商业应用互相促进的格局。