打造AI开放平台,「普强」争做智能语音赛道破局者
多数语音技术已经进入稳步爬升期,智能语音赛道进入成熟发展期。
中小企业应该走“专精特新”之路,已经成为从政府到企业界、投资界的共识。36氪广东重磅推出“‘专精特新’们的晋升之路”专题,记录全国“专精特新”企业发展史,探索“隐形冠军”的晋级之路,探讨重点产业的高质量发展。
据中国语音产业联盟发布的《2020-2021中国语音产业发展白皮书》,2020年我国智能语音市场规模达到217亿元,同比增长31%。2021年,我国智能语音产业市场规模预计达到285亿元,各种应用正在迎来需求拐点,进入需求爆发期,主要立足于日常生活的消费级应用场景,市场规模将超过700亿元;而服务于特定场景的企业级应用场景,由于疫情等原因市场需求正在不断扩大,预计将超千亿规模。
随着赛道的规模的不断扩大,智能语音技术也逐渐趋于成熟。北京市专精特新企业普强信息技术(北京)有限公司(下称「普强」)早在2009年便切入了智能语音赛道,成为当前赛道重要的赛车手之一。「普强」是一家以语音大数据分析、智能语音识别、语音合成和自然语言处理技术为核心的人工智能企业。业务涵盖了智慧金融、智慧政务、智能汽车等多个消费级与企业级应用场景,为超过500家企业提供语音驱动的人工智能大数据解决方案。
进入成熟发展的智能语音
2011年,Siri应用到iPhone4s上,通过语音识别等技术将手机变成了一台“智能机器人”。智能语音作为人工智能中最成熟的核心技术之一,被大多人数认为是人工智能的重要入口。「普强」CPO蒲瑶认为,智能语音技术通过了近十年的研究与发展,目前已经到了成熟期。
从学术角度来看,多数语音技术已经进入稳步爬升期,智能语音赛道进入成熟发展期。随着深度学习以及大数据技术的不断发展,已有的语音识别等智能语音技术已经进入生产成熟期,逐步进入商业化应用。
不少新兴的智能语音技术如情感人工智能也有了很大程度的进步,进一步推动了智能语音市场的扩大与商业化进程。
从商业角度来看,蒲瑶表示:“智能语音现在正处于商业变现的阶段,无论是智能语音公司还是AI公司,都要找到自己的‘赚钱方式’。”技术的成熟推动了商业应用的落地。
疫情发生之前,随着人工智能技术不断发展,智能语音的应用场景已经在呼叫中心、金融、车载等领域得到应用;在疫情带来的机遇下,无接触交互需求催生出智能语音更广泛的应用场景和更多落地需求,像:智慧金融、智慧政务、智慧办公、智慧旅游等。
“定制”的开源技术适配多场景应用
智能语音的产品目前主要以两种形式呈现,分别是行业解决方案和平台化技术输出。前者是需要深耕垂直领域,对于垂直行业有深度的认知,与企业进行深度合作;后者是通过API(应用程序编程入口)等技术为企业提供技术支持,而不少头部智能语音企业便是以此切入智能语音赛道。
深耕智能语音赛道13年的「普强」基于自主研发的语音识别、语义理解、语音合成、大数据挖掘等底层AI 技术,以及累计的超过90,000个行业模型,为金融、教育、大健康等行业提供“「普强」AI能力平台”。
以AI能力平台为基础,「普强」开发了多款标准化产品。
“‘千寻’实时坐席助手”以实时语音转写引擎为支撑,通过实时转译与对话内容信息提取,实现实时知识辅导、实时弹屏告警等功能,约束客服行为、提升客户满意度。
“‘千寻’离线语音分析系统”基于「普强」多年来累计的大数据以及行业模型,为客户提供关键词检索、数据筛选、聚类分析等功能,为企业提供数字化运营策略支撑。
拥有底层ASR语音识别引擎能力与非结构化数据分析技术可以为“‘千察’语音质检系统”提供精准的质检结果,提高工作效率。
除了可以为企业提供一站式服务,「普强」AI能力平台还可以通过API技术让企业进行二次开发。既有了平台化技术输出的普适性,也拥有了行业解决方案的独特性。
以智能语音为基石,「普强」的产品涉及了多种应用场景。蒲瑶介绍道,“在车载应用场景中「普强」也实现了广泛应用,「普强」与世界十大汽车企业之一的某汽车厂商的合作车辆,已在今年年初实现落地量产。”
在智慧座舱软件方面,「普强」拥有自主研发的全栈语音核心技术,可以为汽车厂商提供“芯+端+云”一体化车载解决方案与定制化的智能网联车机系统。软、硬降噪消回声技术、全双工技术、实时智能聆听技术、离线语音识别、多轮语音交互等功能使智慧驾驶拥有更加流畅的语音交互与APP生态及操作体验。
基于「普强」自主研发的全栈语音核心技术,「普强」还推出了“‘千行意’车载语音助手”,为客户提供通讯、导航、电台、娱乐等40+种服务。通过降噪芯片及算法,除了为客户提供清晰语音通话外,利用云端的语音识别、语义理解和CP/SP接入,进行大数据分析、用户画像和个性化学习后为客户提供多种应用服务。
「普强」的创始人何国涛自幼在澳门长大,因此带有澳门“特质”的「普强」推出了具有特色的粤语语音识别。粤语承接着古代汉语的许多特点,在词汇、语法、发音上都和普通话有明显区别。例如,相较于普通话的四个声调,粤语中拥有完整的九韵六调,这为粤语的语音识别带来了一定的技术难度。“「普强」是较早推出粤语智能语音识别的企业,甚至还能识别‘港普’口音”,蒲瑶介绍道。
同时,旅游业作为澳门的重点发展行业,「普强」近期也在澳门开展了智慧旅游解决方案。与澳门的美高梅与永利两大头部酒店企业建立合作,通过语音系统与技术提升酒店行业运营效率,降低运营成本,实现产业升级。
智能语音生态不断升级
据德勤2021年发布的《中国智能语音市场分析》,未来智能语音的产业情境将会以人机交互、技术输出、搜索革新和同步信息四个方面体现。蒲瑶认为,未来的智能语音会提供两方面的功能,一是让生活更加便捷,二是通过人机交互减轻人工的重复劳动。智能语音交互是大众接触科技最普遍的渠道,而随着语音生态系统积极合作,智能语音将赋能多形态智能终端。
而在技术层面,蒲瑶则认为目前已经到了一个缓坡的发展阶段,“按之前的规律大约是10年左右技术会有一个质的飞跃”,目前的智能语音赛道上没有容易突破的问题,尤其是在自然语言理解方面。「普强」选择了产学研的发展路线,与澳门大学、澳门旅游学院和澳门科学技术发展基金联手打造了粤澳跨境产学研基地,为未来突破自然语言理解与人机交互难题提供了技术保障。
同时,智能语音赛道的参与者不断入局,同质化不断加剧,而竞争也愈演愈烈。如何成为赛道的破局者,形成自己独有的竞争力,已成为各企业的无可避免的难题。作为一家专精特新企业,「普强」未来也将继续“专”于智能语音赛道,“精”于智能语音产品的精细制作与快捷易用,以“专精特新”深挖行业痛点,真正抓住客户需求,打造「普强」的商业模式。