用知识图谱+NLP,海知智能努力让机器人的开发像发微信一样简单 | 专访
海知智能专注于知识图谱和NLP技术中的语义理解,推出了第三方机器人技能插件开放平台「魔戒」、用于知识图谱的生产及应用的智能分析员「水晶球」和知识图谱生产线「聚宝盆」。其NLP技术客户包括小米、海尔、平安、新华社,以及度秘 DuerOS、思必驰 DUI 平台等对话式人工智能系统。「专业化分工是人工智能时代的趋势,要么做出对上下游都有价值的事情,要么死。」海知智能的创始人谢殿侠如是说。
撰文 | 王艺
编辑 | 藤子
成立于 2014 年的海知智能专注于 NLP(自然语言处理)与知识图谱。9 月 20 日,发布第三方机器人技能插件开放平台,将智能的语言理解能力免费开放给开发者。同时发布的,还有智能分析员「水晶球」和知识图谱生产线「聚宝盆」,这两款产品均用于知识图谱的生产及应用。
然而,在成立之后的两年半时间内,2016 年下半年语音市场爆发的前夜,谢殿侠和他的团队没有如预期发展起来,不断被质疑所坚持的方向是否正确。
自然语言理解+知识图谱,聚焦于让机器听得懂
还要从硅谷说起,2014 年,谢殿侠在那里遇到了自己在北大念书时的学弟丁力。丁力比谢殿侠小一届,二人相识在北大古典音乐爱好者社团。
从北大毕业后,丁力赴马里兰大学攻读博士学位,此后一直在学术界从事知识图谱(之前称 semantic web 或 Linked Open Data)相关研究。基于社群的中文知识图谱数据标准 cnSchema 便由他起草发起。
谢殿侠从北大毕业后,并未选择继续深造,而是选择了工作,二人相遇时,谢已经运营海知智能的前身,一家名为海知信息的知识管理公司两年有余。海知信息帮助中小企业将员工的隐性知识变为显性知识,将孤立的个人的知识变为团队的共享知识,最终希望将不同组织、个人的知识共享,形成一个庞大的知识库。
与丁力相遇后,谢殿侠意识到,自己的知识管理生意能够被扩展到更贴合人工智能时代的脉搏,并属于在人工智能技术中非常重要且位于底层的知识图谱领域。
丁谢二人看到其老本行——知识领域的数据开放程度在日益增大,可共享、可公开的信息日渐增多。例如曾经需要依靠关系才能拿到的昂贵的航班信息,在 2014 年已经能够以低成本甚至免费的形式获得,这催生了航班管家等差旅类 App 的发展。
生活类服务例如打车、外卖等领域的市场也愈发成熟,越来越多的开放接口、公开资料可供使用;4G 时代的到来使得网络信号不再昂贵;语音识别技术取得了极大幅度的突破。
但是,尽管在 2014 年,智能硬件热潮兴起,产量迅速增加。但当时业界对智能硬件的定义还停留在「能与手机相连的硬件」阶段,并非今天定义的搭载人工智能技术的硬件。
谢殿侠观察,语音交互作为消费者与智能硬件之间的主要交互手段,具有很大的增长空间。而知识图谱作为人机交互的「垫脚石」,正是商机所在。于是,他决定将知识图谱与 NLP 结合,聚焦让机器「听得懂」这一层面,「听得清」、「说得出」等其他环节一律不碰。
对别人构成价值,自身才有价值
如今,语音技术的链条上拥有许多环节,包括声音的采集、识别、语言的准确理解、搜索知识库及应答、语音合成、用户交互等。正是由于语音技术环节众多,谢殿侠认为,「赢者通吃」效应在语音领域不太可能发生,在未来的很长一段时间内,「竞争合作」将成为行业的主旋律。
谢殿侠决心只在 NLP 与知识图谱深耕细作,用谢殿侠的话说,就像打井,希望在某一点上「挖井挖出水来」。
但是,公司成立后的两年半,几乎没有可观的收入。「前面都聊得很好,聊到最后容易讨论到人工智能是造福人类还是毁灭人类,实质项目落地往往有限。」谢殿侠回忆他和硬件厂商的谈话。
市场的慢热使得发展不如预期,外部和内部压力与日俱增。但谢殿侠相信,只要坚持打磨技术,就一定有转机。
市场最终给了他们机会。
2016 年下半年,智能音箱市场爆发。由于语义理解处于语音技术链条的中部,是业内公认的技术瓶颈所在,而其他语音公司多数从处于链条前端且更容易达成的语音识别技术开始打磨,追求更高的识别准确率。因此,他们需要强有力的合作伙伴帮助他们跨过语义理解这道关卡。
小米、百度等 IT 公司,思必驰等语音公司纷至沓来,以合作的形式接入海知智能的 NLP 技术。目前,海知智能的客户包括小米、海尔、平安、新华社、张小盒等大小机构,并作为首批合作伙伴对接了小米「水滴」平台、度秘 DuerOS、思必驰 DUI 平台等对话式人工智能系统。
「坚持,深挖井,不挖出水不罢休;把要做的环节做到对别人产生价值」谢殿侠坚定不移地说。
但是,目前语音市场的现状与谢殿侠的预测并不完全吻合,语音厂商如科大讯飞、出门问问、云知声等,以及巨头的语音部门如阿里 iDST、微软亚洲研究院等均在语音全链条进行布局。
以科大讯飞为例,2015 年,讯飞研究院与约克大学成立约克大学 • 讯飞神经计算与深度学习联合实验室,并在 2016 国际知识图谱构建大赛(NIST TAC Knowledge Base Population)上取得核心任务全球第一的成绩。另一家公司云知声 CTO 梁家恩也曾在采访中表示正在啃「语义理解和知识图谱这块硬骨头」。
和他们相比,海知智能只打一口井的运营策略注定其天生需要依靠其他语音公司生存。谢殿侠表示,他并不畏惧对其他公司甚至竞争对手的依赖,他认为「对别人构成价值,自身才有价值」。
他以思必驰为例解释,思必驰主打全链条的语音技术,除语义理解外还有语音识别与合成等模块,但语义理解模块选择与海知智能合作。与其说是竞争对手,谢殿侠更愿意将思必驰看作合作伙伴。
与思必驰合作后,海知智能的技术能够通过思必驰的车载产品触达用户,在车载领域的能力也能有所提升;同样的,海知智能的技术能够增强思必驰的能力,帮助思必驰更好地服务用户。
「表面上看来,与竞争对手的合作的确会对自己不利,但是站在更大的视野中思考,实际上我们得到了更多。」谢殿侠坚信开放的生态一定有出路。市场上也有其他公司专注于语义理解,但均有项目制的方式运营,据谢殿侠的介绍,该领域中以开放平台模式运营的公司只有海知智能。
「专业化分工是人工智能时代的趋势,要么做出对上下游都有价值的东西,要么死。」谢殿侠说,态度坚决。
让知识的复用产生价值,人人都能做自己的 Bot
2017 年 9 月发布的第三方机器人技能插件开放平台正是这一理念的产品。该平台承载的第三方机器人技能插件工具名为「魔戒」,能够让用户三步构造自己的机器人。
首先,用户需要确定其机器人的用户、场景、以及服务,进行创意设计。接着,工具通过知识库、问答组合、以及训练集对技能进行训练。最后,技能插件被连接到智能硬件、机器人、微信公众号等交互入口级平台上,接入成「人」。
谢殿侠介绍道,以大四毕业的文科生为例,经过 1-2 周的培训就能轻松使用该工具,头脑快的可能 3 天就能掌握。如果用户掌握编程知识,那么将能够从更大的功能维度上使用该工具。
海知智能希望为以语音合成与识别为主的公司增强语义理解能力,同时帮助不具备语音能力的内容提供公司,如饿了么、小红唇等集成到如小米电视等语音平台上。
以小红唇为例,海知智能仅用一周时间便将小红唇变为小米电视上的一个交互技能,当用户用语音查询「去见前男友应该化什么妆」类似的问题时,小米电视能够自动返回相应的视频。这背后的定制化自然语言理解技术若靠小红唇自研,可能需要上百人的团队。
上图是一个完整的语音团队中需要包含的人才角色,海知智能希望「小红唇们」在开发语音机器人时不再需要上图中的蓝色部分,仅需绿色部分。
「你有一个苹果,我有一个苹果,我们加在一起还是各自有两个苹果。但是你有一种知识,我有一种知识,我们合作能够产生更多的知识。」谢殿侠的理念在于知识复用,在他的眼中,这就是知识复用的价值,他希望自然语言理解技术能够像水力和电力一样随取随用,用户不需要自己提水和发电。
同时发布的智能分析员「水晶球」和知识图谱生产线「聚宝盆」,用于知识图谱的生产及应用。
水晶球是一个以知识图谱为基础的智能分析员,与企业的业务系统相结合,帮助企业进行一定程度的分析、预测、判断、预警。水晶球通过分析大量数据,尤其是半结构化以及非结构化数据,例如自动阅读行业报告、文本等,通过自然语言理解技术构建知识图谱,加之量化的分析模型生成分析结果。比如,水晶球对医药行业 100 多种物料的市场价格进行预测,误差小于 7% 的物料占比已经达到 80%。
聚宝盆是一条知识图谱生产线,它是水晶球具有可操作性的根本。通过机器与人工的结合生成领域覆盖相对较全,质量相对较高,更新较为及时的知识图谱。
如果说魔戒是 最终服务于 C 端产品,那么水晶球和聚宝盆则面向 B 端。谢殿侠介绍道,之所以选择 B 端的知识图谱业务,是因为单独使用知识图谱进行预测的业务对于 B 端客户来说更易接受,且容易变现。但除 B 端产品外,海知智能也在研发面向智能家居等 C 端应用场景产品的知识图谱应用模块,会被应用在用户画像解读,通过场景推荐歌曲等应用程序中。
魔戒、水晶球、与聚宝盆三款产品交叉组合,产生了三种业务,即面向智能家居的语音技能平台;帮助企业连接售前售后环节的智能客服(中的智能部分);以及替代企业分析员的自动分析业务。
谢殿侠希望将这三款产品做到极致;能将自身的 NLP 与知识图谱技术打造成上下游合作伙伴的坚实依靠;他希望到 2020 年,人人都有自己的对话机器人。「按照既定的路线走下去。」谈及未来时,这是谢殿侠说的最多的一句话。