查看原文
其他

2次抵押房产, 苦熬10年,获巨头超3亿投资, 这群剑桥青年要打造BAT之外的新物种,能成吗?

思必驰 2022-12-07

The following article is from 新经济100人 Author 新经济100人

点击这里快速申请获取思必驰DUI平台内测码


 撰稿:贾宁   编辑:李君宇 


1970年代半导体、1990年代个人电脑、2000年互联网……有人认为人工智能将有可能成为第四波革命浪潮,大数据、云计算、深度学习等技术的成熟、资本源源不断的投入繁荣了一批又一批人工智能企业。 


2007年,起源于英国剑桥的思必驰杀入语音识别和对话系统领域,希望创造类似于汉语老师的智能PC终端来帮助老外学汉语,市场小、时机未到、技术不成熟等原因让这个项目遭遇寒冬。 思必驰转向教中国人说英语的项目,最终得以生存。


2012年,移动互联网兴起,Siri的横空出世让思必驰创始人兼CEO高始兴看到了语音交互在移动互联网乃至智能硬件、物联网的未来。剥离英语教育这块业务后,思必驰专注物联网。 


现在,思必驰已经拥有了300多名员工和100余个发明专利,合作客户近20000家,包括阿里、京东、腾讯、联想、小米等互联网巨头,估值数十亿元。


从寒冬等到人工智能春暖花开,高始兴坚守了整整10年。


 ▲思必驰创始人兼CEO高始兴


01 产学研一体,打造核心竞争力


2006年,在英国剑桥大学商学院读硕士的高始兴与同在剑桥读语音识别方向博士的俞凯(现思必驰联合创始人兼首席科学家)同住在休斯学院,两人经常一块吃饭、打乒乓球、谈天说地。 


恰同学少年,风华正茂。彼时剑桥大学创业氛围浓郁,从实验室走出来的科技公司数不胜数。在大学时代有过创业经历的高始兴,跟随导师参与过产学研转化的俞凯,两人对创业跃跃欲试,一拍即合。 


2007年,同为剑桥毕业生的林远东,放弃BSI中国区首代职位加入创始团队。当时的方向是为教育领域提供语音技术服务。 


当时几人凑了几百万元,博士毕业后的俞凯,把大部分工资也投入了其中,「2007到2011年是一个特别痛苦的时间,现在语音人才一人难求,但是那时候找不到高薪工作,大部分都转做金融了。」 


俞凯是少数坚守下来的人。他前五年做语音识别,后五年做对话系统,为思必驰的底层技术打下基础。他选择的方式也始终如一,从剑桥到上海交通大学,他一直在院校科研的第一线。 


「人工智能方向的公司一定需要有基础研发的能力,技术的更新迭代是非常快的,要做技术驱动型平台企业的话,需要底层有自己一套基础的东西,能够源源不断地产出新概念、新算法、新人才。」俞凯说。

 

俞凯在剑桥与英国皇家工程院院士Steve Young教授、机器智能实验室主任Phil Woodland教授都有过合作。Steve Young又做研究又创业,1999年,他将创业公司Entropic出售给了微软。而2010年,谷歌收购了他的另一家创业公司Phonetic Arts。2015年,苹果收购了他创立的语音人工智能公司VocalIQ。 


从俞凯2012年回国在上海交大任教以来,最早以项目合同的形式进行技术产出,后来成立了思必驰—上海交大联合实验室,规模不断扩大。 


俞凯认为,思必驰在语音识别、语音合成、对话系统、软硬件结合拥有技术优势他举例说,在国际抗噪语音识别测试上,思必驰两次获得单系统识别的最佳结果。2017年思必驰尝试多系统,在研究层面错误率做到了3%,而人的错误率是百分之二点几。

 

在语音合成上,思必驰采用参数化统一模型合成语音,用一个公式去描述声音的生成,自由定制多种合成音,不单让语音清晰,而且让语音有个性和独特的表现力。 


作为一家专注智能硬件语音交互技术的公司,思必驰看重在软硬结合上的落地能力,将软件算法与硬件模组结合在一起,提供一整套解决方案,包括传感器、麦克风、声学结构设计等硬件模组的设计。 


虽然深度学习+大数据是人工智能的标配,但是俞凯认为炒得火热的深度学习,也已经到达了临界点。许多公司都开源了自己的深度学习软件,比如Google的TensorFlow,在深度学习上已经「搞不出什么花儿」。 


「传统深度学习加大数据已经不行了,人工智能算法更新很快,它会结合你的知识、你的规则、以前机器学习的方式,迭代出下一代新的东西,超越一般意义的深度学习。它螺旋式上升,有迁移学习,我自己提出的闭环学习、知识嵌入等等,是以后新的算法当中需要加入的元素。」俞凯说。 


02 深耕垂直领域,广铺开发者平台


2014年,移动互联网正在爆发,智能硬件、物联网也成热门领域。思必驰开始思考能不能在下一代的物联网市场里分一杯羹。为了保持创业公司的专注,这一年,思必驰将原来运营良好的教育事业部从公司剥离,成立新的公司苏州驰声信息科技有限公司,林远东担任CEO。思必驰本身则专注智能硬件、物联网行业。


移动互联网的载体是手机,用户习惯于手机的图形交互界面,但是未来没有显示器的设备会越来越多,语音是跟这类设备沟通的绝佳方式,loT车载事业部总经理张岩认为,语音交互会是即将现象级爆发的窗口。 


对于智能硬件领域来说,产品形态与人机交互技术的结合非常重要。车载场景里的HUD(Head Up Display抬头平视显示器),它在当时的形势下是能够承载语音交互非常好的载体。 


车萝卜(Carrobot)是思必驰的第一次试水。这一款智能车载机器人,通过放置在方向盘正前方仪表台上的HUD透明投影屏展现信息,并通过语音人机交互实现语音导航、接打电话、收发微信、听歌点歌等功能。 


思必驰副总裁雷雄国从2009年就跟随高始兴,是技术、评测、市场、商务的多面手。2014年,他被派到深圳——车载市场的最前线进行考察和调研。 


车载市场分为后装跟前装,前装指汽车在整机厂时预先安装的电子设备产品,后装则是汽车用户后续购买的电子设备产品。深圳及周边区域占了全国车载市场产能的90%,数百厂家驻扎于此,是智能语音技术公司必争之地。 


早期的攻坚尤为艰难,有时候连老板也见不到,见到了老板,结果老板说我已经见过科大讯飞的人了。后装不同于前装,一旦出现质量问题,终端消费者可以直接退货,用户体验和后续服务成为了谈判的关键,雷雄国从价格、支持力度、后续服务三个方面说服客户。 


「车载时的各种噪音环境里,我们语音识别的准确率是最高的。当时我们在深圳成立了专门的团队,出现什么问题,他打个电话我们会马上过来调试,我们竞争对手的响应速度跟不上,所以服务还是非常关键的。」 雷雄国说。 


与百度和科大讯飞在后装市场的免费策略不同,思必驰在商务策略上采取收费策略,硬件和服务收费,授权也收费,即要用思必驰的语音技术,必须付一笔钱,思必驰才做技术服务支持。 


「这个主要不在于钱,主要是在于高品质客户的选择,这些客户既然愿意给钱,他肯定是全心全意想把这个事做好。」雷雄国说。

 

思必驰从后装市场入手,拿下智能后视镜大部分客户。随着智能车机兴起,智能后视镜市场份额下降,从2016年6月,思必驰用一年时间又拿下智能车机中控。根据思必驰提供的数据,目前思必驰在国内后装市场,占有率60%以上。 


雷雄国在深圳牢牢扎根下来,深圳也成为了思必驰的第二个大本营,发展成为一百多人、技术销售相对独立的IOT车载事业部。「市场在哪儿,我们的发力点就在哪。」张岩总结。下一步,思必驰计划从后装打入前装,与在前装市场盘踞已久的科大讯飞正面交锋。 


时值亚马逊Echo和Alexa风头正盛。国内大家纷纷跟风前沿技术,一时间,大大小小的语音开放平台不断涌现。思必驰也在做相关的尝试,一方面继续深耕车载、家居和机器人等垂直领域,另一方面开始酝酿自己的开发者平台,将服务铺开,将工程师解放出来。 


思必驰在2013年就推出了人机对话平台,但在当时在移动互联网是弱需求,故而有了后来向智能硬件刚需市场转移的策略。现在,随着行业的发展,新的爆发节点来临,思必驰这才带着之前的技术和经验积累,重返开发者平台。 


2016年年底,高始兴找来前乐视语音CEO赵恒艺,由他负责思必驰DUI开发者平台。 


DUI开发者平台做的是全链路的定制,包括语音识别、语言模型、语义解析、多人对话管理、自然语音生成以及语音合成的全定制,而定制的过程非常简单,大部分不需要编程,在UI界面点一下发布,就可以在客户端直接更新资源、自动匹配。 


DUI平台原本计划一年左右推出,赵恒艺认为可以在上面投入更多力量,开发时间压缩到半年。 


2017年春节前,赵恒艺花了一个多月时间做出了一个完整的产品规划图。他把半年时间按照每两周一个迭代单元进行划分,5月31日推出阿尔法版本,6月底推出可内测版本,七月进行打磨和BUG修复,八月底正式推出。 


计划的前两周,是整个研发过程中相当难的一部分,赵恒艺把它放在开头是有原因的。「第一个Sprint(两周的迭代单元)做的工作,这相当于我们的第一个战役,一定要打赢,为之后开一个好头。大家为这个目标所做的各种磨合,又能建立起深刻的战斗友谊和信任感。」 


首战必胜,然后不断积累小胜利,高昂的士气让团队遇到困难时也迎头而上。


在遇到GUI(Graphical User Interface图像交互)跟VUI(Voice User Interface音交互)结合的难题时,他们团队输出了一个概念叫DUI(Dialogue User Interface 对话交互),让语音交互的定制在一个可视化空间里面去完成。当时这个难题的工作量已经膨胀了好几倍,到了让大家受不了的程度,整个前端团队有一段时间是天天凌晨两三点下班,最后还是保质保量地完成了。 


过去大客户一整套的定制内容非常多,对甲方和乙方都是沉重的负担。如果所有的事情都交给乙方去做的话,一方面开发的过程会非常冗长,另一方面很多时候甲方没办法参与一线开发工作,只能通过口头或者文档表达。大客户本身有一定的研发能力,思必驰开放定制权限后,客户可以亲自参与并且快速反馈和迭代,马上就可以在自家产品里看到用户体验的效果。 


从推出到产品正式上线,还有很长的路要走。目前思必驰采取一对一的市场推广策略,从5000位报名用户中筛选出200人发出内测邀请,通过电话沟通、现场参观等流程再选出真正能提升内测体验的50位用户,确保在产品正式发布前,搜集的情报和建议能够有效地提升宣传推广的转化率。 


「我们自己的孩子,怎么看都是美的。但真的要把女儿送出门的时候,你还是要请专业的设计师团队帮她打造。」思必驰CMO龙梦竹说。 


对于过去依靠授权和大客户定制模式获得收益的思必驰来说,DUI开发者平台也会带来新的商业化探索。


03 既是创业公司,也是产业投资人


2011年公司快揭不开锅,账面上的钱只够花几个月,高始兴和林远东抵押了自己的房子。融资的需求,第一次摆在了桌面上。恰逢Siri问世,语音交互不再是虚无缥缈的东西,投资人也开始尝试。


2012年初,思必驰获得了第一轮融资,联想之星、启迪创投和剑桥校友三方联投,金额数千万元。「市场的曙光初现。」高始兴终于触碰到资本的温暖。 


2014年,又一次资金危机,高始兴与俞凯再次抵押了房产。这时,阿里巴巴来到思必驰面前。2015年底,阿里巴巴上亿元的投资到账。 


蜜月期还在继续,2016年夏天,阿里巴巴领投的C轮融资到账,金额近2亿元。 


这是一次双向选择。未来移动互联网生态向物联网迁移,思必驰需要打通后端进行内容和服务的整合。对于阿里巴巴来说,思必驰可以帮助它实现服务落地到端。 


「现在这个世界,不是A的就是T的,但是未来会越来越开放。在物联网人工智能的新时代,这个世界不再就是A的、就是T的、就是B的,而是一定会出现新的。」高始兴说。 


▲(制图:彭瑞)


思必驰副总裁郭浩然在此时加入,全面接手思必驰的资本事宜。他和高始兴在一些远期目标上,有共同的看法:打造一个物联网大生态,只靠思必驰一个人单打独斗是不行的。一方面,思必驰积极与大型互联网公司开展内容和渠道上的合作,另一方面,思必驰希望通过资本的战略布局来构建自己的物联网生态。


思必驰开始了创业公司与天使投资人的双重身份。「我去融资,要到钱人家会说你这个估值太高了,我给别人投钱,也会说你这个估值太高了。这确实是一个两难。恰恰是这样,我们更能和投资人、被投企业保持良好的关系,因为能站在对方的角度去思考和理解。」郭浩然说。 


目前思必驰有两支基金,一支是自己的天使基金,另一支是和其他投资机构合作的成长基金,「产业与资本的结合,也是这个行业的趋势。」 


思必驰的投资大赛道有三条,第一个是DUI、VUI,智能交互的赛道;第二个,物联网IoT;第三,AI的一些垂直应用。 


从汉语教育、移动互联网、物联网,再到现在的产业投资,思必驰探索的十年也是人工智能翻天覆地的十年。近五年的中国新增人工智能企业数占全国人工智能企业总数的72.71%。寒冬过后,即将迎来万花争艳的春天。 


「围绕物联网产生的人工智能公司会很多,但是未来,能够在市场起到主导作用的只有那么几家,我相信,思必驰一定会是其中之一。」高始兴说。




读阅多更


思必驰DUI开放平台内测申请链接

思必驰DUI开放平台首秀:让AI语音快速赋能智能硬件

声姿 | 天猫精灵X1携手思必驰,阿里入局智能音箱

专访 | 对话思必驰VP赵恒艺:开放DUI平台的背后,深藏用AI赋能开发者的野心




  ◆  END ◆   

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存