CNCC 2016 | 搜狗 CEO 王小川:输入法的未来是自动问答
王小川,前搜狐高级副总裁、首席技术官,18 岁获得国际信息学奥林匹克比赛金牌,毕业于清华大学,曾获北京市科学技术一等奖、北京市劳动模范、2014 年度华人经济领袖大奖等荣誉。
人工智能在近些年得到了快速发展,从传统的学习规则、学习答案,再到自我学习,正在实现越来越多的功能,甚至逐渐替代人类在部分领域的工作。但未来的人工智能究竟何去何从呢?
作为本次 CNCC 2016 大会的特邀嘉宾,为大家带来了《人工智能技术与商业思考》的专题演讲。技术出身的他,27 岁成为搜狐最年轻的副总裁,32 岁全面负责搜狗公司的战略规划和运营管理,带领搜狗快速成长,成功地由顶尖技术人才转型为全面的管理者。王小川在搜狐组建搜狐研发中心,主持开发搜狗搜索引擎、输入法、浏览器等战略级技术创新产品,通过技术团队建设和技术产品创新,在推动搜狐技术驱动文化中起到了关键作用。
王小川以“搜狗的人工智能之路”为索引,为我们展示了人工智能技术发展背后的市场影响。特别在大数据时代开始之后,人工智能都是靠数据驱动的。因此,互联网本身给了计算机科学一个绝佳的实践平台来创造价值。王小川从用户的维度,和大家分享了他关于互联网未来产品需求所做的思考。
许多人以为搜狗是“转型”做人工智能,其实并非如此。王小川是这样解释的:
“作为一个做搜索的公司,本身对于技术的应用是很多的,无论是大数据的运用,还是现在对 deep learning (深度学习)的应用。所以技术走多远,我们的业务就能走多远。”
| 人工智能的三个分类
不同的人工智能有不同的定义方法,一开始,王小川就提出了不同于大家传统认知的观点,搜狗是从产品角度对人工智能的价值进行判断的,因此将人工智能的应用领域分为三类:识别、生成、决策。
从人工智能的主流发展看,最近在识别领域中,图片识别的能力得到了很大的提升,语音识别的水平也已经超过了人类。从学术领域里分析,做识别、生成、决策的相关研究是同等重要的。但王小川从商业角度给出了这样一个判断:
“在这 3 个领域里面,作为一个企业,要把它变成一个市场价值,识别和生成都很难有一个商业模式,只有做决策才能够变成商业智能里一个核心的过程。”
所以,投资界畅想识别领域中的佼佼者在未来会有极大的价值提升,这是很危险的一件事。所以,很多拥有很好的图像识别或语音识别技术的公司将产品投入市场后,往往找不到一个特别好的应用场景来实现市场价值。比如用于安防,并不能直接产生经济价值。这里王小川谈到最重要的一件事情是:
“用机器帮助人去做决策,其商业价值是最大的。”
搜狗输入法目前 PC 端用户规模在中国排名第一,无线领域排名所有应用的第三位,其中第一、第二分别为腾讯的微信和 QQ。
虽然用户规模巨大,但输入法本身并不能用于决策,只会根据输入检索结果。如果你输入“腾讯”绝不会出现“阿里巴巴”,你输入“淘宝”绝不会出现“京东”。输入法的作用在于精确地翻译用户的需求,没有决策过程,所以对商业价值无益。但搜索引擎不然,它本身可以通过关键词帮助用户做分析判断。这方面,搜狗目前在 PC 端排名第三,移动端已经上升到第二。
那么互联网上盈利的公司有多少呢?除了 BAT、360、搜狗这些以外,屈指可数,而王小川透露:
“去年搜狗仅靠搜索引擎就取得了 1 个多亿美金的利润。”
他认为,搜索本身是一个商业模式极好的互联网应用,广告本身不是错误,比如谷歌就做的非常好。很多公司虽然规模很大,但并没有走向盈利,比如滴滴、美团、京东。所以商业模式好,又能够快速盈利,这才是搜索的意义。
| 搜索的未来就是人工智能时代的明珠
王小川首先提出了 3 个关键问题:
搜索的未来是什么?
人工智能的未来是什么?
为什么是明珠?
王小川谈到 AlphaGo 是一个偏专项的、跟自然语言没有关系的智能系统,图灵测试也是另一个理想的智能模型,但并未展开这方面的话题。他将重点放在了人工智能能解决的事情上,从难度上可以分为语音处理、图像处理和自然语言的处理。
“我们以前发现最早开始的就是对自然语言的处理,对语音和图象的处理能力在很长一段时间内都是很差的。虽然我们觉得语音、图象更难,但事实证明最近几年我们很好地解决了语言和图象的问题。反而在自然语言的处理上发展变慢了,由于自然语言处理对感性理解的要求更高,自然语言本身怎么结合人的概念符号也是更难的事情。”
“那么,搜索未来是什么?简单来讲就是问答机器人。”
目前,大部分用户已经知道如何用关健词进行搜索,王小川提供了一个数据:97% 会用单个关键词搜索,3%的用户会在关键词中间使用空格。
但下一步要改进什么呢?有人提出:我们是不是能够做个性化搜索呢?这个答案其实是不对的。第一,关键词本身就隐含对个性化的体现。比如,关键词从很大层面上能分出男女来,用搜索引擎之后的帮助是有限的。即便有了个性化,我们也不知道搜索引擎就知道真正要表达的什么,比如王小川,只能给出百度百科、最近的新闻等等。第二,关键词导致信息量丢失,并不能有效提升搜索质量。通过一个关键词检索,并不能有效表达用户的全部意思。
也有人提出:通过语音进行搜索是不是改进呢?这也是一个错误的理解。因为用文字或者语言去输入王小川三个字,本质上并没有提升理解的水平。
王小川给出的答案是:
“更自然的交互,举个乔布斯的例子,向他致敬,他强调的就是用手势来跟机器进行互动,舍弃了鼠标,后来成为行业中的一种风潮,大家都懂得用手势去控制了。”
一个自然交汇带来夺大的魔力?所以这种情况下我们认为搜索的发展方向会走向提问,也许语音提问是最方便的,所以两层含义达到了,第一个是我们人更加的自然,第二个机器得到了更多的信息,你这个问题之后会得到明确的答案,今天这样一个搜索引擎的趋势从一个问题到一个更精确的回答。在很多年来,如果你不用问题,只用词,我是没有办法给你回答的,这件事情使得机器本身技术的瓶颈把我们推向了左边的关健词。
我们从 NOP 走向了 NOU,谷歌曾有个预测:未来 70% 的搜索是会给答案的。王小川认为这也就是说:
“70%的用户都在提问题。各家公司已经入局,苹果 Siri、微软 Cortana、亚马逊 Echo,以及谷歌 Asistant。为什么谷歌最后将胜出?
第一种可能是苹果公司技术基因不够,以为简单,发布以后却很被动,智能不断收购自然语言的公司;第二种可能是苹果知道自己技术不够,Siri 是在 iPhone 4s 那次一起发布的,乔布斯躺在病床上看直播,发布会结束以后没几天去世了,所以可能是他的遗愿,希望达到人类终极自然交互的程度,知道自己时日无多,所以提前把这个东西发布出来了。”
他还提到了超能陆战队的大白和阿西莫夫。王小川最喜欢的是《最后的问题》,人类极尽所有能力去造能回答问题的机器,但机器一直有个问题回答不了:宇宙最后会如何毁灭,又会如何诞生?直到最后人类毁灭了,异次元中还在运行的机器终于有了答案:要有光(圣经起源)。
“我依然坚信谷歌会走在前面,用户提问题,搜索引擎提供答案的模式是人工智能未来的发展和搜索未来发展的趋势,这也是我们在努力的一个方向。”
搜狗一直以来要表达的是更简单,那么输入法未来有怎样的一个发展空间呢?
搜狗输入法是10年前诞生的,输入法一面世的时候,就对词频、句法关系等做了统计,来做这个输入法,其实就是大数据,有的时候结果执行度不高,就会出现一个小云的标志,这就是云计算。本机有 40 万个词,如果本机的词频不够,就会通过云计算调用服务器上更复杂的模式。
今天搜狗的输入法达到一天 1.9 亿次的语言识别,用户输入的小时数是 57 至 58 万,这样的数据量比全国所有标注公司用于标注的时间还要长。掌握了更多资源和用户的搜狗输入法准备怎么做呢?王小川通过一连串的 PPT 展示了未来自动问答的输入法概念。
搜狗的理念:自然交互+知识计算
值得一提的是,今年王小川代表搜狗向清华大学捐赠 1.8 亿,共同成立天工研究院,搜狗也是本次 CNCC 2016 的金牌赞助商。由此可见,搜狗已经准备在人工智能领域继续深入探索搜索引擎和输入法的未来方向,为了能够实现人机自然交互的终极目标,搜狗正全力与学界进行广泛而深入的合作。
撰稿人:雷锋网 陈杨英杰
点击【阅读原文】查看CNCC2016大会日程
CNCC2016更多精彩文章请关注中国计算机学会公众账号
投稿:fancc@ccf.org.cn
授权:jyang@ccf.org.cn
长按二维码关注中国计算机学会