查看原文
其他

这么多翻译机,搜狗家的翻译宝何以解决境外旅游的痛点

最「硬」的 深圳湾 2018-11-02


- shenzhenware -


1 月 24 日,搜狗在北京国贸举行了 2018 合作伙伴大会。会上,王小川详细阐释了搜狗围绕着「语言」处理为核心,布局 AI 的战略。而让 AI 战略落地,搜狗首先围绕着「翻译」功能,发布了「搜狗旅行翻译宝」与「搜狗速记翻译笔」两款硬件产品。


    用搜索扛起「打破语音壁垒」的旗帜,在翻译领域推进 AI 产品化


作为一家成立 15 年的「老牌」互联网公司,搜狗一直以语言为核心做技术积累。在语音方面,搜狗已经有语音识别、语音合成、声纹识别等能力;在图像方面,搜狗在乌镇世界互联网大会上亮相了唇语识别,将语音与图像进行结合;而在问答技术、对话技术、翻译技术等知识计算领域,搜狗都有领先的技术能力和落地的产品。


▵ 搜狗 CEO 王小川:围绕着「语言」处理为核心,布局 AI 的战略。图片来自:搜狗


搜狗在 AI 产品化方面频频秀成果。而在对话和问答以外,搜狗发现,语言处理技术今天 90%~95% 的实用集中在翻译领域。「翻译技术走向实用化的历史意义,不亚于人类发明了电。」也正是基于这样的思考,在过去的一年里,搜狗在翻译领域做出了不少动作:


  • 在 2017 年乌镇世界互联网大会上,搜狗展示了中英机器翻译技术,用户手里拿接收机、戴上耳机、就会听到有语音合成的翻译加入进来。


  • 搜狗英文搜索可以将中文翻译成英文,再检索全球信息后翻译成中文供阅读,还可以通过中文搜索英文信息。


  • 搜狗输入法提供自动翻译能力,无论是语音还是敲键盘,都能把用户输入的中文内容转成英文。


  • 基于英文语言的全球搜索,用户在搜狗搜索里面找到一个词之后,搜索也会给你展现国际信息版块。


  • 而在最新升级中,搜狗不仅可以搜索英文,还提供日文搜索


  • 在通用搜索中,根据用户需求提供日文、英文、韩文被翻译之后的信息,点击应用之后可以看到中文答案


    聚焦境外旅游场景,要有离线翻译和语音识别两大技术能力做支撑


搜索解决了对外检索的需求,输入法能使在线交流变得更加简单。为了让跨国交流更简单,搜狗还要从线上走下线下,首先聚焦的就是境外旅游场景。


为境外旅游提供翻译 APP 的产品不少,但是 APP 放在手机里面还是有两大痛点:


1. 网络信号不稳,即便是全依赖在线服务,不仅成本过高,品质也不好。


2. 翻译不准确,翻译技术跟语音识别紧密相关,而今天大部分手机没有麦克风阵列,在嘈杂环境收音准确度不高。


翻译不准确不仅需要解决翻译问题,还要解决语音识别问题。这需要两大技术。


1. 云端在线服务,解决上网要漫游费和网络不稳定的问题。搜狗拥有业界领先的神经网络压缩技术,离线翻译在离线模式下做压缩,使离线模型压缩在线五分之一,而在手机或者其它终端设备里,压缩程度为三十五分之一。同时,储存问题和识别得到解决,模型精度接近无损,并且实时响应。


2. 在语音识别方面,搜狗积累的定向波束能力,在空间当中扫描,找到最强声音,跟踪它以避免噪音干扰。在汽车、飞机等有规则的噪音环境中,搜狗还可以实现持续降噪。在语音增强的技术方面,搜狗可以实现放大原声。基于这些技术,实现在噪音环境下语音识别也能达到最高水准。


据搜狗官方称,测试表明,搜狗的声音处理能力超过苹果,苹果的声音处理是最高水平之一。


    一款翻译宝,一款速记笔


基于搜狗自研的深度循环神经网络机器翻译、语音识别、麦克风阵列、图像识别等多项技术,搜狗的「搜狗旅行翻译宝」与「搜狗速记翻译笔」这两款智能硬件产品,更多的是围绕其「语音」所积累的各项技术能力和产品化能力的集成和体现。



搜狗旅行翻译宝将为用户解决「网络不好」和「翻译不准」这两大核心问题。产品主要亮点如下:


  • 离线翻译:采用业界领先的神经网络压缩技术,将庞大的云端翻译模型压缩到 1/35 放入机器,模型精度接近无损,离线翻译效果媲美在线水平,让人们再也不用担心突然断掉的网络,给人们带来完美的跨国旅行体验。 


  • 双麦降噪:独特设计的指向性 I2S 双麦克风阵列结合波束成形、环境降噪、自动增益等技术,可有效降低环境噪音,实现 4-6 米收音清晰,有效提高翻译准确度。


  • OCR 拍照翻译:位于设备顶部的独立 OCR 翻译按键,一键就能开启拍照翻译。OCR 文字识别技术打造强大的图像识别引擎,与强大的翻译系统相结合,能让路牌、菜单等视觉信息瞬间被翻译,让陌生语言变熟悉。


  • 17 种语言,覆盖 200 多个国家:通过在线翻译、数据更新等操作的技术,能够实现包括中文、英语、日语、韩语、西班牙语、阿拉伯语语言的无障碍沟通。


  • 工艺设计:机身采用整块铝板数控机床切削成型,强度高、总量轻、手感佳,特殊的 R 角切削工艺,加工难度远超世面手机外壳,打造完美触感。


搜狗速记翻译笔可以实现录音转文字,同传翻译。说话不用太担心距离问题,远场拾音,确保声音输入;即录即转,翻译与继续沟通零延迟;蓝牙链接手机,即刻开始翻译。支持 17 种语言,形态小巧,携带便捷。


搜狗旅行翻译宝定价为 1498 元,搜狗速记翻译笔定价 299 元。两款产品将在 3 月 12 日,京东首发。



或许是上市压力大,或许是赶在春季新品上市前,或许又是因为在合作伙伴面前,搜狗发布的这两款硬件,都还只是「PPT 硬件」,从官方的材料和网络秀出的图片来看,我们还只能看到这样一个样品。不过作为一家技术驱动的互联网 AI 公司,硬件多为其能力的载体,人们更期待的是,无论是搜狗翻译机还是其他牌子的翻译机,真正能够解决实时翻译的问题。


主笔:陈壹零 / 深圳湾


 <深圳湾语音智能专题 > 


// 语音智能深度分析 //

语音技能 | 语音 OS 平台 | 语音助手

国内百箱争鸣 | 国外音箱全家桶


// 语音助手 //

语音助手排位赛

Google Assistant | Alexa | Bixby

DuerOS 小度助手 | Snips


// 语音智能设备 //

带屏幕音箱大盘点

Echo | Google Home

HomePod | 微软 Invoke 音箱

Facebook | 索尼 Xperia Hello

Anker | 天猫精灵 | 小米 AI 音箱

小雅音箱 | 叮咚 | Rokid


// 智能耳机 //

2018 智能耳机进化的三大方向

CES 上的智能耳机大爆发

智能耳机三年全盘点

CES 上的智能耳机大爆发

AirPods | Line Mar | 索尼智能耳机

 Mobius | iBFree 2 | VINCI


// 家庭陪伴机器人 //

索尼 Xperia Hello | Jibo 

Kuri | 富士康晓乐

Zenbo Qrobot 


// 语音智能平台商 //

DuerOS | AliGenie  | 腾讯云小微

思必驰 | 科大讯飞 | Rokid | 出门问问


//  方案商 & 开发者 //

DeepBrain | 海知智能 | 云知声

 图灵机器人 | 蓦然认知 微纳感知

羽恒科技 & 酷曼科技

杜志鹏 | 王兴超 | 杜军 | 宋少鹏


// 又见音箱系列课程 //

叮咚魏强:AI 音箱的设计、困境与出路

飞鱼吴冬:如何靠设计让产品脱颖而出


// 智能音箱产业链峰会 //

峰会回顾


// WARE 2017 语音智能峰会 //

第 II 季回顾

百度景鲲 | 富士康李国瑜 | 海翼阳萌 | Rokid Misa

思必驰赵恒艺 |  DeepBrain 李传丰 | 米唐宋少鹏

哈曼宋柏勋 | LifeSmart 董熠   | Vinci 朱大卫

灵隆科技魏强 & 超声音响刘晓彤 & 猫王曾德钧


第 I 季回顾

Alexa Travis Grizzel | 搜狗王砚峰 | 瑞声科技张金宇

优必选梁嘉豪 | Omate Laurent Le Pen | GGMM 童建超


 < 招兵买马 > 

深圳湾招人啦!!!深圳湾正在招聘「真知灼见的科技记者」、「四通八达的运营编辑」、「才华横溢的市场策划」、「技能爆表的活动运营」、「热情四射的社区达人」,如果你对科技领域有满满的热情、想把玩最新最酷的科技产品、喜欢分享一切有趣科技成果,那就快到「湾」里来吧!

简历传输门👉 s@shenzhenware.com


深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)


文章已于修改

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存