这么多翻译机,搜狗家的翻译宝何以解决境外旅游的痛点
- shenzhenware -
1 月 24 日,搜狗在北京国贸举行了 2018 合作伙伴大会。会上,王小川详细阐释了搜狗围绕着「语言」处理为核心,布局 AI 的战略。而让 AI 战略落地,搜狗首先围绕着「翻译」功能,发布了「搜狗旅行翻译宝」与「搜狗速记翻译笔」两款硬件产品。
用搜索扛起「打破语音壁垒」的旗帜,在翻译领域推进 AI 产品化
作为一家成立 15 年的「老牌」互联网公司,搜狗一直以语言为核心做技术积累。在语音方面,搜狗已经有语音识别、语音合成、声纹识别等能力;在图像方面,搜狗在乌镇世界互联网大会上亮相了唇语识别,将语音与图像进行结合;而在问答技术、对话技术、翻译技术等知识计算领域,搜狗都有领先的技术能力和落地的产品。
▵ 搜狗 CEO 王小川:围绕着「语言」处理为核心,布局 AI 的战略。图片来自:搜狗
搜狗在 AI 产品化方面频频秀成果。而在对话和问答以外,搜狗发现,语言处理技术今天 90%~95% 的实用集中在翻译领域。「翻译技术走向实用化的历史意义,不亚于人类发明了电。」也正是基于这样的思考,在过去的一年里,搜狗在翻译领域做出了不少动作:
在 2017 年乌镇世界互联网大会上,搜狗展示了中英机器翻译技术,用户手里拿接收机、戴上耳机、就会听到有语音合成的翻译加入进来。
搜狗英文搜索可以将中文翻译成英文,再检索全球信息后翻译成中文供阅读,还可以通过中文搜索英文信息。
搜狗输入法提供自动翻译能力,无论是语音还是敲键盘,都能把用户输入的中文内容转成英文。
基于英文语言的全球搜索,用户在搜狗搜索里面找到一个词之后,搜索也会给你展现国际信息版块。
而在最新升级中,搜狗不仅可以搜索英文,还提供日文搜索。
在通用搜索中,根据用户需求提供日文、英文、韩文被翻译之后的信息,点击应用之后可以看到中文答案。
聚焦境外旅游场景,要有离线翻译和语音识别两大技术能力做支撑
搜索解决了对外检索的需求,输入法能使在线交流变得更加简单。为了让跨国交流更简单,搜狗还要从线上走下线下,首先聚焦的就是境外旅游场景。
为境外旅游提供翻译 APP 的产品不少,但是 APP 放在手机里面还是有两大痛点:
1. 网络信号不稳,即便是全依赖在线服务,不仅成本过高,品质也不好。
2. 翻译不准确,翻译技术跟语音识别紧密相关,而今天大部分手机没有麦克风阵列,在嘈杂环境收音准确度不高。
翻译不准确不仅需要解决翻译问题,还要解决语音识别问题。这需要两大技术。
1. 云端在线服务,解决上网要漫游费和网络不稳定的问题。搜狗拥有业界领先的神经网络压缩技术,离线翻译在离线模式下做压缩,使离线模型压缩在线五分之一,而在手机或者其它终端设备里,压缩程度为三十五分之一。同时,储存问题和识别得到解决,模型精度接近无损,并且实时响应。
2. 在语音识别方面,搜狗积累的定向波束能力,在空间当中扫描,找到最强声音,跟踪它以避免噪音干扰。在汽车、飞机等有规则的噪音环境中,搜狗还可以实现持续降噪。在语音增强的技术方面,搜狗可以实现放大原声。基于这些技术,实现在噪音环境下语音识别也能达到最高水准。
据搜狗官方称,测试表明,搜狗的声音处理能力超过苹果,苹果的声音处理是最高水平之一。
一款翻译宝,一款速记笔
基于搜狗自研的深度循环神经网络机器翻译、语音识别、麦克风阵列、图像识别等多项技术,搜狗的「搜狗旅行翻译宝」与「搜狗速记翻译笔」这两款智能硬件产品,更多的是围绕其「语音」所积累的各项技术能力和产品化能力的集成和体现。
搜狗旅行翻译宝将为用户解决「网络不好」和「翻译不准」这两大核心问题。产品主要亮点如下:
离线翻译:采用业界领先的神经网络压缩技术,将庞大的云端翻译模型压缩到 1/35 放入机器,模型精度接近无损,离线翻译效果媲美在线水平,让人们再也不用担心突然断掉的网络,给人们带来完美的跨国旅行体验。
双麦降噪:独特设计的指向性 I2S 双麦克风阵列结合波束成形、环境降噪、自动增益等技术,可有效降低环境噪音,实现 4-6 米收音清晰,有效提高翻译准确度。
OCR 拍照翻译:位于设备顶部的独立 OCR 翻译按键,一键就能开启拍照翻译。OCR 文字识别技术打造强大的图像识别引擎,与强大的翻译系统相结合,能让路牌、菜单等视觉信息瞬间被翻译,让陌生语言变熟悉。
17 种语言,覆盖 200 多个国家:通过在线翻译、数据更新等操作的技术,能够实现包括中文、英语、日语、韩语、西班牙语、阿拉伯语语言的无障碍沟通。
工艺设计:机身采用整块铝板数控机床切削成型,强度高、总量轻、手感佳,特殊的 R 角切削工艺,加工难度远超世面手机外壳,打造完美触感。
搜狗速记翻译笔可以实现录音转文字,同传翻译。说话不用太担心距离问题,远场拾音,确保声音输入;即录即转,翻译与继续沟通零延迟;蓝牙链接手机,即刻开始翻译。支持 17 种语言,形态小巧,携带便捷。
搜狗旅行翻译宝定价为 1498 元,搜狗速记翻译笔定价 299 元。两款产品将在 3 月 12 日,京东首发。
或许是上市压力大,或许是赶在春季新品上市前,或许又是因为在合作伙伴面前,搜狗发布的这两款硬件,都还只是「PPT 硬件」,从官方的材料和网络秀出的图片来看,我们还只能看到这样一个样品。不过作为一家技术驱动的互联网 AI 公司,硬件多为其能力的载体,人们更期待的是,无论是搜狗翻译机还是其他牌子的翻译机,真正能够解决实时翻译的问题。■
主笔:陈壹零 / 深圳湾
<深圳湾语音智能专题 >
// 语音智能深度分析 //
// 语音助手 //
Google Assistant | Alexa | Bixby
// 语音智能设备 //
// 智能耳机 //
// 家庭陪伴机器人 //
// 语音智能平台商 //
// 方案商 & 开发者 //
// 又见音箱系列课程 //
// 智能音箱产业链峰会 //
// WARE 2017 语音智能峰会 //
百度景鲲 | 富士康李国瑜 | 海翼阳萌 | Rokid Misa
思必驰赵恒艺 | DeepBrain 李传丰 | 米唐宋少鹏
哈曼宋柏勋 | LifeSmart 董熠 | Vinci 朱大卫
Alexa Travis Grizzel | 搜狗王砚峰 | 瑞声科技张金宇
优必选梁嘉豪 | Omate Laurent Le Pen | GGMM 童建超
< 招兵买马 >
深圳湾招人啦!!!深圳湾正在招聘「真知灼见的科技记者」、「四通八达的运营编辑」、「才华横溢的市场策划」、「技能爆表的活动运营」、「热情四射的社区达人」,如果你对科技领域有满满的热情、想把玩最新最酷的科技产品、喜欢分享一切有趣科技成果,那就快到「湾」里来吧!
简历传输门👉 s@shenzhenware.com
深圳湾(公众号 ID:shenzhenware)连接全球硬件创新者,连接硬件生态链上下游,连接跨界产品的设计、技术、生产、渠道、商业、创新。深圳湾持续关注「AI+硬件」带来的场景和交互创新,以及与平台和应用相连的全产业链升级,欢迎相关团队与我们联系,微信私人客服:小炫(ID:warexx)。