其他

工程才是做AI的瓶颈!免费下载《AI 前线》11月刊

2017-12-12 AI前线

作者|Natalie
编辑|Emily
AI 前线导读: 如今的 AI 落地,核心是工程问题,不是算法问题,更不是“哲学”问题。一定要特别特别“土”,踏踏实实从朴素的运维、数据库、数据清洗做起,从实际的工程中逐步演化。如何按天迭代?如何构造联调系统?如何无标注数据启动?如何分离准确度和召回率要求?如何统一运用规则和统计?如何适应无明确衡量标准的开发?如何设计可演进的数据模式?如何提升数据可理解性?如何逐步提升规则系统的表达力?如何平衡黑箱和白箱模型的优缺点?如何在优雅架构和工期间取舍?等等,这些都是教科书上没有的答案。只有扎扎实实从工程出发,才能实事求是地发展出低成本的、有生命力的 AI 系统。

从能在顶会上发文章到能真正工程落地,中间的细节足够再读两个 PhD。                                                                                       

—— 鲍捷

《AI 前线》月刊是 InfoQ 策划的新月刊,旨在为技术人提供当今人工智能领军人物对技术和行业的评价、与大师共同探讨 AI 技术与应用、学习企业技术升级落地案例。11 月刊新鲜出炉,关注公众号,后台回复“AI”可免费下载!

生态评论
颜水成:学界与工业界的 AI 研究,有哪些重要不同?

学术界很多时候研究的目的,是要有成果论文发在最顶级的学术杂志上,也希望这些算法能够具有普适性,除了能解决自己的问题,其他人也能借鉴,最好能开源,所有的人都可以去使用,这样就能很好的提升自己在这个领域的影响力。

但是工业界不是这样。工业界要去探索商业,注定要有经济上的考虑,思考盈利模式,那对人工智能的考虑就会不一样。

在工业界里待过就会明白,人工智能本身并不是一个产品,不是单纯靠人工智能就能获得利益,必须要通过与自己的业务和场景相结合,才能发挥它的价值,核心算法只是其中的一个模块而已。无论是往前端走,还是往后端走,还是需要很多不同类型的人,才可以做出一个产品。

最重要的是,人工智能并不是一个静态的东西。比如说训练出来的模型,要用到某个业务场景里面,业务场景里产生新的数据,这些数据进一步提升人工智能模型的能力,再用到场景里面,这是一个闭环和不断迭代的过程。

另一方面,也是很多从学术界到工业界的教授和学者经常很容易犯的一个很严重的错误。就是认为技术在真正推动产品,但其实,用在具体的场景里面,技术只是起到一个非常小的作用,如果说它的贡献大概到 30% 到 40% 就不错了。

重磅访谈
商汤科技杨帆:AI 落地的关键是算法闭环

AI 技术落地需要与行业相结合,而如何去选择需要结合的行业就是第一个难题。杨帆说,“如果技术还没有到真正能成功的门槛,比如搜索引擎中的视频搜索,大公司不断积累可能没问题,但如果是一个小的创业公司,把它作为安身立命之本,难以得到回报,可能两年之后就死了。”杨帆表示,首先需要确认所选择的行业市场是一个真实有效、有规模的刚需市场;其次,需要在市场中真正拿到完整的闭环数据,才能获得持续性的进步;接下来,需要考虑行业当前的技术红线是不是在一个合理的区间内,介入太晚或介入太早,都是会有问题的;最后,在产品落地的过程中,需要考虑如何利用技术门槛期(通常 1 年到 1 年半)带来的优势,进一步建立行业壁垒,只有技术壁垒而没有行业壁垒的话,最后从长期来讲还是为他人做嫁衣。

从另一方面来讲,行业落地需要各种综合性的关键技术的整合。行业的需求往往是一些相对模糊的,而且从技术上来看是非常不明确的东西,这时候就需要有人有足够的能力去一一拆解。在杨帆看来,找到或培养一些既有技术背景、又对行业有足够深的理解的人才,是企业实现 AI 技术落地最关键的一点。他说到,“人才问题、团队组织问题、发展问题,特别是做 2B 行业,标准化与非标准之间的平衡性掌握,任何一个技术性产品落地会面临的共有问题,做 AI 技术落地,这些问题一个都不会少,而只会更严重。AI 人才是个更大的坑,AI 的技术性更深重,从过往来看,它跟行业的结合更弱,所以你想要真正去打磨出一个符合真正行业需求的产品的时候,需要把对行业的理解和对技术的理解融合在一起,这在我看来是最有挑战的,因为过去可能这个世界上基本不存在这样的人,对行业有理解的人很少。”

落地实践
图像算法在电商大促中的应用浅析

电商平台为用户带来价值的关键是保障商品丰富、价格合理、服务可靠,由此带来的挑战包括:如何提高商品管理的效率,以及如何改善用户体验。在众多的技术和产品方案中,图像算法作为一项重要能力,运用于电商场景中,支持上述业务问题的改善。本文将详细介绍蘑菇街如何结合实际业务场景,玩转图像搜索技术和图像标签技术。

人工智能在饿了么的应用实践

大部分人都点过外卖,外卖也逐渐成为了另一种中国特色。每天面对着巨大量级的订单数据,系统如何能够做到不出差错的精准下单并且实时追踪外卖小哥的送餐情况?人工智能又是如何在外卖应用场景中应用的?“饿了么”技术副总裁张浩将为各位读者带来他的经验分享。本文主题是关于人工智能在 “饿了么” 的应用实践,主要分为三部分,分别为 “饿了么” 简介、 “饿了么” 的应用场景,以及运筹优化与机器学习的应用实例。

准确率 99% !基于深度学习的二进制恶意样本检测

全球正在经历一场由科技驱动的数字化转型,传统技术已经不能适应病毒数量飞速增长的发展态势。而基于沙箱的检测方案无法满足 APT 攻击的检测需求,也受到多种反沙箱技术的干扰。在充分考察过各种技术方案的优劣后,瀚思科技开发出了基于深度学习的二进制病毒样本检测技术,可以做到沙箱同等水平的 99% 的检测准确率,而误报率低于 1/1000。

本文首先介绍了病毒检测的技术沿革,各种技术的优劣和取舍;然后说明了为什么深度学习可以很好地应用于病毒检测,具体解读了翰思科技是如何应用深度学习的、用的什么网络、中间有什么技巧;最后是瀚思科技从实际操作中得到的一些经验教训以及下一步的发展规划。

阿里小蜜:电商领域的智能助理技术实践

在全球人工智能领域不断发展的今天,包括 Google、Facebook、Microsoft、Amazon、Apple 等互联公司相继推出了自己的智能私人助理和机器人平台。

智能人机交互通过拟人化的交互体验逐步在智能客服、任务助理、智能家居、智能硬件、互动聊天等领域发挥巨大的作用和价值。因此,各大公司都将智能聊天机器人作为未来的入口级别的应用在对待。

2015 年 7 月,阿里推出了自己的智能私人助理 - 阿里小蜜,一个围绕着电子商务领域中的服务、导购以及任务助理为核心的智能人机交互产品。通过电子商务领域与智能人机交互领域的结合,带来传统服务行业模式的变化与体验的提升。

在去年的双十一期间,阿里小蜜整体智能服务量达到 643 万,其中智能解决率达到 95%,智能服务在整个服务量 (总服务量 = 智能服务量 + 在线人工服务量 + 电话服务量) 占比也达到 95%,成为了双十一期间服务的绝对主力。

本文对阿里小蜜在电商领域下不同场景的技术实践进行了全面的解读,包括基于增强学习的智能导购、基于知识图谱和语义索引的品类管理、基于知识图谱和相似度计算的属性管理、智能服务:基于知识图谱构建与检索模型的技术实践、智能聊天:基于检索模型和深度学习模型相结合的聊天应用等。

推荐阅读
TensorFlow 与深度学习

本文作者是来自 Google Brain 的工程师,目前正在做 TensorFlow 和 TensorFlow 分布式的开发以及使用机器学习来优化 TensorFlow 的研究项目。本文将深入分享深度学习的案例和 TensorFlow 的一些最新特性,以及他本人在 Google Brain 的研究项目。

ImgeNet 冠军带你入门计算机视觉:监督学习与神经网络的简单实现

近几年,人工智能的浪潮席卷了整个科技圈。Google,Facebook,微软,百度等全球最顶尖的科技公司都将目光转向了人工智能,并将之视为今后的战略重心。 随着人脸识别,辅助驾驶,AlphaGo 等应用的不断涌现,基于学习的计算机视觉(learning based vision)正在越来越多的改变我们的生活。

“ImgeNet 冠军带你入门计算机视觉”是由多次参加 ImageNet 等世界著名人工智能竞赛并获得冠军的奇虎 360 高级数据科学家董健带来的系列文章,将逐步介绍这些看似神奇的系统背后的视觉算法原理。本文是整个系列的第一篇文章,将会简单介绍一下计算机视觉的发展,以及监督学习、神经网络的基本原理;最后的实 59 32124 59 19084 0 0 11032 0 0:00:02 0:00:01 0:00:01 11031部分会用 TensorFlow 给出之前介绍算法的一个简单实现。

最后提醒一下:扫码关注公众号,后台回复“AI”可免费下载!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存