算法读心术：深度学习如何实现互联网的个性化？

查看原文

其他

算法读心术：深度学习如何实现互联网的个性化？

原创 2017-07-25 腾云腾云

个性化推荐正在从商家的卖点变成标配，许多平台声称推送给你的就是你想要的。但很多时候，这种个性化推荐并没有想象中“智能”，推送的信息和商品不一定是你需要的。

问题到底出在哪里？今天这篇推送认为是算法。

如果说数据是个性化的燃料，那么推荐系统就是推动个性化进步的引擎。在个性化领域，深度学习将会成为下一轮重大突破。无论是对电商平台、出版商，还是营销机构，个性化都将成为重点领域。

那么，深度学习如何改善推荐系统？如果一家企业想继续保持优势，应该在个性化方面做些什么？

本文由腾云编译。

深

度学习是机器学习的一个分支，它的方法很多，但最关键的是能够解决人工智能领域的一大重要目标：让计算机为我们的世界构建模型，从而使其展现人类所理解的“智能”。

深度学习的方法虽多，但他们有一个共同的基础特征：深度学习算法是通过多个“处理层”来解释原始数据的，而每一个“处理层”都会把前一层的输出作为输入，并最终创建出一个更加抽象的表示形式。

换句话说，深度学习为什么可以越“学”越聪明？因为它总是能通过低层特征来发现更高层的特征，进而表示更广泛意义上的属性类别或特征。

正因为有这样的“思考”特点，机器在应对大量数据时具有天然的优势——在特定场景下，只要“正确”的数据越多，机器根据这些数据归纳出的规律和特征也就越有普遍性，而在处理新的或类似情况时也就更加得心应手——数据越多它越“开心”、越“聪明”。

比如，Google翻译推出的近似于科幻场景的Word Lens（如下方图片所示），还有我们熟悉的Deep Mind在围棋比赛中的胜利，必须要归功于深度学习。当然，帮助AlphaGo获得胜利的算法，并不只是纯粹的神经网络，还融合了加强深度学习与树搜索等技术......

▲当你打开摄像头的时候，Word Lens可以实时将文本OCR识别、翻译、并覆盖到原始图像上

说了这么多，不难看出深度学习是一种解决“计算”问题的有效方法。它主要被应用在那些简单算法无法解决的复杂问题上面，比如上文提到的图像分类或自然语言处理。

但是，深度学习如今在商业中的应用非常有限。大部分应用机器学习的行业在深度学习上仍存在巨大的待挖掘空间，而基于深度学习的方法能够超过目前很多行业正在使用的“最佳方法”。比如：搜索引擎。不久之前，Google前人工智能负责人约翰·詹南德雷亚（John Giannandrea）已接管了公司的搜索部门，这一变动可能彻底颠覆整个搜索引擎优化领域（SEO）。

而我们现在能够肯定的是，在个性化（推荐/营销/推送等）领域，深度学习也一定会取得下一个重大突破。目前已有证据表明，无论对电商平台、出版商还是营销机构来说，深度学习都能提升销售效果、用户参与度，改善用户体验。

如果说数据是个性化的燃料，那么推荐系统就是推动个性化进步的引擎。下面，我们来具体了解三个领域，看看在这些领域中，深度学习是如何对现有推荐系统作补充和改进的。

基于“内容本身”的推荐

物品关联式推荐是推荐系统的一项标准任务。也就是说，电商平台向用户推荐的商品或内容，会与用户目前所浏览的物品相似。用“行话”说：推荐必须建立在当前已有的“元数据”基础上。

然而，元数据质量较差的问题在现实生活中反复出现：数值缺失、未经系统赋值......即使数据质量还不错，这些数据也只能间接描述商品的特征，而不可能对产品本身的细节进行更多描述。

深度学习将改变这一历史。

在应用深度学习之后，商品内容的固有特征——无论是图片、视频还是文本——都能被归纳到推荐系统里。

Spotify是个很好的例子。

从前，Spotify 主要依靠“协同过滤”驱动音乐推荐。原理很简单：根据用户历史使用数据确定用户的喜好。例如，如果两个用户收听大致相同类型的歌曲，他们的喜好大概就是类似的。反过来，如果两支歌曲由同一组用户所收听，这些歌曲听起来很可能是相似的。

不难发现，纯粹的协同过滤方法，除了相关的消费模式信息以外，不涉及被推荐物品（对于Spotify来说“物品”即意味着音乐）本身的任何信息。因此，同样一个模型既可以推荐书籍、电影，也可以推荐音乐和实体商品。

这个特点导致了它最大的不足：流行物品就会比非流行物品更容易得到推荐，而这只是因为前者有更多的使用数据，反过来说，它不能推荐新的和非流行的歌曲——因为如果没有可供分析的历史使用数据，协同过滤方法就会失效。

如今，Spotify已经开始考虑在推荐通道中结合其它信息源。例如，音乐推荐的信息有很多种：标签，艺术家和专辑信息，歌词，从网上挖掘到的评论、访谈，以及音频信号本身。

深度学习登场了。

具体来说，在这些信息源中，音频信号可能是最难有效利用的。一方面，由于音乐音频信号之间的“语义差别”很大；另一方面，影响听众喜好的因素又多种多样。比如，音乐的类型、演奏的乐器比较容易判断，而音乐的情绪、发行的年份（或时期）就没那么容易被判断。

尽管挑战重重，但是很明显地，歌曲实际的声音极大地影响到听众是否愿意收听，而基于内容本身的推荐显然远胜于基于数据的推荐。

解决冷启动问题

用户冷启动问题是指，当新的用户（比如那些刚注册的用户）还没有在产品上留下历史行为数据，系统就不那么“了解”客户的行为和信息。很显然，对于极其依赖数据的推荐系统来说，冷启动简直是头号敌人。

不过，对于上文提到的基于内容进行推荐而非基于数据进行推荐的方法来说，项目冷启动是一个不错的领域，因为它减少了系统对交互性数据的依赖。

你可能会问，对于那些刚注册的新用户来说，如何为他们提供有意义的个性化体验呢？

一个解决用户冷启动问题的有趣方法，是基于“会话”进行推荐。这意味着系统并不依赖客户的整个交互历史，而是将这些数据分解成多个不同的会话，机器可以从这些被打散的对话中捕获用户兴趣，然后构建的推荐流。简而言之，未来的推荐系统很可能不必依赖数月甚至数年时间精心制作的“用户画像”，而只需根据用户在网站上一段时间内的行为数据，就能给出合理的推荐。

目前，尽管这一领域的研究还不充分，但可能会为个性化在线体验带来巨大的机遇。

Gravity R&D公司的研究人员参与了欧盟资助的CrowdRec项目，并在一篇论文中介绍了如何利用一种卷积神经网络（RNN）方法提供基于会话的建议。虽然这只是第一篇试图利用深度学习来进行“基于会话的推荐”的论文，但结果已经表明，他们的方法显著优于当前使用的最新算法。

关于未来，我们可以抱有更多期待。

抓住四个关键时刻

四个关键时刻（The four moments of truth），指的是“用户根据与企业的交互或其他相关信息而作出决策的四段短暂时间”。

毫无疑问，用户在完成一个决策之前会受到诸多因素的影响：个人偏好、品牌忠诚度、瞬间印象......现在研究表明，在这些时刻，深度学习驱动的方法可能会左右人类的决策过程，这是深远而新颖的一种见解，在这个过程中，有四个“关键时刻”。

第零关键时刻（Zero Moment of Truth，ZMOT），消费者尚未接触到商品之前，就已经通过网络获得了对商品的印象。
第一关键时刻（First Moment of Truth ，FMOT），消费者在卖场的陈列架前面，面对琳琅满目的商品，脑子里对商品的印象。
第二关键时刻（Second Moment Of Truth，SMOT），消费者在购买了商品后，使用该商品时对其产生的印象。
第三关键时刻（Third Moment Of Truth，TMOT），消费者有了愉快的购物体验，成为一个品牌的粉丝和忠实用户，参与品牌互动，并将购物体验分享给他人。

例如，漂亮的商品图片可以推动销售（这就是为什么每个行业都在想办法为商品拍摄精美的照片）。不过，更有意思的是我们能够利用基于深度学习的图像分析方法来对图片做出评估，最终了解产品图像中的视觉特性是如何对销售产生显著影响的。

***

很显然，上文讲述的内容还远未完善。但毫无疑问，个性化是当前互联网行业最为迫切的需求之一，而深度学习无疑在此方面拥有巨大的潜力。因此，如果一个企业希望保持领先的地位，就需要密切注意该领域的进展情况。

原标题/ How Deep Learning is Personalizing the Internet，来源：Dataconomy

作者/ Huba Gaspar，供职于个性化专业公司Gravity R&D

// 往期回顾 //

如何对“越界获取隐私”说不？

注意：96.6%的APP正在偷窥你的隐私，怎么办？| 云报告

为了让老人“好好走路”，欧洲人真是绞尽了脑汁

麦肯锡报告：如果再不转型人工智能，这些行业将被越甩越远

互联网时代，《未成年人保护法》如何保护孩子的上网权利？