智能化推荐在新闻客户端中的应用与探索
智能化推荐是近几年异军突起的一项新媒体分发技术,广泛应用于各大新闻资讯客户端,但因这项技术开发难度较大,应用效果也不尽相同,很多后来者虽然跃跃欲试,但也顾虑重重。2021年2月6日,“正观新闻”客户端全新上线了智能化推荐功能,经过一年多的实践,取得了不错的应用效果,助力“正观新闻”客户端快速进入全国原创新闻类客户端第一梯队。
01
智能化推荐的市场环境
智能化推荐是人工智能在新媒体应用中的一个分支,也是目前传媒行业非常推崇的一项分发技术。“今日头条”客户端就是智能化推荐应用的成功案例,几乎凭一端之力,把中国乃至世界的新媒体分发,带入了智能化推荐时代。随着头条的日趋做大,腾讯、凤凰、新浪等如梦初醒,紧急上线形式各样的智能化推荐功能,资讯市场上还涌现出诸如“东方头条”、“趣头条”、“天天快报”等同类产品,但“千人千面”的智能化推荐标签,已经牢牢地贴在了头条系产品的头上,再也没有竞品能撼动它的江湖地位。可以说,智能化推荐成就了“今日头条”以及头条系庞大的产品库,让字节跳动成为中国最大的移动资讯流量入口。
2020年9月13日,郑州报业集团精心打造的“正观新闻”客户端正式上线,愿景是建成新型主流媒体平台,并承担起郑州报业集团媒体深度融合和产业升级转型的重任。“正观新闻”客户端建设之初,就把智能化推荐当成了重大攻关项目和产品特色,进行了科学的规划和设计。
“正观新闻”技术团队认为,“今日头条”的智能化推荐是“正观新闻”客户端的学习榜样,但又不能生搬硬套。二者出生相距近10年,媒体环境已经发生了重大改变,技术的提升和资讯市场的成熟,让“正观新闻”不得不认真审视自己,努力打造适合自己的智能化推荐产品。
02
“正观新闻”客户端智能化推荐的实践
2021年2月6日,“正观新闻”客户端2.2.1版本上线。这是“正观新闻”正式上线半年以来,集30余名技术人员之力,推出的重大举措。客户端头条频道全新改版,新闻列表页增加搜索框、新闻热榜及推荐频道;上线智能推荐功能,根据用户阅读文章喜好智能推荐其感兴趣的资讯。
这项技术集成了第三方的智能化推荐引擎,并在策划和设计中得以应用不同的推荐策略和形式,给读者以更加优秀的阅读体验,为内容引流。同时,部分产品的细节在使用过程中不断调整、优化、更新换代。
本次建设的智能推荐系统基于“正观新闻”客户端智能推荐的需求,及第三方数据机构对同行业个性化推荐系统建设经验,可以满足以下需求:一是基于“正观新闻”客户端应用场景的推荐,支持各栏目中Feed流、详情页、搜索页中内容的个性化推荐、相关推荐、热门推荐;二是基于“正观新闻”客户端内容类型的推荐,实现对现有新闻内容的智能推荐,由于视频内容推荐更加复杂,此次更新版本暂不涉及;三是支持多维度的智能推荐,支持按用户偏好、热门、相关性、地理位置、栏目等维度进行推荐;四是支持对推荐效果的简单分析,系统支持按点击率、曝光量、点击量等维度对推荐效果进行评估,从而帮助优化推荐策略,更好地实现推荐服务。
03
智能化推荐系统的数据依赖
智能推荐的效果是由数据与推荐模型决定的,所以在智能推荐系统中除了选用合适的模型外,最重要的就是获取全量的数据,数据是建设智能推荐系统的根基。在本次智能推荐项目中需要用户属性数据、用户行为数据和物品信息数据。
一是用户属性数据。用户属性数据主要指用户的基本属性,基本不需要改动的数据,如年龄、地域、性别等。二是用户行为数据。在智能推荐系统中,用户行为数据是最为重要的一部分,主要用来描述哪个用户在什么时间,什么地点,通过什么方式做了什么事情。用户行为数据主要有两个目的:一方面是训练推荐模型的最为重要的数据来源;另一方面,需要通过用户行为数据作为反馈,才能知道推荐系统的效果如何,从而及时迭代推荐策略。搭建智能推荐系统的一个秘籍就是积累用户行为数据,如果没有将重要的用户行为数据做采集,那么推荐系统的效果肯定是得不到保证的。三是物品信息数据。物品信息数据是指推荐系统中能采集到的描述每一个内容的信息,主要包括内容ID、标题、类型、标签、发布时间等。
04
智能推荐系统效果评估
智能化推荐系统的建设不应是为了建而建,应该让智能推荐系统发挥价值,而智能推荐效果的评估是评价系统价值的重要标准,“正观新闻”客户端智能推荐效果通过以下几个指标进行评价。
一是点击率。点击率是评价推荐效果的重要指标之一,记录了用户每次进入推荐内容的点击情况,能够粗略衡量转化效果。通过智能化推荐上线一年来的数据对比,发现月均点击率提升在15%以上,智能化推荐效果明显。
二是点击人数比。点击人数比是点击的人数除以推荐曝光人数,是用来衡量推荐系统触达率的重要指标。在评估推荐模型效果时,可能点击率上涨,但点击人数并没有变化,这说明推荐结果只对于部分老用户产生了比较好的效果,对于其他的用户,仍然没有成功吸引他们,所以点击人数比与点击率是对推荐系统从不同维度的评估。“正观新闻”客户端智能化推荐上线半年来的数据表明,点击人数比上升了35%。
三是人均点击次数。人均点击次数是指每个人在推荐系统中平均每天点击了多少次。人均点击次数能真正体现出用户使用产品的深度,故该指标是需要持续关注的指标。“正观新闻”客户端智能化推荐上线半年来的数据表明,人均点击次数上升了68%,效果非常突出。
四是留存率和转化率。留存率和转化率对于推荐系统来说,可能并不是一个非常直接的指标,如推荐对留存的影响到底有多大,很大程度上取决于内容的质量和类型,但它仍是我们评估推荐系统的一个指标,至少我们需要知道此次推荐系统的迭代到底对于留存率的影响有多大。如果迭代后的留存率下降,即使点击率和点击人数都在上升,但这一次迭代也无法上线,因为它影响了留存的指标。“正观新闻”客户端智能化推荐上线半年来的数据表明,留存率上升了23%,转化率上升了39%。
05
智能推荐系统的关键点
“正观新闻”客户端智能化推荐上线以来,虽然分发效果明显,但也面临着几个突出问题。
一是冷启动问题。基于新用户冷启动的问题,是智能推荐面临的一大难题,由于是新用户,所以基本拿不到用户信息,造成推荐没有依据,无法有效的推荐模型,推荐效果不佳。正观技术团队的解决方案是,针对新用户的推荐策略做出如下调整:推荐日期较新的新闻、视频、资讯等内容;推荐浏览量TopN的新闻、视频、资讯等热点内容;推荐用户互动(点赞、评论、转发、收藏)TopN的新闻、视频、资讯等内容;对推荐效果及时评估,及时调整推荐策略。
二是时效性问题。市场上的智能化推荐产品,多是UGC聚合平台,绝大多数内容对时效性要求不高。而“正观新闻”这类新闻客户端,以原创内容为主,智能化推荐系统向用户推荐的内容应该是实时的,而非以用户上周甚至上月的行为特征为依据向用户推荐内容,所以数据采集的实时性非常重要。如果不能满足时效性,智能化推荐的效果就会大打折扣。“正观新闻”客户端的做法是和国内知名新闻客户端互换版权,最大可能地丰富新闻资讯,并积极开设“正观号”等栏目,多种举措吸引UGC聚合内容。
三是多样性问题。智能化推荐需要按比例向用户推荐不同类型的内容。用户可能有这样的体验:如果你对体育内容感兴趣,慢慢地你所有的推荐内容都变成了体育相关内容,似乎很难看到其他内容,推荐的范围越来越窄。短期来说,提升多样性可能会让点击率有一些损失,但是长期来说,多样性是为了提升整个产品用户体验所做的一种优化,这里需要考虑长期和短期的权衡。正观技术团队的做法是:人工部分干预推荐的内容,人为强制加入推荐元素和推荐栏目、位置。
四是稳定性问题。如果服务器经常宕机,或者说响应时间超过五秒钟,这样的服务基本上是不可用的。我们需要站在服务的角度去建设智能推荐系统,为用户提供成熟且稳定的智能化产品。
智能化推荐越来越多地应用到传媒业,引入形形色色的资讯产品中。但人工智能不是人工全能,机器可以替代我们的部分工作,但在开发、部署和应用过程中,还需要诸多人工干预。我们可以依靠智能化推荐,但绝不能依赖它,要通过不断研究与开发,让机器更善于学习,更了解用户的需求,更精准地推荐内容。(作者系郑州报业集团中原网总编辑)
编辑:左志新
本文刊发于《传媒》2022年12期