“中国青年阅读指数”报告在第三届“中国数字阅读大会”上首发
4月14日,“中国青年阅读指数”报告在第三届“中国数字阅读大会”上首度发布。该指数由中国青年出版总社与成都数联铭品科技有限公司(BBD)联合开发,开创了大数据技术追踪阅读行为的先河,是互联网+在内容生产和消费领域的深层次应用。
中国青年出版总社社长皮钧与成都数联铭品科技有限公司(BBD)CEO曾途认为,“中国青年阅读指数”是在国家大力推动“全民阅读”和国家颁布《中长期青年发展规划(2016-2015)》指导下进行的——青年发展和青年阅读已经进入“指数时代”,若要把握和引领这个趋势,必须抢占先机。
“中国青年阅读指数”通过抓取中国青年群体在各类阅读渠道的阅读行为数据进行分析,从中找出青年人的阅读偏好,再将不同时期的阅读偏好进行差分,从而发现阅读偏好的变化趋势。为了分析青年阅读行为,确定权重,项目组进行了大规模的问卷调查,回收来自全国各个城市共计40288份问卷,通过设置干扰选项排除无效问卷,最后得到有效问卷13770份。在有效问卷的基础上,该项目用大数据技术爬取和分析的数据总量超过100万条,未来还会爬取更多数据。
首期发布的《中国青年阅读指数报告》分为技术报告、解读报告以及以指数为依据所做的关于青春文学和女性阅读的专题研究。
技术报告
在技术报告中,首席指数专家陈沁博士、首席阅读专家庄庸博士全面解读了“中国青年阅读指数”的定义范围和计算逻辑,并公布了2017年3月指数数据。
该指数首先把青年范围限定为14~35周岁;其次,创造“阅读域”的概念,“阅读域”是指有相关阅读元素的标签集合体,含体裁、题材、地域、时间、性别等多个维度;第三,引入“社会必要消费时间”概念,即“现有的社会正常交往条件下,在社会平均的交往范围和交往形式下接受某种价值观念所需要的消费时间”;第四,精准界定阅读时长,即消费者为满足自身精神文化生活需要和提高知识技能而消耗的阅读时间的长短;第五,在媒介转型的时代背景下,重新理解“阅读行为”,如今青年人的“阅读”不仅包括对传统书刊的阅读,还包括在数字终端上对文字、图片等内容的阅读。
在阐明定义、提出框架的基础之上,陈沁博士阐释了“中国青年阅读指数”的计算方法:
1. 抓取各类阅读行为,并以“阅读域”进行归类。
2. 计算各大阅读域的阅读时长分配,每个阅读域的阅读时长分配的取值范围从0到100,代表该阅读域阅读时长在总阅读时长中的百分比。所有阅读域的阅读时长分配加总等于100。
3. 计算每一个阅读域阅读时长分配的两月差值,并最终构成一列向量,作为该月该阅读域的青年阅读需求指数,衡量青年在阅读该阅读域时的偏好变化。
4. 将不同阅读域的阅读行为偏好变化通过标签加总,得到总中国青年阅读需求指数。其中的权重通过海量调查数据获得。
而总的青年阅读指数由两个维度的数据构成:中国青年阅读需求指数和中国青年阅读供给指数。中国青年阅读需求指数表达的是青年在阅读时主动的偏好变化情况,而青年阅读供给指数则是内容供给方主动提供给青年的阅读内容变化。两者的形式相似,但反映的内容不同。对于青年阅读供给指数,不再抓取标准阅读域的阅读变化和好评变化,而是抓取各大内容供给方的推荐阅读变化,并同样通过一个复杂的公式计算出向量。
从中国青年阅读需求指数和中国青年阅读供给指数的变化中,可以观察到如下内容:
1. 青年阅读的偏好变化。从中可以得到以下信息:青年阅读的倾向发生了什么变化?哪些体裁较适应青年的阅读?哪类内容开始升温,哪类内容开始淡出青年的视野?如下图所示,反映了2017年2月、3月中国青年阅读需求指数的变化。
图1:中国青年阅读需求指数
2. 内容供应商供给的内容变化。与青年的阅读偏好变化相比,文化机构提供的内容是否能够满足青年的需求?两者是一致,还是背离?如下图所示,反映了2017年2月、3月中国青年阅读供给指数的变化。
图2:中国青年阅读供给指数
通过分析可以发现,中国青年需求指数和中国青年供给指数二者大致出现相互背离的趋势。文学、自然科学及教育阅读域需求指数下降较多,但供给指数却大幅上升;艺术、历史及经济金融管理阅读域需求指数上升较快,但供给指数却大幅下降。工学、哲学及社会科学、生活相关阅读域需求及供给均有所下降;法学、新闻传播广告及语言学阅读域需求及供给变化不大,相对稳定。
解读报告
第二部分解读报告,项目策划人、中国青年出版总社社长皮钧、首席阅读专家庄庸详细阐明了研发“中国青年阅读指数”的时代背景和深刻意义,介绍了“中国青年阅读指数”的具体内容和使用方法,以及它所折射的商业价值与现实意义。
目前中国青年的阅读已经从传统的“平”阅读时代,到“屏”阅读时代,再到互联网+“阅读指数”时代;从“书报刊”出版物,到“网络作品”,再到“小而碎”的微内容微文本……中国青年阅读的形态与业态、心态与生态都发生了巨大的变化。“中国青年阅读指数”提供了全价值链“指数观”,而这种“指数观”是破壁、跨界、打通所有内容形态与业态、心态与生态的最佳思路、逻辑和智慧。“中国青年阅读指数”致力于勾勒阅读“变化的轨迹”,找到能够贯通阅读变化之弧的“轴线”,帮助内容供给方找到“以变应变”的核心能力建设之路。
“中国青年阅读指数”提供了一种制定并使用“标准阅读域”的技术标准范式、数据能力和指数逻辑。具体而言,“中国青年阅读指数”从8000个标签的组合中推算出1000个“标准阅读域”,作为计算青年“总阅读属性”和“阅读偏好”变化的抓手——就像1000个常用汉字构成汉语书写的基本结构一样,这1000个标准阅读域能够在最大程度上反映所有的阅读属性,代表着阅读需求、内容供给和对接方式的最基本“技术标准”和相对系数。从而为衡量中国青年阅读的变化、趋势和程度,提供了“相对”的指数标准:“任何一个维度的阅读偏好变化,都会反映在标准阅读域组合的阅读数量中”——这不是静态的,而是动态的,一种基于现状和未来发展的“相对变化”。
在此基础上,“中国青年阅读指数”旨在通过数据、算法和指数重构一个映射中国青年的“表达框架体系”,帮助所有人,甚至包括中国青年自身,穿越造词、阅读潮流和思想情报的“层级”,直抵中国青年当下和未来正在发生着的框架体系演变和重构运动;进而重塑一个切中中国青年的“认知框架体系”,打碎与中国青年的“文化隔断”,按照中国青年的阅读生活尤其是精神生活的面貌来重新确立认识框架;最终重建一个能够容纳中国青年的“内容框架体系”,用指数估算中国青年阅读对社会转型、文化崛起,甚至是推动中国国家治理体系现代化和全球治理体系变革的作用。
为达到上述目标,“中国青年阅读指数”创造性地构建起三大“指数标尺”:衡量中国青年阅读“基本面”和变化中的“热点潮流”的标尺,衡量中国青年阅读“文明的母体”和“信息、知识与思想的碎片”的标尺,衡量中国青年阅读“社会必要消费时间”和“饱和度”的标尺。三大标尺构建了在中国青年阅读潮流和精神生活中起支配作用的“核心系统”。
由此,“中国青年阅读指数”为内容产业提供了市场逻辑和商业前景。它直接考量内容产业的“内容创生、内容传播和内容投资者”,捕捉中国青年需求暗流的“牵引力”,内容供给的“开发力”,以及寻找需求—供给“最佳匹配和对接”模式的“抽象力”。归纳来说,“中国青年阅读指数”为“内容投资”构建了一整套科学的预测、应用和估值体系。
除了1000个标准阅读域,2017年3月指数还发布了排名靠前的600多个标签,这些扁平化标签本身可以反映出许多内容,如“素描”标签2月份、3月份指数分别为0.001859、1.065395,呈明显增长趋势,结合高校艺术专业招生考试时间,可以看出增长的内在逻辑。这些扁平化标签的不同组合又可以产生不同的阅读域,以供多用途的学术或商业应用。
指数第三部分的“专题解读”就是这种应用的典型案例。如在《青年女性阅读研究》中,作者李天豪以言情小说、耽美小说、青春小说、女性文学、耽美漫画、网络文学、少女漫画等标签定义青年女性阅读域,从标签加总指数中看出女性文学的重要地位,进而以《三生三世十里桃花》为研究个案进行深度剖析,找出引爆“女性文学”的重要内核。
据了解,继“中国青年阅读指数”之后,中国青年出版总社、BBD还将研发推出出版机构影响力指数、作家影响力指数,继续在青年阅读领域深耕细作,全面追踪青年人热衷的热点话题、题材类型、潮流风尚,深度捕捉青年人的思想情报与价值观念,为青年阅读产品的消费与供给提供精准、全面的数据服务。
在“阅读与大数据应用”峰会上,中国青年出版总社社长皮钧、数联铭品(BBD)总裁曾途、数联铭品(BBD)首席科学家周涛、乐游资本合伙人段斌、易选股金融智能证券董事长易欢欢分别做了主题演讲,中国青年报社副总编辑毛浩,中国青年出版总社副总编辑李师东,中青网新媒体科技(北京)有限公司副总裁金锐,四川手机报总经理李铭海,数联铭品(BBD)首席经济学家陈沁,以及管平潮、夏烈、郭羽、庄庸、鱼人二代、侯磊等作了精彩分享。