查看原文
其他

知乎Top20专栏用户的那些事

数据冰山 数据冰山 2022-04-11

数据冰山知乎专栏的关注用户已过15万,踏入知乎专栏关注量TOP10。

数据冰山的用户有哪些特点?和关注量较大的其他专栏相比呢?其他的高关注专栏又各自有什么特点?


我们抓取了知乎关注量前20的专栏,以及关注它们的用户的信息。这20个专栏关注用户数如下:

截止至8月底,进入知乎专栏TOP 20的门槛约为9万7千人(谢熊猫出没注意)。排名前20的知乎专栏,大概可以分为以下派系:

1. 知乎官方队,或者和知乎联系紧密的专栏。例如:官方的 “知乎电子书”、扒知乎热门内容的 “知识青年”。

2. 两性提升类。着重于女生美妆、穿衣搭配的“女神进化论”、“美即是正义”;以及关注健身的“硬派健身”和“健身自习室”。其中,“女神进化论” 的关注人数已经超过知乎官方的知乎电子书,位列所有专栏的第1位。而侧重男性健身的 “硬派健身” 也仅次于“女神进化论” 和 “知乎电子书”, 位列第3位。男生女生们对自身吸引力的提升的关注可见一斑(果然性吸引力是第一生产力)。

3. 兴趣爱好类。例如: 关注美食的 “下厨房” 和 “你不可能做不好一锅红烧肉”, 关注住宿的 “好好住指南”, 关注旅行的 “一群旅行体验师”, 关于电影的 “知影”, 关于心理学的 “幸福课” 和 “潜台词”。

4. 故事类。例如:“故事贩卖机”、“异教徒告解室”等。

5. 独立作者类。主要由是知乎大V开创的个人专栏,内容未限定,主要靠大V个人魅力获得广泛关注。例如:张佳玮的 “张佳玮写字的地方”、谢熊猫君的 “谢熊猫出没注意”、以及葛巾的 “女院的教室”。

6. 技能类。主要是路人甲的 “学习编程” 和你现在所处的 “数据冰山”。 数据冰山目前关注人数在15万出头,位列第9位。


用户基本兴趣取向

这20个专栏的男性比例如下:

20个专栏中,大多数都是男性占优势。其中,“学习编程” 以85%的男性占比排到了第1位,这跟该专栏的主题有莫大关系。而关注数据分析在商业领域应用的 “数据冰山” 也以将近80%的男性比例排到第2位。唯二的男性比例不过半的专栏为:“女神进化论” 和 “美即是正义” —— 这里是爱美妹子的主场。

为了了解用户的基本兴趣取向,我们选择从用户填写的专业入手,从专业洞察用户的兴趣特征。为简化问题,我们将用户填写的专业重新归类为:文科、理科、社科、法学、商学、艺术、工程、医学等几个大类。再按照这几个大类的特点,为其在 “文科 vs. 理科” 和 "基础学科 vs. 实践学科" 两个维度上进行重新编码。编码对应表如下:


由此得出这20个专栏在两个维度上的分数:


以 “学习编程”为代表的实践理科型 和 “女神进化论” 为代表的基础文科型 构成了知乎专栏TOP20的用户的两极。其中,“学习编程” 以超高的理科占比和实践类学科占比成为离群点,这和其比例超高的工科学生占比有关。内容相似的专栏也在专业维度上呈现出临近的特点:例如同样关注女生美妆和搭配的 “女神进化论” 和 “美即是正义” 距离很近;同为作者个人专栏的 “张佳玮写字的地方” 和 “谢熊猫出没注意” 靠的很近;“知乎电子书” 和 “知识青年” 比较接近。当然也有一些意外的情况:关注数据分析的 “数据冰山” 和关注健身的 “健身自习室”的关注用户在专业维度上竟然相差不多(这是怎么回事?)。

男性占比和“文vs理” 的相关系数为0.84, 男性占比和“基础vs实践” 的相关系数为0.76, 专业维度的两个维度的相关系数达到0.91。三者均为高度相关,反映了这三个指标下衡量的内容的一致性。若将三者化而为一,则生成了知乎专栏用户兴趣取向的基本维度。简单地将三个指标归一化之后平均,得到:


在基本兴趣取向的维度上,这一边,是主打基础文科女的 “女神进化论” 和 “美即是正义”;那一边,是主打实践理工男的 “学习编程”。其余专栏在基本兴趣维度上则处在二者中间的位置,程度不一。数据冰山则在实践理工男的维度上仅次于学习编程,以对实践类理工科有兴趣的男生为主。


从用户看发展前景

用户行为的数据指标多而杂,为简单起见,将指标划分为以下三类:

1. 内容生产:答题数、发布文章数、发起的知乎live数;

2. 内容关注:关注人数、关注问题数、关注专栏数、参加的live数和关注的话题数;

3. 个人成就:获得的赞同数、被感谢数、被收藏数和被关注的用户数。


将其赋予不同的权重,来得到内容生产量、内容关注量和个人成就三个指标。这20个专栏用户的平均内容生产量和平均内容关注量如下:

内容生产量和内容关注量是正相关关系。


这些专栏用户的平均内容生产量和成就如下:

内容生产量和成就有强相关性(0.95),而内容关注量和成就、内容关注量和内容生产量的相关度也达到0.9上下。这说明了这三个指标都反映了类似的东西,即用户活跃度。三个指标标准化和平均之后可以得到统一的指标,视为用户活跃度。“异教徒告解室”、“女院的教室”、“谢熊猫出没注意” 及 “知识青年” 拥有较多在知乎上活跃的用户;而 “女神进化论”、“股市贩卖机”、“下厨房” 等则拥有较多在知乎上不活跃的用户。


可以预期:若某一专栏拥有越多在知乎上活跃的用户,则它越可能有更大的增长空间;因为越活跃的用户会带来更多的点赞,让更多的人看到专栏新发的文章,带来越多的关注。然而,事与愿违,这20个专栏从6月到8月的关注用户增长量和用户活跃度(内容生产量、内容关注量和个人成就的标准化后的平均)的关系:

用户活跃度和近两月的用户增量竟然呈现出较为明显的负相关!!!相关系数为-0.54,为中等程度的负相关。结果虽然令人震惊,但细想一下,也符合逻辑。可能的原因如下:

1) 由于专栏的内容和主题相对固定,每个专栏的潜在用户量是有理论极限的。从专栏的成长周期来看,一个早期的成长期的专栏,首先会吸取大量低活跃、贡献小的小白用户来关注;随着专栏逐渐做大,知名度逐渐提高,本领域较为有影响力的活跃用户,甚至大V,开始关注,推高了专栏用户整体的活跃度;而专栏的衰退,即用户的取关,也是从小白用户开始,留下的是本领域较为活跃的活跃用户。因而,较高的用户活跃度可能反映了专栏的潜在用户逐渐见顶,专栏处于稳定期甚至衰退期的状态。

2)另外一个可能的原因在于,高活跃用户聚集的专栏往往比较小众。这些专栏吸引了本领域较为活跃的人群,也给不熟悉本领域的用户设置了一定的准入门槛,导致这部分专栏用户活跃度高,但是进一步增长乏力。而以低活跃的小白用户为主的专栏往往比较大众,对于新的用户而言也没有什么门槛,所以增长较快(所谓得屌丝者得天下)。

不论哪种原因,用户活跃度(指在知乎整体的活跃度)和专栏用户增量潜力的关系是基本可以确定的:即用户活跃度越低,增长潜力越大。从这个规律来看,如果没有内容和主题上的重大变化,“女神进化论”、“故事贩卖机”、“下厨房”、“学习编程”、“一群旅行体验师” 等在可预见的未来,仍然有较大的增长空间;而“异教徒告解室”、“女院的教室”、“谢熊猫出没注意” 等的用户增长将会比较有限。当然也有例外,关注数据分析的 “数据冰山” 就以中等的用户活跃度获得了近两个月来最大的用户增幅。。。

总体而言,一个专栏的内容吸引了大量志趣相投的人聚集在一起;而用户的喜好、关注与活跃,反过来也重塑了专栏的品牌印象和成长周期。


感谢有你。


点击查看历史文章,揭开冰山水面下更多的数据秘密!



知乎专栏:数据冰山

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存