查看原文
其他

你家产品在用户心里算哪壶?——用语义分析透镜瞧一瞧

数据冰山 数据冰山 2022-04-11

题图来源:@青蓝 2018年2月摄于西雅图水族馆

2017年,某厨房家电品牌客户需要针对其某一款养生壶产品做用户评论分析,同时利用其他18款同类竞品作参照体系,以挖掘用户有价值的反馈。而笔者有幸作为数据分析师参与到该项目中,从中学习语义分析与商业分析的应用场景。


准备工作

此次项目目标是帮助客户企业内部人员基于用户评论数据量化有价值的信息。那么,要在哪些维度上量化呢?我们大致可以根据用户关注度以及竞品的差异化组合定义以下四种维度:

  • 用户关注度低,与竞品差异化小

  • 用户关注度高,与竞品差异化小

  • 用户关注度低,与竞品差异化大

  • 用户关注度高,与竞品差异化大


接下来,我们开始定义数据。


  • 数据来源:天猫商城

  • 数据类型:非结构化数据(用户评论)

  • 时间范围:2017年

  • 产品数目:19款(从下图综合排名较高的产品里挑选)


分门别类

针对 19款产品在天猫商城2017年的用户评论数据量,我们进行了切词,词频统计,得到的词云如下:



基于上图,我们要怎么根据这些词云去挖掘重要的反馈呢?再分解一下问题,就是我们要怎么去量化和挖掘对客户有价值的信息呢?先不急,有一个很重要的环节就是要把这些零散的字词根据不同属性进行分类。例如,燕窝、花茶等归类为食物食材;方便、好用等归类为使用感受,以此类推。



划分区域

我们一面数据定义了两个无量纲指数,一个是体现目标产品与其它竞品分别在所对应评论中词频率的相对差异,另一个是体现目标产品本身的词频率。中间涉及了一些数学计算,就不在此处详细解析了。最终,把目标产品的词所对应的分类,映射到二维的坐标图上。我们以「食物食材」为例,如下图:



说明:

  1. Y轴(词频率):在评论中,针对某词,出现频率越高,Y轴的值越大,反之亦然。

  2. X轴(差异化):在X轴上正负之别是如果目标产品针对某词的出现频率高于其它18款竞品针对某词的频率,那么该词在X轴的值为正数,反之亦然。

那么,我们就可以在横纵坐标轴上大致划分文章开头所定义的四个维度了。




用户关注度低,与竞品差异化小【稳扎稳打】:这一块区域就是不能犯低级错误,才能谈得上进阶另外三个区域。

用户关注度高,与竞品差异化小【时刻警惕】:这一块区域意味着要紧跟行业的风向和标准,确保不要掉队。

用户关注度低,与竞品差异化大【扬长避短】:这一块区域可以挖掘哪些是值得保留的服务及功能。

用户关注度高,与竞品差异化大【招牌特点】:这一块区域决定了能否跟其他竞品一绝高下,建立自身品牌独有优势。


提炼信息价值,萃取价值精华

至此,我们已经定义好了数据,也对词云进行了分类,并且对这些分类完成了在二维横纵轴上的映射。接下来,我们可以摩拳擦掌的看看如何针对这些分类进行信息提炼了。我们以上图最右上角的「产品功效」和「活动」分别打个样,采用NLP(自然语言处理)对以上的分类所对应的原始评论进行评论情感分析,并以此进行进一步的挖掘。

在产品功效中,用户讨论最多的是「味道」。这个关键词所对应评论中,正面情感的评论比例较高,占比达到88%。

挖掘出大部分正面评价的用户是通过目标养生壶所制作出的食品味道感到满意,以下为部分原始评论截图。


看起来用目标养生壶烹饪银耳汤,干贝海鲜粥,银耳羹,炖子排这些食材的使用感受不错,如果还有更多相同共性发现的话,可以考虑在养生壶和礼品的结合中着重留意这几款食材。


而负面情感比例达到了10%以上,基本上负面评论的用户是对目标养生壶产品本身的味道有所非议,虽然这类问题看似被反馈的数量不多,但从时间的分布来看,这些问题并不是偶尔出现,这足以向负责产品体验的同学敲黑板了,以下为部分原始评论截图。



从以上评论中,我们也可以发现,一旦用户认为花的价钱贵了,那么对产品容错率也就非常低了,纵使其它功能万般好,但只要有瑕疵,那么都会跟价格作为绑定去吐槽。看来价格的制定是需要结合用户对产品的错误容忍底线。


我们再看看「活动 」分类,用户关注最多的是「送的 」关键词。该关键字所对应的评论的正面情感评论比例接近88%。


通过挖掘我们发现用户的大体反馈是目标养生壶精美,附赠的礼品多而靓丽,毕竟始于颜值而不终于颜值是能打动消费者好评的关键因素之一,以下为部分原始评论截图。



笔者感觉,打动消费者不仅仅要自身的底子够硬,包装精美和实惠也是能获取外貌协会的用户青睐,毕竟在这个看颜值的时代,实力够硬是入门门槛啊。


而负面情感的评论比例,虽然只占到7.3%,但从用户的负面评论里我们可以看到主要是针对送的食材料包质量及体验不满意。同理,如果这类问题出现次数过于频繁,最好防范于未然,否则会被衍生产品影响到了主体产品,得不偿失。以下为部分原始评论截图。



在评论中,居然还有用户出现腹泻不止的现象。建议负责食材的产品同学,在食材的烹煮上详细的给出注意事项,以及食材不适宜人群也要罗列出来。毕竟吃得健康,是很重要的民生问题。


其它分类,在这里我们就不一一分析了。通过以上的介绍,我们可以发现,根据分类的坐标定位,结合语义分析的情感划分,我们可以快速定位用户对于产品不同属性的针对性反馈,以此来提炼有共性和有价值的信息。


结语

笔者认为以往一招鲜吃遍天的打法已经逐渐被淘汰,各品牌厂商已经切换到更高维的模式去细分消费者不同的体验场景,用以来打磨产品及服务的爆点。随着消费者的认知升级,商家需要更多的去跟踪消费者对于自身产品及服务的全方位反馈。这样不仅在建立消费者对自身品牌的客观认知之余,也能在众多的价格战战役中建立稳固的堡垒。

在这种努力中,一面数据可以帮助商家可以把跨竞品用户评论收集起来,通过自然语言解析、聚类分析、情感分析、原文抽取,明确自己的招牌特点,找到需要稳扎稳打、时刻警惕、扬长避短的方面,根据客户反馈快速应对,适应消费升级的新常态。


可视化支持: wentu.ioTableau Software

更多文章关注:数据冰山-知乎专栏


点击查看历史文章,揭开冰山水面下更多的数据秘密!



知乎专栏:数据冰山

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存