查看原文
其他

联仁大咖说|数据分析中的常用方法(上)

LIANREN 联仁健康 2024-01-09

前言



进入21世纪以来,随着互联网迅速发展,大数据、云计算等技术应运而生,越来越多的数据被发掘和利用,比如用户的各种购物行为,网站观看视频行为等,都会形成各种各样的数据,通常对这些数据进行加工分析之后,便可以得出用户的购物习惯,最近哪部电影最受欢迎等信息,这些都是数据分析得到的结果。以上只是数据分析应用的小部分,现如今数据分析被广泛应用到各个领域,比如医疗、交通、金融等。


数据分析目的,本质上是对各种海量的数据,不论是结构化的,非结构化的数据进行标准化处理,然后运用相应的分析思想、方法,去掉无用信息,提取关键信息,通过数据分析的算法、模型、公式等途径,不断在数据分析结果中寻找问题的最优解,然后把信息提供给业务端,辅助其做出相应的决策,以此不断完善所提供的服务或产品。以下以医疗数据为例,为大家简单介绍一些常见的分析数据过程用到的思想方法。


主题分析


顾名思义,主题分析就是将海量的数据,按照业务需求,划分出不同的主题,针对各个主题设定不同指标,根据指标的数值来观察业务实际运行情况,并以此为依据做出整体决策。例如分析感染患者的pct(降钙素原)使用情况(图1),可以分为业务量主题、抗生素使用主题、费用主题。

图 1| 感染患者pct检测主题分布


每个主题下对应设定好的各个指标,将该主题进一步细化,便能全面的了解信息,示例如下,业务主题(图2):  

 

图 2| 业务主题


   抗生素使用主题(图3):

图 3| 抗生素使用主题


费用主题(图4)

图 4| 费用主题


这样划分就可以从各个方面了解一个pct检测的使用情况,进而判断早期开展pct检测对细菌感染是否起到积极有效的作用。



下钻分析


通常也叫钻取分析,有向上钻取与向下钻取两种方式,钻取是改变维度,变换粒度的一种分析。向上钻取就是从低维度、细粒度逐渐向高维度、粗粒度的一种转变。向下钻取则相反,同样以pct使用情况为例,我们分析上面抗生素使用率时,通常是从高维到低维的思路,按医院级别->单家医院->科室思路进行分析,如下图(图5):

图 5a| 下钻到医院级别,点击“back”可返回上层维度


图 5b| 下钻到单家医院,点击“back"可返回上层维度


下钻分析算是最常见的“分析方法”。该方法把杂乱无章的数据串联到一起,从最开始的粗粒度逐步到细粒度,有种‘拨开云雾见天日’的感觉,它可以更好的引导用户观察数据、发现问题,以便做出相应的决策。


比较分析


俗话说“没有对比就没有伤害”,通常比较分析有时间趋势分析、组成分析、多指标分析等,比较方式有数值比较,比值比较。数值比较通常指平均数,中位数,或者某个业务指标对比。比值比较通常指同比,环比这样的对比,比值比较可以看出某个时间段内业务趋势的变化。做过产品经理的同学可能用过一种叫“A/B测试”,来验证哪一种设计方案更优,其背后的逻辑也是运用了对比分析。同样以pct检测数据分析为例子,我们会设定一个对照组,即做了pct检测人群与未做pct检测人群的对照。


下面图片举例了时间趋势(图6),组成分析(图7),多指标分析(图8)。


图 6| 抗生素使用率时间趋势


图 7| 住院费用组成


图 8| pct检测多指标分析


免责声明:本文仅用于解释数据分析的基本技术。这并不意味着为分析结果提供任何医疗建议。


供稿:医药事业部


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存