其他
10种数据分析常用的统计学方法,附应用场景
“作为数据分析师,掌握基础的统计学知识是非常有必要的。”从起源角度来看,数据分析是「统计学」与「计算机」的交叉学科,统计知识应用其中;从工作角度来看,应用统计学知识,可以更为科学的度量数据对业务的价值。因此,作为数据分析师,掌握基础的统计学知识是非常有必要的。下面,为大家总结了工作中常用的10种统计学方法。描述性统计常用指数:★★★★★描述性统计,通过概括性的数学方法及图表方式,描述业务数据及其分布现状,在工作中是最为常用的。涵盖内容如下:工作中主要应用场景如下:假设检验常用指数:★★★★★假设检验,用于判断样本与样本、样本与总体之间的差异,是由抽样误差所导致的,还是由于本身就存在差异。其中主要涵盖「参数检验」和「非参数检验」,两者的概念如下:参数检验:假设数据服从某一分布(一般为正态分布),通过样本参数的估计量对总体参数进行检验。非参数检验:不考虑总体分布形式,直接对数据的分布进行检验。涵盖内容如下:工作中主要应用场景如下:回归分析常用指数:★★★★★回归分析,用于日常指标的拟合,以及对于未来趋势的预测,在工作中应用较为广泛。涵盖内容如下:工作中主要应用场景如下:聚类分析常用指数:★★★★聚类分析,用于将用户/内容,在没有先验性指引的情况下,分门别类的进行划分。涵盖内容如下:工作中主要应用场景如下:判别分析常用指数:★★★★判别分析(分类问题),通过研究对象的特征判断所属的类别。与聚类分析的差异在于,聚类分析在分析前,不知道类别有几类以及是什么,而判别分析是在总体类别已知的情况下,对新样本判断所属群体。涵盖内容如下:工作中主要应用场景如下:相关分析常用指数:★★★★相关分析,用于判断现象之间的某种关联关系以及关联程度,例如:正相关、负相关,在探索性分析中应用较为频繁。涵盖内容如下:工作中主要应用场景如下:列联表分析常用指数:★★★列联表分析,用于判断离散型变量之间是否存在明显的相关性。例如:绩效的等级与性别是否存在相关性。涵盖内容如下:工作中主要应用场景如下:方差分析常用指数:★★方差分析(又称F检验),用于度量两个及两个以上样本均值差异的显著性检验。涵盖内容如下:主成分分析常用指数:★★主成分分析(Principal
2022年11月3日