查看原文
其他

excel数据分析库系列|抽样设计

2016-05-07 小魔方 数据小魔方

今天开始跟大家分享excel数据分析库系列——抽样设计


作为微软excel中一直以来隐藏的最深最上档次的功能组件,excel数据分析工具库需要用户手动调用并开启(还未开启的请参考小魔方历史文章),工具库里内置了常用的统计模块和计量回归的工具!




但是毕竟不是专业的统计分析工具,内置的工具模块也都只是涵盖了最基本的统计过程和回归方法,设计到稍微深层次的检验与诊断修正过程,excel便无能为力!



但是我想,如果要用来完成毕业论文或者科研项目,大家绝对不会单纯依靠excel来做分析,如果是仅仅辅助工具,那么excel分析工具库在很多时候可以让我们免于哪些大型数据分析软件给我们带来的功能困扰和内存挑战!


因而熟悉一下他的核心统计模块还是很有必要的,起码简单点的统计回归还是可以胜任的。


今天讲解他的抽样调查功能


首先输入你要抽样的总体范围:




然后打开数据——分析——数据分析——抽样




再输入区域中填入要抽样的总体数据范围,抽样方法默认是随机(一会介绍周期),样本数根据需要设置,在输出选项中根据需要设置(输出区域会将抽样结果输出到当前工作表某一单元格区域(自定义);新工作表组将自动将结果输出到新建工作表;新工作薄选项将会自动输出到新建工作薄的sheet1工作表中)。




确定之后你就可以看到抽样的样本结果:




下面介绍周期抽样:


周期抽样给出的备选菜单与随机抽样略有不同,没给出抽样个数而是给出了间隔,我们暂且输入15,然后确定,可以看到周期抽样结果。





由于我们的数据集并非排列在一列,而是多列排列,所以随机抽样与周期抽样的特征看的并不明显,下面我们用一列排序后的连续数据再验证一次两者之间的差别:


数据1~100,两个抽样结果如下:



你可以观察到,随机抽样的话,你是看不到任何规律的,而周期抽样(间隔5),软件输出的样本是以5为间隔的有序数据列表,而且随机抽样需要我们设定抽样个数,而间隔抽样需要我们设定间隔(个数不确定,由间隔而定,间隔越大个数越少,反之越多)。





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存