查看原文
其他

小王子的狐狸 SPSS学堂 2022-04-26

作者:小王子的狐狸      审核:在路上    封面:自己想吧

SPSS学堂祝您圣诞快乐

圣诞节了,你们是不是跟我一样在苦逼地找方法、钻研数据呢?但是小编心里还是很开心的啊,因为我相信:今天的努力如果能带给你们一些有价值的信息,这样,也是一个很有价值日子啊。也相信:如果你们在某时需要一个东西,而这个东西就这么惊喜意外地出现了,你们肯定也会很开心的。


你开心,所以我开心,这个是不是传说中的相关性呢?

哈哈,不开玩笑了。现在认真地来介绍下相关关系和相关分析的概念。

顾名思义,相关关系就是两个或两个以上的变量之间相互依存的关系,而相关分析也就是针对相关关系的一种分析方法。为了更直观地理解,就用方程的形式呈现。那么就会有:

    ① y=ax+b  ② y=a1x1+a2x2+b 

    ③ y=a1x1+a2x2+······+b

    ④ y=ax2     ⑤ y=lnx

以上方程的共性:都是研究y与x之间的相关关系;

不同的是:影响y的x可能不止一个。

需要说明的是,相关关系包括了线性相关和非线性相关,比如上面的①②③,都是线性关系,而④⑤则是非线性关系。

不过目前来说,分析常见的就是线性相关,也就是描述当一个连续变量发生变化时,另一个连续变量也相应地呈线性变化,一般用Pearson相关系数r来表示。

这里大家要了解一个皮尔逊系数的取值范围,如下表1.1。

注意:相关关系并不等同于因果关系,相关性表示等号两边的变量会同时发生改变,而因果关系,也就是一个因素导致另一个因素发生变化。


好,前面做的铺垫让大家都清楚了为什么要做?那接下来我们就“怎么做”进行实战操作演习。

Step 01: 准备数据,本次选取了某一便利超市近两年的销售数据,其中的变量涉及到年月、所属季度、宣传费用、用户流量以及销售金额等5个。如下图1.1。

图1.1 某便利超市销售数据

PS:在Excel处理上述数据中,从日期中计算所属季度,运用到了公式:TEXT(Lookup(Month())  哦

Step 02:数据处理和操作,在之前打开的“某便利超市销售数据”界面(图1.1),点击【图形】,选择【旧对话框】,此时右侧弹出子菜单,点击【散点图/点图】,出现如图1.2的窗口,选择【简单散点图】,单击【定义】按钮。

图1.2 散点图/点图 对话框

Step 03:在弹出的窗口【简单散点图】下(见图1.3),将变量“销售金额”移至右侧的Y轴,将变量【宣传费用】移至右侧的X轴中,完成后,单击【确定】按钮。


图1.3 简单散点图

完成以上3个步骤之后,会出现以下输出结果。见图1.4,也就是我们需要的散点图绘制图。


图1.4 散点图绘制

有些人就会问为什么要在相关性分析前制作散点图呢?关于这个问题呢,首先,你们看完这个散点图,有发现什么吗?

对的,发现了横轴上的宣传费用与纵轴上的销售金额呈一定的线性相关性,观察了散点图,这也是进行相关性分析的第一步,帮助我们更直观的观察变量之间的相关性,这就更便于我们去判断了。

       那么这两个变量之间的相关程度到底是多少,高还是低呢?

       这就是我们接下来要说得相关性分析操作了。

Step 04:单击【分析】——【相关】——【双变量】,出现【双变量相关性】对话框。如图1.5所示。

图1.5  【双变量相关性】对话框

Step 05:在对话框“双变量相关性”下,将“宣传费用”、“销售金额”两个变量移至右侧的【变量】框中,由于这2个变量是连续变量,需要保持【相关系数】默认的【皮尔逊】复选框,其他默认的选项也保持不变,点击【确定】按钮,就可得到相关分析的结果。如表1.2。

从上表中,我们就可以清楚地看到“宣传费用”与“销售金额”之间是具有很高的相关性的,皮尔逊相关系数达到0.959,也就是高度正相关,显著性P值也是=0.000 (<0.01),具有极其显著的统计效果。实际上来说,也就是宣传费用的投入会增加销售的增长。

      那么,问题来了,你们想不想知道“宣传费用”、“用户流量”和“销售金额”变量之间的关系呢?想知道的话,请亲自动手操作哦,这样印象也更深刻呢。

小编今天的课程就到这里,接下来的交给你们自己发挥!


圣诞结演唱:陈奕迅

想知道你跟你心目中的TA的相关性高吗?快来和我一起把相关性分析学起来吧,SPSS学堂随时为你打call!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存