统计分析工具
2022/08/10
1. Getting started with SPSS
• 什么是SPSS?
读音:/es pi: es es/ ; /spa:s/
SPSS---Statistical Package for the Social Sciences, Statistical Product and Service Solutions
SPSS官网(购买下载使用): http://www.spss.com.cn/index.aspx
• SPSS的功能
统计相关的三个功能:
• 1. Summarizing univariate data
– Descriptive statistics(描述统计)
• 2. Testing the significance of differences
– t test(T检验), ANOVA(方差分析), chi‐square(方差分析)
• 3. Exploring relationships b/t variables
– Correlation(相关分析), regression(回归)
• SPSS输入
•Data typed in as SPSS data files ‐‐*.sav
•Data imported from Excel(*.xls/*.xlsx) files or tab-delimited texts (*.txt) or Comma-separated values (*.csv)
SPSS输出
•SPSS 16.0 and earlier---*.spo SPSS output file
•SPSS 16.0 and later---*.spv SPSS viewer file
2. 统计方法的选择
研究问题的核心(纯描述?找差异?找关系?)
研究问题中变量(自& 因)的性质(类?序?距?)
研究中的样本个数
研究中对样本的测量次数(单次?重复?)
3. T检验
• 什么是T检验?
T检验,亦称student t检验(Student's t test),主要用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
【T Test is used to determine whether two means are significantly different at a selected probability level (α=0.05 or α=0.01).】
• T检验的种类
独立样本T检验:
当因变量是定距变量,自变量将被试分为两个相互独立的组别时,若要比较两组的平均数是否有显著差异,就要使用独立样本t检验。
配对样本T检验:
当因变量是定距变量,自变量将被试分为两个相互关联的组别时,若要比较两组的平均数是否有显著差异,就要使用配对样本t检验。
• 独立样本T检验的操作举例
比如:文科生与理科生对双语教学的态度是否有显著差异。
研究目的---寻找差异
因变量---学生的双语教学态度
自变量---学生的专业(nominal data),两个水平,level1 文科,level2 理科
操作:
Analyze>Compare Means>Independent Samples T test;
Click the 双语教学态度to the column of “Test Variable(s)” and the 专业to the column of “Grouping variable”;
Click the button of “Define Groups…” and put the group numbers “1” and “2” into
Group 1 and Group 2, and “Continue” back, then “OK”.
4.方差分析
什么是方差分析?
方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,方差分析用来确定,三个或三个以上组的平均值之间,是否存在显著差异。
【ANOVA is used to determine whether three or more means are significantly different at a selected probability level (α=0.05 or α=0.01).】
According to the number of independent variables, there are:
方差分析的类别
–单因素方差分析【One-Way ANOVA】,研究单个因素对观测变量的影响;
–双因素方差分析【Two-Way ANOVA 】,研究两个因素对观测变量的影响
单因素方差分析操作举例
比如一份调查中,调查不同年级学生(大一、大二、大三、大四、大五及以上)的的双语教学态度是否有显著差异。
Analyze > Compare Means > One-Way ANOVA
Click 双语教学态度to “Dependent List” and 年级 to “Factor”
Click Post Hoc… button and tick “Bonferroni” and “Games-Howell”, then “Continue”
Click Options… button and tick “Descriptive” and “Homogeneity of variance test”, then “Continue”
Click Ok
5. 回归分析
什么是回归分析?
回归分析是确定相互关联的数据间是否存在因果关系。
回归的类别
根据变量之间的关系,可分为线性回归与非线性回归;
根据独立变量的数量,可分为一元回归---多元回归;
一元线性回归的操作举例
比如:考察“专业知识收获”对“双语教学态度”是否具有显著的预测作用。
目的:考察定距变量(interval data)之间的预测关系
因变量:“双语教学态度”
自变量:“专业知识收获”
操作:
Analyze > Regression >Linear
Click “专业知识收获”to Independents,“双语教学态度”to Dependents。
Select “Enter” method.
Click “Statistics” button and tick “Descriptive”, besides “Estimates” ”Model Fit”.
Click “Plots” button, and move “*ZPRED” to “X”, and “*ZRESID” to “Y”, “Continue”
Back and “Ok”
6.相关性检验
什么是相关性检验?
对两个变量进行相关程度的分析。
相关系数
Pearson相关系数:适用于定距变量
Spearman相关系数:适用于等级变量或有序变量
操作举例
比如:学生的双语学习态度与学习收获之间是否存在显著相关。
操作:
Analyze > Correlate > Bivariate
Click“双语学习态度”、“学习收获”to Variables
Check Pearson or Spearman
Click Ok
7. 卡方检验Chi-square
• 卡方检验是什么?
卡方检验根本思想在于比较理论频数和实际频数的的拟合优度或吻合程度问题。
卡方值越大,说明实际频数与理论频数的差别越明显,两组数据不同的可能性越大。
方程:
• 卡发独立性检验:概述、举例、操作、解读及论文呈现;
概述:
卡方独立性检验用来考察两个(或以上)频数变量各水平之间是否存在显著关系。如果变量各水平之间没有关系,那么这些变量之间彼此独立。否则,不独立。
卡方独立性检验通过列联表(Crosstabs)分析实现,变量各水平在表中交叉构成单元格(cells),分布在行和列上,这些单元格中的数据是重要的计算和参考依据。/p>
举例:双语课教学模式是否受教师英语水平的显著影响?
目的---对两个定类(和/或定序)变量(教学模式分组、教师英语水平分组)各水平之间是否相互独立进行检验。
变量--“教学模式分组”是定类变量,“教师英语水平分组”是定序变量,各有3个水平,故是3X3的列联表。
思路--假定两个变量之间相互独立(即没有关系),如果检验结果显著,那么两变量之间相互独立的假设不成立,两变量有显著关系。
操作: