定量研究与SPSS小白训练营(平日班)

默认教学计划
40人加入学习
(0人评价)
价格 ¥999.00
教学计划

皮尔森相关的目的

--了解构面与构面之间单纯相关;如果小于0.3则过小,大于0.7则过高。但是03-0.7之间是建议值

--大于0.7容易产生共线性的问题,而且区别效度不容易通过

--小于0.3,容易产生研究结果不显著的问题。

--对结构结果进行初步判定,不是检定的主要方法,但是是初步判定的工具。

[展开全文]

频率表--连续变量--因素分析(解释能力)--信度分析(题目能否有效代表这一因素)

1、信度分析目的

注意:当构面中每一个题目的数据单位差距太大,则需要看标准化的值(比如利用一些二手数据资料进行分析,一般问卷回收数据不需要看标准化值)

--每一个构面都需要跑一次信度

 

[展开全文]

1、因素分析的类型

(1)探索式因素分析(EFA)

--因素个数不明

--构面名称未知

--应用于问卷发展

--特殊应用量表(AIO,VALS)

(2)验证式因素分析(CFA)

--因素个数已知

--构面名称已知

--利用应用

2、为什么要做因素分析?

数据的简化。数据简化付出的代价就是解释能力的下降。

--如果利用几个因子来解释全部变量,如果有0.6的累计解释能力,那就是可行的

--因子和构面的关系,其实就是分类的过程。

3、探索式因素分析目的

--一组变量缩减成7个

--因素需要重新命名

--建立量表的收敛效度和区别效度

4、实际操作:问卷构面题目的筛选

--尺度分的越细,变量符合正态分布的概率就越大

--因素分析跑完之后,需要看是否按照设定的构面进行因子的分类,如果有题目跑到别的构面,则需要被删除

--factor loading要大于0.6(验证式)、探索式要大于(0.5),如果FL太小,那么就删除;如果接近0.6是否保留取决于是否影响构面的信效度

--cross loading如果要大于0.4,需要删除该题目

5、验证式因素分析,一样的步骤

--如果

[展开全文]

复选题的每一个选项可以转换成一个题目,然后生成频率表,随后进行交叉分析

--交叉分析--比如可以做年龄对吸引跟换手机的原因之间的关系的分析

[展开全文]

7.3 描述性统计(连续变量)

1、目的

(1)检查连续变量数据是否有建档错误

(2)遗漏值

(3)是否符合正态分布

2、得出表格后如何判断是否合适

--偏态绝对值在1以内,峰度绝对值在7以内,表明数据符合正态分布。

[展开全文]

数据预试通过后,开始运行频率表

1、频率表目的(主要是针对类别变量)

(1)检查类别变量是否建档错误

(2)有无missing data

(3)每个类别的次数

--至少占总样本5%

--最大和最小在4倍以内

(2)样本数量

--最大构面中题目数量的20倍为样本数量的最小值

[展开全文]

Cronbach's a--每个构面的信度;这个值要大于0.7

--从后往前删除样本

--项目分析(又称为题目鉴别力分析),有鉴别力的题目有足够的方差

--预试的时候不用做因素分析,因为这是一种大样本分析法

--利用考卷与学生成绩的案例来说明,什么叫做题目的“鉴别力”

--关于高分组和低分组的区分标准;高分组和低分组的平均分应当有显著差异,如果没有显著差异,则说明这个题目没有鉴别力

 

做SPSS论文的整个流程

第一步:问卷预试(题目自己设计的,一定要做这一步,知名学者问卷不用问卷预试的环节)

(1)于是样本目的有三个:

--确认量表题目语意是否通顺,编排恰当等

--删除不具鉴别力的变量

--计算构面内部的一致性(Cronbach's a),也叫构面的信度

--最好利用EXCEL来建档,缺失值的删除最好从后往前删

--视频有介绍如何随机选择预示样本

--视频同时介绍计算变量,SQSUM,之后也确定27分位数和73分位数;然后利用这两个分位数,进行高低分分组--之后比较这两组的平均值是否有显著差异(分析--比较平均值--独立样本T检定)

(2)独立样本检验--莱文方差等同性检验

--方差同值比较(拳击比赛的案例)

--  假设等方差,其实就是同值性假设

--在独立样本检验中,不用看同值性检定

--需要看T检验的显著性,双尾显著性就是P-VALUE

--在投稿的时候只需要把预试结果说明即可。

--分析--标度--可靠性分析,可以看见可靠性统计值,也就是Cronbach's a

--导出构面题目鉴别力报表

(3)替代方法

 

 

 

[展开全文]

1、选择观察值

--只分析某部分的观察值

--可以找到样本填答的矛盾

2、分隔观察值

--分群,全部都要做

[展开全文]

--跨行配对,要利用“CTRL”按键

[展开全文]

--复选题,一个选项就是一列

--建议将数据在EXCEL进行建档

--文件--显示数据文件信息--工作文件(这样选择,可以将文件信息全部形成表格,整理)

[展开全文]

1、建档

--列:题目

--行--样本数量

--最左侧一列一定要建立一列“ID”,方便后期删除样本

--变量名称写成英文;标签可以写中文

--打标签也是为了方便后期删除题目

2、测量

--标度:连续变量

--顺序:类别变量

--名义:类别变量

--方便知道变量类型

 

[展开全文]

皮尔森相关太大--共线性

皮尔森相关太小--不显著

所有分析,第一步都是题目的信效度分析。

 

--类别变量没有方差

--什么情况用卡方分析,罗吉斯分析;用这些分析方法分析什么?

 

 

---ANOVA分析,需要分三组或以上,也叫方差分析

--MANOVA 多变量分析(至少两个Y)

[展开全文]

研究模型中的五大变量

1、自变量(解释、外生、前置)IV

2、因变量(被解释、内生、果)DV

3、中介变量ME

--HOW AND AHY

--了解自变量如何、为何影响因变量

--路径分析(多元回归的重复应用);跑两次以上的回归

--中介变量是比自变量更接近因变量的变量

4、干扰变量

--自变量,一开始不在模型里

--干扰变量影响自变量和因变量之间的斜率

--阶层式回归分析

--when and ?

5、控制变量

--自变量,控制变量没有假设(认为早就存在影响的变量)

--在多元回归分析中,

--控制变量是一开始就已经被证明对因变量存在显著影响的变量,不需要假设

 

变量设定必须经过文献分析的过程

注意:自变量、因变量会因为时空等因素而发生转换。

--多元回归分析只能评估直接效果(回归只能告诉自变量对因变量有影响,但是自变量为何以及如何会影响就需要中介变量)

 

[展开全文]

--不同构面题目可以出自不同的文献;但是一个构面不能内不能出现多个学者的题目(引用题目要考虑那个学者做得方向、产业接近,另一方面看学术定义是否接近)

--SPSS可能不做题目的信效度,但是结构方程模型直接就走出来了

 

1、量表来源注意事项:

(1)引用具有相似学术定义构面的题目;

(2)引用研究领域相似性高的领域

(3)一个构面的题目不要来自多个学者

(4)题目越新越好

[展开全文]

学术性定义写不出题目

操作性定义可以写出题目

--如果是引用他人的题目,不会有操作性定义,但是会有学术定义

--操作性定义:将抽象概念转化成具体可测量之指标的过程

-- 理论构面定义,需要对每个潜变量进行定义。圆圈是潜变量,我们的假设其实是连线。

--问卷不能问直觉性问题,因为人们会潜意识回答“符合社会期望”的答案。

--构面标题不能出现在问卷上

 

2、形成型问题VS反映型问题

--如何衡量一个人的社会经济地位?

--社会经济地位这个理论构面定义是什么?

--构面和题目之间的关系应当是,构面影响题目。如果社会经济地位提高,会有什么现象被观察到?(我终于理解箭头方向为什么这么画了)

--cross阿坝0.7,与题目相关

--SPSS通通都是反映型指标

[展开全文]

最好不要自行设计问卷;最好参考并引用他人研究所拟的相关题目,然后进行修改。

一个构面不要超过7个题目

--避免一个问题中问道两件事情

[展开全文]

1、变量分为连续和类别

量化研究两种:一是发问卷一手数据;二是次级数据

2、发放问卷的目的主要包括:

--事实:个人使用手机品牌

--知识:抽烟对个人及周遭人员的危害(对抽烟知识越多,越倾向于戒烟)

--态度:您对迪士尼的满意度,这个是潜在变量;

     问卷调查中,要衡量满意度的量表是利用      李克特量表

--行为:一天使用计算机几小时

3、问卷类型

--进行量化分析必须是封闭式问卷

(1)是非题--衡量知识

(2)选择题--李克特量表

(3)复选题-SPSS有专门的算法

(4)语意差异量表

[展开全文]

--均值是切割来的;类别尺度不能切割,因此不能计算均值、方差

--连续变量,等距尺度(李克特量表),加减乘除有意义,可以比较,切割有意义

--类别变量不存在正态分布

--Nominal 分类尺度

--Binary/Dichotomous 分成两类

 

[展开全文]

1、社会科学一般选择信心水平。0.95,正态分布落在2s的区间范围内,这个标准差的值就是1.96,因此说是否显著的时候会经常出现1.96这个数字(注意统计必须符合正太分配才可以这么做)

2、假设检定的步骤

(1)建立虚无假设或对立假设

--检定就是证明一个虚无假设是否有可能存在(不是检定对立假设)

--显著水平一般选择0.05(a),就是鉴定出95%的信心水平

(2)决定检定的统计量

--符合正态分配,一般就用Z、T分配、卡方分配等的前提都是符合正态分配(这个是软件自行决定的)

--确定决策准则:1-a(阿尔法)

--P-value<a

[展开全文]

正态分布

--代表样本的人都是正常人

--在做分析时,我们需要检验样本是否符合正态分配

[展开全文]