多选题数据的录入主要有两种方式:
二分法
0 代表选中,1 代表未选中
多重分类法
事先定义录入的数值,比如1,2,3,4,5分别代表A,B,C,D,E ,并且根据多选题限选的项数确定应录入的变量个数。
在SPSS 中多选题也被称为多重响应集,意味使用多个变量记录答案,其中每个个案都可以给出多个答案。
步骤: 【分析】——【定义多重响应集】: 选择“Q5”题的全部选项(Q5-Q1 到 Q5-17),移至右侧的【集合中的变量】框中。 根据数据特征,这些题目均以0、1格式作为答案,所以,【变量编码】应当选择【二分法】,在【计算值】后面的栏中输入“1”,以便SPSS统计汇总“1”的个数。 在SPSS中,Q5 题的变量标签是每个选项的描述文字,而变量值标签则是“1=是” “0=否”,所以,【类别标签来源】应当选择【变量标签】。 【集合名称】输入Q5,【集合标签】输入Q5.在该网站购买过的商品类型。 设置完成,如图: 确认无误后点击右侧【添加】,在【多重相应集】框中出现“$Q5”时,说明该多选题定义完成。
二分法和多重分类发这两种方法在什么情况下使用?
(1)多重二分法(Multiple dichotomy method)。对于多项选择题的每一个选项看作一个变量来定义。0代表没有被选中,1代表被选中。这样,多项选择题中有几个选项,就会变成有几个单选变量。这些单选变量的选项都只有两个,即0或1。(2)多重分类法(Multiple category method)。多项选择题中有几个选项,就定义几个单选变量。每个变量的选项都一样,都和多项选择题的选项相同。每个变量代表被调查者的一次选择,即纪录的是被选中的选项的代码。 但在实际操作中,如果选择项较多,而被调查者最多只选择其中少数几项时,采用多重二分法录入就显得繁琐,输入数据时容易出错。尤其是当样本量增大时,采用多重二分法录入就大大增加了录入的工作量,不利于提高工作效率。为此,一般的市场调查公司大都采用多重分类法的录入方式。
对于以多重分类法这种编码方式录入的多选题,有什么要求?
需要确保变量值的一致性,即1,2,3指代的是同一个变量值标签。 在设置时,需要选择【变量编码】下方的【类别】,然后直接输入【集合名称】和【集合标签】。确认无误后点击添加,完成定义。 多重响应集 定义完成输出结果:
名称:多选题变量名称,虚拟的,在SPSS中并不存在,前面会有“$”符号;标签:多选题的变量标签,用以描述多选题内容;编码为:指明该多选题的编码类型是二分法还是多重分类法;计数值:指明二分法以什么数字作为计数依据,如果多选题是以多重分类法进行编码,则该列显示“不适用”;数据类型:显示变量类型,通常都是“数字”;基本变量:列举多选题都包括哪些变量,显示对应的变量标签。
参照:《谁说菜鸟不会数据分析之SPSS篇》
作为一款操作直观、功能强大的统计分析软件,IBM SPSS Statistics不仅广泛使用于学术研究中,更是广泛应用于市场调研行业。而在市场调研的应用中,最常涉及到的是问卷数据的处理。
对于简单的单选题,IBM SPSS Statistics处理起来与其他的数据相似,但对于多选题的话,该怎么处理呢?接下来,我们以一个实际例子讲解一下。
一、数据准备
以图1的多选题数据为例:
1. 该多选题的题目为:请问您知道以下哪些啤酒品牌?
2. 答案选项为:百威、青岛、雪花、喜力、嘉士伯、麒麟
3. 采用二分法录入,每一个选项都会录作一个变量,选中选项,其对应的变量会录入1,未选中即录入0
图1:多选题数据
二、定义变量集
由于多选题涉及到多个变量,因此,无法通过简单的频数统计来得到所有选项的分布情况。
在这种情况下,需创建多重响应集,将所有的多选题选项集合在一起,构建新的变量集。具体的操作是,依次单击分析-多重响应-定义变量集。
图2:定义多重响应变量集
如图3所示,定义多重响应集中包含了集合中变量、变量编码方式、名称标签等设置选项。
图3:变量设置
第一步,将所选题的选项变量都添加到“集合中的变量”。
图4:集合的变量
第二步,在“变量编码方式”中选择“二分法”,并将其计数值设为1。该设置表示该集合中的变量采用二分法录入,当变量的数值为1时就计入一个计数。
第三步,在名称中输入新创建的多重响应集为Q2_TTL,在标签中输入多选题的题目。
第四步,单击添加按钮。
图5:定义集合的变量
完成以上设置后,就能得到一个新的多重响应集$Q2_TTL。需注意的是,该多重响应集不会在SPSS数据集中出现,但会在多重响应运算中出现。
图6:完成定义
三、多重响集分析
对于新创建的多重响应集$Q2_TTL,可使用多重响应的频率与交叉表进行分析。
1. 频率分析
多重响应频率分析,即对多重响应集的频率分析。
图7:多重响应频率
其操作很简单,如图8所示,将多重响应集添加到表项目。
图8:变量设置
即可得到该多重响应集的频率分析,即不同啤酒品牌的认知个案数与占比情况。
图9:频率分析
2. 交叉表分析
多重响应的交叉表可供进行多重响应集与其他变量的交叉分析,但需注意的是,进行交叉表分析的变量需定义为定量变量。
比如在图10的数据中,如果希望获得性别与多重响应集的交叉表分析,需先将性别转换为定量变量。
图10:添加性别变量
完成数据的转换后,打开多重响应交叉表设置,将多重响应集$Q2_TTL添加为行,性别添加为列。
此时,注意到性别变量出现了“(??)”的符号,这是因为当前性别是定量变量,需进行范围的定义。
图11:多重响应交叉表
如图12所示,单击定义范围,将其最小值设为0,最大值设为1。
图12:定义范围
完成以上设置后,即可得到不同性别对不同啤酒品牌的认知频率分析。
图13:交叉表分析
四、小结
综上所述,在SPSS处理问卷多选题时,如果需要得到不同选项的整体频率分析,需先进行多重响应集的定义,将所有的多选题选项集合为多重响应集,再进行频率与交叉表的分析。
我们在设置问卷的时候经常会设置一些多选题或者矩阵多选题
多选题的导入方式和单选题有相似之处,spss对多选题实行的是拆分法,把多选题拆分为几个单选题。
首先需要将多选题一个一个地导出,如果导出一整个原始问卷的结果,无法进行编码,需要将多选题分开导出
此时多选题就变成了多个单选题
随后用和单选题同样的方式对多选题构成的小题进行编码
上图是编码后的一道多选题呈现出来的多个单选题的样子
编辑完值标签之后,如何让系统识别出这几个单选题其实是一个题呢?
点击“分析”“多重响应”“定义变量集”
然后点击“多重响应”“频率”
就能看到问卷中答题者是如何选择这道题的
如上图所示(题目瞎起的)