2.2.4 变量缺失值

在统计分析的数据收集过程中,有时会因为某些原因产生所记录的数据失真,或者没有记录等异常情况。例如,在学生体检中,某学生的体重记录为250千克,这显然是一个失真数据,不能使用,但其他数据在分析过程中还可以使用;或在调查问卷中,被调查者没有填写调查表中必须填写的某些数据,成为缺失值。这些情况称为数据缺失或数据不完全,缺失或不完全的数据在统计分析中是不能使用的。

SPSS软件的另一特点就是可以通过指定缺失值的方式来定义缺失数据,这样就可以更好地利用其他的有效数据。在“变量查看”视区的“缺失”列单击相应变量单元格中的按钮,打开如图2-12所示的对话框。

图2-12 定义变量缺失值的对话框

定义缺失值的对话框中包括3个选项。

(1)无缺失值:不指定缺失值。

(2)离散缺失值:对数值型或字符串型变量,用户指定缺失值为1~3个特定的离散值。

(3)范围加上一个可选的离散缺失值:选择该项,表示数值型变量缺失值定义在一个连续的闭区间和一个区间以外的离散值,“下限”和“上限”分别表示连续区间的左右端点,在“离散值”中输入区间以外的一个确定值。