- 市场营销研究方法与应用(第二版)
- 涂平
- 2233字
- 2025-04-13 15:58:22
6.5 信度与效度评估
为了保证测量的准确性,能够很好地反映所测属性的真实水平,通常要进行信度和效度评估(见图6-2)。

图6-2 测量的评估
6.5.1 信度
信度(reliability)指的是测量数据的可靠程度,即在类似条件下重复测量能否给出一致和稳定的测量结果。信度可用不同时间重复测量的结果或不同测量方法所给出的结果之间的一致性来衡量。具体的评估方法包括重测法、复本法和内部一致性法。
重测信度(test-retest reliability)是在尽可能相同的条件下,在两个不同的时间进行测量所得到的结果之间的一致性。可以计算两次测量值之间的相关系数,评价两次测量值之间的相似程度,相关系数越高,表示重测信度越高。用重复测试的方法确定信度要注意以下几个问题:
·对时间间隔非常敏感,间隔越长,信度越低。
·最初的测量可能对被测的特性有影响,尤其是有关知识或态度的主观问题。例如,有关品牌知识的初次测试可能增加了研究对象对有关品牌的兴趣和了解。
·被测的特性在两次测量之间可能发生变化,例如消费者对某一品牌的知识和态度在两次测量之间可能发生了真实的变化,从而导致信度偏低。
在一些情况下(例如街头拦截调查),重复测试是不可能或非常困难的。
复本信度(alternative-forms reliability)是通过构建两个等价的量表,对同一个调查对象进行测量,然后对两套测量结果进行相关分析以评价信度。这种方法克服了上述重测信度的问题,但也有其局限性,主要是设计两个完全等价的量表有一定的难度。因此,当两组测量结果之间的相关度低时,很难判断这是测量的信度欠佳还是量表不等价。
内部一致性信度(internal consistency reliability)是通过考察一个多项目量表各个项目之间得分的一致性,来评价测量的信度。当用多个项目测量某个构念(construct)时,这些项目应该与其代表的内容(维度)相一致。测量内部一致性最常用方法是计算α系数。
α系数也叫Cronbach α,是反映量表各个项目之间一致性的指标,介于0至1之间。通常以0.6为界,小于0.6的α的值一般表明内部一致性信度不佳。α系数往往随量表项目数的增加而增加,因此α系数可能由于包括了几个多余的量表项目而被不恰当地夸大了。当测量某个构念的量表具有多个维度时,应当分别计算每一维度的α系数,不宜跨维度计算α系数。
在提高测量的信度方面并无捷径可走,只有坚持科学严谨的工作作风,尽可能采用成熟的测量指标与方法,选择合适的测量工具并进行必要的预测试,以及开展必要的人员培训和良好的现场指导与监督等,才能获得比较可信的测量结果。
表6-3列出了两次购买意愿调查结果的比较。表中斜对角线的数字(不含合计项)显示两次调查给出相同答案的人数为360人,占总人数的85.7%;其余的是给出不同答案的人数,约为26%。重复信度检验的结果表明,大多数调查对象自述的购买意愿是可信的。
表6-3 两次购买意愿调查结果的比较(虚构资料)

6.5.2 效度
效度(validity)指的是测量的准确程度,完美的效度要求没有测量误差。信度好是效度好的必要条件,但不是充分条件,即有效的测量必须是可信的,但可信的测量不一定有效。评价测量的效度是一件非常困难的事情,因为通常只知道某一属性的观察值,而不知道其真实值。一般来说,无法对效度进行直接检验,只能用下列方法间接地进行验证。
内容效度(content validity)也叫表面效度,是对测量工具是否涵盖待测构念的一个主观评价。例如,为了评估英语能力考试能否真实地反映考生运用英语进行口头和书面交流的能力,可以请有丰富教学经验的英语老师,对考试内容是否很好地包括了有关听、说、读、写的内容进行评价。同样,为了评价顾客满意度量表能否很好地反应顾客满意度这一构念的主要内容,可以聘请有关专家对量表的内容进行审查。由于内容效度的评价依赖研究人员的主观判断,内容效度本身不足以令人信服地证明某个量表是否有效,还需借助其他的效度评估方法。
预测效度(predictive validity)是指测量结果能否像预期的那样对有关其他变量(标准变量)做出有效的预测。例如,可以通过调查,询问消费者在今后一段时间内购买某种产品的意愿,然后再收集其实际购买数据。将预测的购买与实际的购买相比较,就可以评价所测量的购买意愿对实际购买行为的预测效度。也可以将本科生在大学期间的学习成绩作为标准变量,分析高考成绩与在校学习成绩之间的相关程度,从而评价高考成绩对考生在大学期间学习能力的预测效度。
构念效度(construct validity)是指测量工具是否反映构念的真实含义和内部结构。确认构念效度要求对被测构念有清楚的定义,对该构念与其他构念之间的关系有合理的假设。因此,构念效度的评价最为复杂和困难。构念效度又包括收敛效度、判别效度和法则效度。
收敛效度(convergent validity)指的是测量同一构念的指标之间相互关联的程度,测量同一构念的指标之间的相关程度越高,其构念效度越高。判别效度(discriminant validity)指的是测量不同构念的指标之间能够相互区别的程度,它们之间的相关程度不应太高。法则效度(nomological validity)指的是测量指标之间的关系与理论上预期的一致性程度。
例6-3
顾客满意度的构念效度:期望差距模型
以顾客满意度的测量为例,根据期望差距模型(见图6-3),顾客满意度主要取决于顾客对产品和服务的期望与其感知绩效的比较。如果顾客的感知绩效达到或超过了其期望,顾客就会感到满意,反之则不满意。这个例子涉及3个关键构念,即顾客期望、感知绩效和顾客满意度。如果测量同一个构念的指标之间有较高的相关度,而测量不同构念的指标之间的相关度较低,则具有较高的收敛效度和判别效度。根据理论,顾客期望应当与顾客的满意度呈负相关,而感知绩效应当与满意度呈正相关,如果实际测量值之间的关系符合理论预期,则说明这几个构念的测量有较好的法则效度。

图6-3 满意度的期望差距模型