2007-01-22

袁方《社会学研究方法教程》笔记:第六章:测量

第六章:测量

1、 测量的概念:(1测量复旦9697<>;人大96<>对所确定的研究内容或调查指标进行有效的观测与量度。具体地说,是根据一定的规则将数字或符号分派与研究对象的特征(即研究变量)之上,从而使社会现象数量化或类型化2)研究变量:是通过对概念的界定和具体化而转化来的,在研究中,它是分析单位所具有的特征或属性。在一具体研究中,每个变量都有特定的测量指标。3)数字(符号):测量时得到的一定数值可作为某一现象或事件特征的代表符号。4)分派规则:确定分派数字的规则是测量中最基本、最困难的工作。测量是将各个分析单位与它们的特征或属性用数字分派规则联系起来。所谓规则是指操作的方法或索引,它指导研究人员如何实施测量5)有效的测量规则必须满足三个条件复旦98<>:测量三要素):<1>准确性:指所分派的数字或符号能真实、可靠、有效地反映调查对象在属性和特征上的差异,用数学概念表述,如果真是状态与符号系统在结构上具有一致的关系,那么两者就具有同构性,同构性越高,所观测的资料就越准确有效;<2>完备性:是指分派规则必须能包括研究变量的各种状态或变异;<3>互斥性:指每一个观测对象(或分析单位)的属性和特征都能以一个而且只能以一个数字或符号来表示。6)测量的作用:在于作出准确的分类,以便比较研究对象的各种差异,这些差异有些是以等级区分的,有些是以数量区分的。研究对象的差异都是由一定原因造成的。因此通过对差异的比较和分析就能找出现象之间的因果联系。

2、 测量尺度(北大92<>举例说明四种测量尺度的特点及区别;北大2001<>是举例说明4种测量尺度及其数学性质;复旦98<>简述变相的测量层次及其划分意义):(1)定类尺度或名义尺度:测量定类变量的尺度,它是测量尺度中最低的一种,大多数定性测量都适用定类尺度。其严格的区分可分为:<1>标记:可作为一个识别的记号,当数字被用作标记时,它并不表示数量的多少,也不能对它做数量运算;<>类别:可作为对变量的不同状态的度量,类别区分可说明观测对象的某些本质特征.类别也可用数字表示,这种数字仅用于区分而不能运算。 2)定序尺度或等级尺度:一个变量如果能够依操作定义所界定的明确特征或属性而排列等级大小、高低、先后的次序,这是就适用于定序尺度进行测量。 定序测量程序<1>等第顺序法,它要求被试者对一组刺激依某种属性由高到低或由多到少的次序予以排列。<2>配对比较法:要求被试者在一定时间内就所有可能的配对,排列出每对刺激中的大小或多少的顺序。<3>恒常刺激法:这种方法与配对比较法相类似,唯一不同之处是它以一种标准刺激连续地与一组恒常刺激的各个成员相配对地进行比较。<4>连续性类别法:要求被试者把一群刺激分为若干不同的类别,这里的类别已按指定的属性而予以顺序排列。 注意:它们使用的数字仅仅显示等级顺序而已,除此之外,别无其他意义。这些数字并不显示属性的真正量值,并且等级之间的间隔也不一定相等。 3)定距尺度或等距尺度:具有定类尺度和定序尺度的特征,此外,它还要求尺度上的间距代表所测量的特征的量的间距。即每一等级之间的间距是相等的,它们可以用来加减。但定居尺度上没有绝对的零点,所以不能乘除。 4)定比尺度或比例尺度:是测量中的最高层次,具有实在意义的真正零点,定比尺度下的数字是可以进行加减乘除的,运算的结果都具有实在的意义。一个变量能否以定比尺度测量,关键在于零点是否是绝对的,最好的检验办法是:零是否可被认为是测量“一无所有”的。5)四种测量尺度比较南大2000<>:定距变量可以变为定序变量吗?反之如何?请举例说明):从数学性质上看,高层次尺度都具有低层次尺度的一切特征,反之则不然。选择测量尺度须注意:<1>社会现象大多只能以定类或定序尺度测量,但有时也可将某些现象近似的视为定距或定比变量,如“智力测验”。这是要注意这种近似计算的合理性和可能出现的偏差。<2>高层次尺度可能获得更多、更精确的信息,但调查和分析的工作量更大,而低层次尺度则相反。因此选择尺度要结合课题要求与研究条件。 <3>用较低尺度收集的资料不能用较高尺度的数学运算来处理,反过来则可以。因此许多研究都是尽量先收集更多、更精确的信息,但在分析时却只作一些简单的运算,这虽然会造成很大的浪费,不过当需要今后作补充分析时,这种策略还是有必要的。<4>一个变量可能适合用各种尺度来测量,选择何种尺度取决于研究所要求的精确度。

3、 概念的具体化与操作化(北大93<>是说明概念与假设的操作化过程北大97<>试说明研究课题具体化与操作化的主要内容北大2000<>简述一项调查研究课题的具体化与操作化南大96<>课题操作化南大95<>怎样具体确定测量的尺度复旦98<>课题具体化和操作化的主要内容):因为社会生活中使用的概念通常是模糊的或含义不清的,社会研究如果不对这些概念作出定义和具体化,也就无法对现象进行观察和度量。1)概念的具体化浙大20002001<>:试述拉扎斯菲尔德的概念具体化;南大94<>:如何从概念中引出指示项;北大95<>:简述概念、变量、调查指标的定义、各自在社会调查中的作用及三者的关系;南大98<>:对社会学研究概念举例说明概念的来源;复旦96<>:什么是理论、假设、概念、变量、指标及它们之间的相互关系):<1>概念的形成:概念是在日常生活中通过感性认识和互相交流形成的。是人们对许多现象的复杂而又具体的感受,并以一个名字对这些感受作出整体的、含混的概括。概念是人们思维的产物,它是抽象的,无法直接观察的,因为它本来并不存在,是人们创造了它。<2>概念的界定:使用抽象定义将概念所指的现象于其他现象区分开来。A界定的第一步是将概念分解:即从不同角度或维度对概念所表示的现象进行分类,对有些高度抽象的概念要逐步分解;B第二步是作出抽象定义:通过分解可大致了解一个概念的基本内容和各种分类,根据分类就可以抽出各种类型的共同属性和特征对概念下定义。在社会研究中,抽象定义的作用是对在何种范围、何种含义上使用这一概念作出精确的说明,因为概念包括许多方面和不同维度。经过严格界定的概念称为变量,变量具体指概念内涵的各种类型或各种状态,它们对应于各种实际存在的事物,因此变量是可以观察和量度的。概念转换为变量形式之后就可以进入科学研究的领域了。<3>选择测量指标:确定如何测量变量,选用那些指标来测量。指标是概念内涵的指示标志,它们直接表示经验层次的现象。指标可以量度现象的不同状态和不同程度。由经验现象的量度就可以说明抽象层次的概念。但指标指标是概念内涵的某一方面或某一部分内容,因此要更有效的测量概念就需要用多个指标。对概念(变量)的具体量度的方案也称为概念的操作定义。<4>编制综合指标:对简单的概念可以用一两个指标来测量,而对复杂的概念,则要用多个指标来测量。<5>概念的具体化过程就是一步步从抽象层次下降到经验层次,使概念具体化为可观测的事物。 2操作定义复旦98<>;南大98<>:古典操作定义):就是建立一些具体的程序或指标来说明如何测量一个概念<1>操作定义的功能:(A)澄清概念在研究中所选用的意义;(B)说明测量变量的操作方法;(C)使一些陈述变量间关系的假说获得验证的机会;(D)使今后同样的研究有所根据,以便比较彼此的结果。3测量指标北大2003<>;北大93<>:变量与指标):指标是反映社会现象变异特征的范畴。是对社会范畴的变异方面的规定性加以具体化。它把现象的质的方面与量的方面密切的结合起来,以便精细描述社会现象的某一特征。测量时首先要说明指标,任何一个变量都有许多不同的指标,这是因为测量所依据的事实可以不一样。当一个变量有多个指标时,可以从中挑选若干个来测量变量,挑选指标的原则是方便与适当。各项指标可以分别研究,但有时需要将各项指标综合起来,以提高变量的抽象程度。建立综合指标的方法:类型法、指数法和量表法4)建立综合指标<1>类型法:将各指标交互分类,然后建立新的类型,以形成一个新的指标;<2>指数法:是用简明合理的公式综合各指标,以建立一个新的指标。

4、 量度化方法:通过测量而得来的资料可分为三种纬度:(1)物理纬度:可以用客观的标准来测量,而不涉及主观判断。这些量度一般都属于定距或定比尺度。但这种量度只适合于某些社会现象。如事物的状态特征和行为特征。2)心理物理纬度:包含物理纬度和心理纬度。一般认为,测量心理属性最多可达到定序尺度,而无法使用定距尺度。3)心理纬度:是利用主观判断所制定的计量标准。缺点是:它们缺乏一套完善的测量理论,即缺乏公理和定理的系统。

5、 观测值的分解:测量理论的基础是数理统计中的误差理论或变异理论。测量理论建立在“任何观测值(测量分数或测量结果)都有误差”这一假设之上。1它认为,观测值(X)是有四个部分组成的<1>真实值T<2>其他变量的影响值O<3>系统偏差B<4>随机误差E (测量分数)X=T+O+B+E 2)随机误差(E)非系统的变异,它是由于一些无法预料的因素引起的,如被测者的疏忽,粗心等。但是这种影响有正有负,所以要消除或减少随机误差,通常采用多次测量或抽取大量样本的方法,使正负误差相互抵消。3)系统偏差(B)南开2001<>)是有规则的变异,它是由于测量工具、评分标准等直接与测量方法有关的因素引起的。消除或减少系统偏差的方法是采用标准化的测量工具;在测量之前将测量工具与标准尺度相互校对,以修正偏差。但有些系统偏差很难用标准化消除。4)其他变量的影响(O):也是一种有规则的变异,这种因素不是偶然的,而是内含在测验的题目或量表之中的。这种影响并不能通过多次测验而消除,它是内含在测量指标之中的。消除或减少这种影响主要通过对所研究的变量进行严格的操作化。5)在评价社会研究中所使用的测量方法时必须考虑以下三个问题<1>这一测量有没有系统偏差?这种系统偏差会不会影响研究的有效性?一般来说,任何测量都会有一定的系统偏差,因此,测量的主要任务就是使系统偏差控制在最小程度。<2>这一测量是不是可靠的?即随机误差对测量的可靠性有没有影响?假如测量受偶然因素影响很大,观测值就会在较大范围内起伏,在这种情况下,观测是不可靠的,测得得观测值其可信性很低。<3>这一测量是不是有效的?即所测得得数值是否正式向要研究的变量值,其他变量的影响值是否控制为最小?

6、 信度南大98<>;北大2004<>指测量数据(资料)与结论的可靠性程度,即观测工具能否稳定地测量到它要测量的事项的程度。也就是说信度是指测量的稳定性与一致性而言的1)信度系数:信度可以看作系统性变异在观测到的总变异中所占的比率,系统性变异越大,则信度系数越大,表明测量的信度越高;信度也可以看成是在观测到的总变异中,不是因随机误差所造成的变异所占的比率。2)信度的检查南开2000<>):信度通常以相关系数表示。由于测量中误差变异的来源有所不同,故各种信度系数分别说明信度的不同层面而具有不同的意义。在实际应用中,信度系数有如下类型<1>重测信度用同一份问卷的问题,对同一群被测者前后调查两次,在根据调查的结果,计算其相关系数,就得到重测信度。这种信度能表示两次调查结果有无变动,反映了测量的稳定程度,故又称作稳定系数。它可以检查出被测者是否能正确理解所提的问题,并作出真实稳定的回答。这是一种测量信度的较好方法,但须注意两次调查相隔的时间要适当,如果时间太短,被测者还记得上次答案,所以测量的是他的记忆,而不是他此时的真实态度。如果间隔时间太长,可能会发生一些变故,影响到被调查者的态度。<2>复本信度对一项调查的问题,让被调查者接受问卷测量,并同时接受这份问卷的复本的调查,然后根据调查结果计算其相关系数,就得到复本信度。使用复本求取信度可以避免重测信度的缺点,但使用的复本必须是真正的复本,即在题数、形式、内容、难度及鉴别度等方面都与原本一致,仅只在问法与用词方面与原本不同。复本调查可连续或相距一段时间进行,连续实施的复本信度又称等值系数;相聚一段时间实施的复本信度又称稳定与等值系数<3>折半信度将调查来的结果,按题目的单、双数分成两半记分,在根据各个人的这两部分的总分,计算其相关系数,就得到折半信度<4>评分者信度人大2001<>):在测量工具标准化程度较低的情况下,不同评分者的判分标准也会影响到测量信度,要计算评分者信度,可计算一个评分者的一组评分与另一个评分者的同一组评分的相关系数3)影响信度的因素:在结构化标准化程度较高的测量中,信度主要受随机误差的影响,随机误差越大,信度越低。随机误差的来源主要有:<1>被调查者:如是否耐心、认真、专注、不受情绪波动影响。一般来说,调查时间越长,提出的问题越多、越复杂,信度越低。<2>调查者:是否按规定程序和标准,是否有意或无意的对被调查者施加影响,纪录的认真程度等。<3>测量内容:如提问的措辞含糊不清,不易理解,各种题目内部一致性低,题数少等。<4>测量环境和时间:如研究人员对被调查者有较大“干扰”,他人在场的影响,两次测量的时间间隔太长等等。

7、 效度南大96972000<>测量效度浙大2000<>测量的效度就是正确性程度,即测量工具确能测出其所要测量的特质的程度。效度越高,即表示测量结果越能显示其所要测量的对象的真正特征。测量的效度可以决定所建立的理论解释的正确程度。对效度的检验可以保证不同的研究人员对某一研究变量的意义与内涵有一致的理解。1)效度的基本原理:从测量分数变异的观点来看,效度就是测量得分的总变异量中,由所要测量的特质所造成的变异量所占的百分比。2)效度的检查复旦9697<>:效度测定的三种类型是什么?内在联系如何?):<1>内容效度(表面效度)北大97<>):考察内容效度旨在系统的检查测量内容的适当性,并依据我们对所研究的概念(变量)的了解去鉴别测量内容是否反映了这一概念的基本内容。内容效度实质上是个判断问题。检查内容效度就是检查有概念到指标的经验推演是否符合逻辑,是否有效。在科学研究中,需要以大多数科学家所接受的概念定义为标准。 <2>准则效度(效标效度)南大95<>:标准效度):准则是被假设或被定义为有效的测量标准,符合这种标准的测量工具可以作为测量某一特定现象或概念的效标。对同一概念的测量可以使用各种测量工具,其中每种测量方式与效标的一致性称为准则效度 A如果效标或准则是依据将来实际发生的情况而建立的,那么这种准则效度可称为预测效度。预测效度是将已经得到的测量结果与未来实际发生的情况进行比较,以检查两者的一致性。 B如果效标识于某种测量方式同时被证明为有效的,则称之为共变效度。共变效度是用来判断其他的测量工具是否可以取代作为效标的测量工具。 C如果效标是以实际经验判断为准的,则称为实用效度。实用效度通常用来检查测量工具的实际效果。由于对某些现象的测量过去并没有一定的标准,所以只能依据实际经验来检验测量工具的有效性。 实用效度与共变效度有些近似,如定量化的干部测评方法就是以组织部门传统的考察干部的方法为效标,当它具有较高的效标效度时,由于它省时间、简便易行,所以就能取代过去沿用的老方法。 准则效度的局限:有些作为效标的测量工具只是假定有效的,它本身是否真正有效并没有理论根据,这一缺陷是心理量度化方法所共有的<3>建构效度(南大99<>;复旦9798<>):是要了解测量工具是否反映了概念和命题的内部结构。它通常在理论性研究中使用。由于它是通过与理论假设相比较来检查的,因此也称为理论效度。测量同一个概念可以用多个指标,当用XY的多个指标来测量两个概念之间的关系时,如果不同指标的测量都反映出理论所假设的关系,那么这些测量就具有建构效度。<4>内在效度与外在效度北大2003<>:内在无效度):测量都是在具体的时间、地点对具体的调查对象所作的观测。如果在一项具体研究中,对上述三种效度(内容效度、准则效度、建构效度)的检查都没有发现问题的话,就可以认为这一研究具有内在效度,它的资料和结论可以有效的解答所研究的问题。可以说,内在效度是指一项研究的资料和结论的有效性。而外在效度是指这种研究结论的普遍有效性。对外在效度的检查要考虑样本的代表性和特殊性,以及研究时间、地点、情境和研究内容的普遍意义。

8、 信度与效度的关系北大93<>;北大96<>说明测量的信度与效度及其相互关系):(1)信度低效度不可能高。如果收集的资料不可信、不可靠,那么它肯定不能有效地说明所研究的对象。2)信度高,效度未必高(效度有可能很低)。3)效度低,信度有可能很高4)效度高,信度必然也高。如果有效地说明了各种现象,那么它的资料和结论都必然是且必须是可信的。5)测量的信度是效度的必要条件,但不是充分条件,无信度必然无效度,但有信度未必有效度。反之,效度是信度的充分条件但不是必要条件,有效度必然会有信度,但无效度却未必无信度。6)效度=信度- ,由此可知,效度系数等于信度系数减去 。由于其他变量的影响是内含在测量工具之中,因此很难测出他们的变异量( ),而信度系数则可由相关系数计算。所以在一些研究中,研究者常用信度系数来近似的说明效度,但这是有缺陷的,因为在社会研究中,其他无控制的变量对资料的效度有很大影响。所以还是应当通过对内容效度、准则效度和建构效度的检查来说明研究的有效程度。7由信度和效度的关系可知,所有影响信度的因素也必然影响效度。此外,除随机误差外,效度还受到系统偏差和其他变量的影响。对这些影响课主要考虑两个方面<1>测量工具;<2> 样本的代表性。





2007-01-22

没有评论: