2007-01-23

袁方《社会学研究方法教程》笔记:第十六章:变量分析的逻辑和策略

第十六章:变量分析的逻辑和策略

1、 分析的逻辑是指进行分析时所遵循的逻辑方法和推理过程,分析的策略指的是分析程序的设计及分析的技巧等。 掌握变量分析的逻辑与策略不仅能使资料分析更深入、更全面而且还能澄清和防止某些逻辑错误,是理论解释更符合实际,或发现新的理论和问题。 统计调查的变量分析最早是由法国社会学家杜尔克姆运用到社会研究中来的,以后经斯多弗、拉扎斯菲尔德、罗森伯格等人的发展与完善,已经形成了一套较系统的统计调查的资料分析模式----详析模式。

2、 变量关系的类别 1)变量间的关系:统计相关或统计无关。两个从统计上看无关或弱相关的变量,实际上可能的确无关,但也可能有关系,两变量间的这种统计上无关而实际上相关的情况,称为虚假无关。而两个从统计上看具有相关关系的变量,它们之间的真实关系有可能是:实际上无关、实际上相关、实际上具有因果关系。2)统计相关的不同类型 <1>统计相关,实际无关。这种情况称为对称关系或虚假关系,即从统计上看有关系的两个变量实际上相互独立、互不影响,并无有意义的联系。对称关系用符号表示为: <2>统计相关,实际也相关。这种情况称为相互关系,所谓相互关系是指统计上相关的两变量实质上也是有关系的,这种关系是一种交互影响的关系,在这种关系中,两个变量相互作用、相互加强。有时,我们虽然明知有因果关系存在,却难于指出何者为因、何者为果,谁影响了谁,实际上是互相影响,互为因果。相互关系在调查中极为常见,符号表示为:

<3>实际的因果关系:这种情况是指统计上相关的两个变量之间实际上存在因果关系。因果关系是变量分析中所要探讨的最重要的课题。社会研究中所说的因果关系是指在两个变量中,一个变量的变化伴有另一变量的变化,即一个变量影响另一个变量,但是反过来不成立。在因果关系中,能够影响其他变量发生变化的变量称为自变量,依赖于其他变量,但其本身不能影响其他变量的称为因变量,后者通常是我们希望解释说明的变量。因果关系用符号表示为:

判断因果关系的原则<1>时间的先后。<2>变量的不变性与可变性。时间的因素固然重要,但并不是决定关系方向的不变的标准。在社会研究中常将一些具有固定性、持久性的变量作为自变量,如性别、年龄、民族等。社会研究中还有一些主要的变量,它们之具有相对持久性,如社会地位、居住地以及社会阶层等就属于这种变量。这类变量比行为、态度等变量更为固定持久,因而往往被当作自变量。<3>需要指出的是,这里所讲的因果关系,也称为非对称关系(即 ),它是指在特定条件下的两变量关系中,一个变量影响另一个变量,反过来,后者对前者没有影响。这种非对称关系于自然科学所讲的因果关系有一定区别,后者的定义要更严格一些。

3、 详析模式北大93<>;北大2001<>:试举例说明详析模式的分析方法;北大2002<>:试论述详析模式的方法和主要作用): 1)两变量的交互分类:多数研究是从变量间关系的假设开始的。对两变量间关系进行描述的最基本的方法是交互分类法,又称列联表 2)引入检验因素。(A)检验两个变量间关系的最重要、最系统的方法是引入第三个变量,然后检查引入第三个变量后自变量与因变量原有关系得变化情况,由此澄清与深化对原关系的认识,并解释两变量的真实关系。这种引入第三变量对两变量关系进行检验,以解释或确定这种关系的过程叫做分析的详析化浙大20002001<>;南大2000<>),被引入的变量叫做检验因素控制变量 B)分表法:(a)首先描述变量XY的关系,这时的关系称为原关系。(b)依据理论或经验选择检验因素。(c)将检验因素分成不同层次或不同类别,然后在每一类别中做XY的分列联表,分表中XY的关系称为部分关系。(d)对各分表中XY的关系(部分关系)进行考察:(甲)若XY的原关系在各分表中消失了,证明原关系主要是由检验因素引起的;(乙)若XY的原关系在各分表中仍然存在(即各分表中XY的关系与原表相近),说明XY的关系不受检验因素的影响;(丙)若XY的原关系在各分表中存在但较原关系减弱,证明XY间的关系部分收到检验因素的影响。(3)详析模式的主要作用:<1>详析模式的一个主要作用是使调查研究可分享实验设计的一些优点。它是一种近似的实验设计。在详析模式中,控制的项目越多,则两个群体出了一个变量不同外,其他可能越接近相同。这样详析模式就使得调查近似于事后实验设计,从而成为社会科学中最有利的证明模式之一。<2>可以充分利用统计资料,并将研究引向深入,一方面能对变量关系作出描述;另一方面通过引入第三变量,他还可以澄清事实真相,包括两变量间关系的真伪、这一关系存在的条件和存在的原因等等,从而使变量间的关系更具体、更精确可靠。分析的目的在于解释,详析模式在解释上的贡献很大,不仅能证实解释,也能排除错误的解释,并能获得新的解释。因此它是建立理论和开发资料的有力工具。<3>在详析模式中,部分关系与原关系进行比较时,可出现三种情况:(A)关系相同。(B)关系减小或消失。(C)关系分列。即一些部分关系与原关系相似或加强,而另一些部分关系则有所减弱或完全消失。(A)(B)是一般关系分析的主题,(C)是条件关系分析的主题。

4、 变量关系的检验 1)虚假关系的检验北大97<>:试比较详析模式中,条件关系分析与变量关系检验的异同。北大2002<>):两变量间的虚假关系是指两变量表面是一个非对称关系,但实际上是一个对称关系,两变量间并无有意义的或内在联系,他们之所以有关系是因为此两变量恰巧与其他某一变量相关联。造成两变量虚假关系的这“某一变量”就叫做外在变量。它与自变量及因变量的关系用图来表示就是: 。所以,若某一变量为外在变量,则将其控制之后,自变量与因变量的关系应当消失。因此,根据理论或经验选定可能成为外在变量的变量作为检验因素,使用分表法将检验因素控制,就可以判断一个关系是否虚假。引入外在变量的最重要贡献是能够防止做出错误的解释。

举例:1845-1945年医学统计表明,在过去一个世纪中,精神病患者的比例大为增加。对于这一关系,不难做出下述解释:在过去一个世纪中,生活环境的迅速改变造成了严重的社会紧张,可能是这种社会紧张导致了精神病患者的增加。但是,引入年龄这一变量加以检验,发现二者虚假相关。进一步的解释:年纪大的人中老年性痴呆症增加,这种病是生理衰退而不是精神紧张造成的。医学进步使得人的寿命延长,也增加了老年人在人口中的比重,因此产生大量老年性痴呆患者。

上述例子说明,一个看起来精密的理论架构,就因为没有考虑到外在变量,事实上却是错误的。

引入外在变量的做法,能增进研究者对于这两变量间具有内在关系的信心,但不能完全断定这一关系是真的。因为它也许还受其他外在变量的影响。

2)变量关系的具体化:社会学常常有些极为笼统的命题,它们的涵盖能力很大,但却无助于增进对问题的了解。为了使变量间这种笼统的关系具体化,找出一个复杂且涵括极广的自变量中对因变量起主要作用的因素,往往采用引入检验因素的办法。作为检验因素的就是自变量中被理论或经验推测为对因变量器主要作用的那个因素。能使变量件关系具体化的变量称为内含变量。

举例:杜尔克姆研究婚姻中哪个因素影响自杀率,包括性的满足、夫妻感情、不孤独等影响已婚者的自杀率。在这种情形中,两变量的关系是建立在涵括的概念上,但实际上这一关系确是由概念所包含的某个因素引起的,是总体“代表”了局部。用图示表示就是: 。与此相反,还有另外一种情形存在,即关系是由某个因素引起的,但实际起作用的却是涵盖这个因素的更宽的概念,是局部代表总体

3)追寻关系产生的原因:在实际中常常碰到这样一种情况:变量XY之间的关系是另一变量A的“媒介”作用的结果,即X导致A,而A又导致YX通过A的作用产生与Y的关系,用图表示就是: 变量AXY之间关系的建立起了中介作用,故称为中介变量。如果能证实X确经A影响Y,就可以说:XY关系之所以如此,是因为A的作用的结果。因此,将中介变量作为检验因素引入到两变量之间这一检验模式,可以说明自变量是如何影响Y的,即对变量关系发生的过程进行注释。指出中介变量有助于更进一步了解两个变量间的关系,如果不考虑这种中介因素,我们就会止于事实,而缺乏完整深入的了解。

4)寻找因果次序:前导变量的引入可以说是源于社会学研究中对因果次序的探寻。 ,这里,A因素就是前导变量。前导变量的引入步实施自变量与因变量之间的关系消失,而是使它得到澄清

举例:父亲的教育水平影响儿子的教育水平从而影响投票率。

检验一个变量是否为前导变量的具体做法是:注意检验这个变量能否满足下述三个统计上的条件,若能满足,则是前导变量,否则不是:<1>三个变量:前导变量、自变量、因变量,必须两两相关。<2>控制前导变量后,自变量与因变量的关系应不消失。<3>控制自变量后,前导变量与因变量间的关系应当消失。

5)防止将真关系误判为假关系:两变量间真实关系不能表现是由于第三个变量的闯入抑制、取消或削弱了这一真实关系。这种使真实关系隐而不彰的或减弱的变量就叫做抑制变量

举例:年龄抑制工人会龄与种族态度的关系。控制年龄后,会龄与种族态度的相关性表现出来。

一个抑制性变量在某种意义上是与外在变量相对应的。后者用于检验假设是否被当作真,他从假设两变量具有真相关开始,继而引入检验因素,此因素对原来的两个变量来说是外在的,假如发现原来的关系消失了,则称原关系是虚假的。而前者则用于检验镇是否被当作假,它从两个变量间无关系开始,然后引入检验因素,这个因素对原来的两个变量来说也是外在的,假如在每一个分表中出现了关系,则称原来的无相关是虚假的。

正像外在变量可以判断关系为假而无法断言关系为真一样,抑制变量可以判断关系为真却不能断定关系为假。但是外在变量虽不能判断两关系为真,却可以通过对多个外在变量的检验,加强它是真关系的信心。同样,抑制变量虽然不能判断两变量关系为假,但却可以通过对多个抑制变量的检验,加强它是假关系得信心。

6)恢复变量间关系的真貌歪曲变量使两变量间真是关系扭曲、变形的变量,它既可以将真扭曲为假,也可以将假变为真,甚至完全改变一个关系的真实方向。因此,对歪曲变量的检验,能够将两变量间真是关系袒露出来,从而使研究者避免抛弃正确的假设或接受错误的假设。

5、 条件关系的分析:在利用分表发对分表中的关系与原关系进行比较时,我们发现这些分表中的关系或减弱、消失;或维持原状;或从无相关到有相关、弱相关到强相关;或与原关系的下相关方向相反。在这些情形中,我们假定所有分表中关系的大小与方向是相似的。但是,在有些情况下,各分表中的关系可能并不一致,即有的分标关系强、有的弱,有的分表是正相关,有的是负相关。在前一种情况下,由于所有分表中自变量与因变量的关系都相同(或相似),因此可以说这一关系是普遍的、无条件的。而在后一种情形中,自变量与因变量的关系因表而异,也就是说这一关系是有条件的,因此,我们称其为条件关系。这里所说的条件,可以是检验因素的不同分类、不同层次、不同阶段,以及任何具有分类意义的东西。

条件关系在社会学分析研究中作用很大,不仅可以帮助解释,对理论的建立做出贡献,还能说明、澄清两变量间的关系,促进对事物的了解;而且他对科学的主要目标之一:预测,也有重要贡献;它使得调查资料的分析更丰富、更深入、更正确。

1)帮助解释<1>促进修正原解释或发现新解释。<2>支持或强化原解释。<3>帮助选择正确的解释。对同一个现象,人们常常做出各种不同的解释,这些解释似乎都同样令人信服,都同样切合结果,使人难辨真伪。条件关系的检验往往能帮助分析者摆脱这种困境,选择恰当、合理的解释。<4>帮助发现隐而不彰的事实。在虚假无关中,由于各个分表中的关系方向相反,因而可以用两种方式进行解释。第一,分别解释,也就是对正关系与负关系各自做出解释。第二,整合的解释,即将两种对立的发现融合起来,只给出一个搞抽象层次的解释。<6>帮助了解事物发展趋势或过程。具体做法就是将时间作为检验因素。在横剖研究中调查资料大多是于某一时点或某一段时间收集到的,将他们用于社会动态研究颇受限制,但如果善于运用条件关系,就能在相当程度上解决这一困难。

2)对关系进行说明、澄清及描述:所谓说明一个关系,就是将分表里具有特殊意义的关系指出来,并且指明这种特殊的意义。<1>清除原关系中的干扰因素。<2>明确指出加强或抑制原关系的一些条件。<3>可以说明两变量关系成立的必要条件。一般说来,所有的关系都是条件关系,即每一种关系都是在某种条件之下才成立。但通常研究中并不特别指出关系成立所应具备的条件,因为一般情况下他们的存在是内含的、公认的。然而在某些情况下,若能说明一个关系的同时,指出这种关系成立所必需的条件,则会增加人们对研究对象的深入了解,也使分析更加完整,条件关系可以完成这一使命。<4>条件关系可澄清自变量与因变量的本质。为进行实证的社会研究,必须将概念操作化,变成具体的指标或指数,然而这些指数与指标往往并不能精确代表概念,因此在解释指标时,常常超过或达不到这个指数或指标的范围,从而做出错误的解释。条件关系有时可以帮助分析者澄清调查资料所表现的指数的意义。<5>条件关系还可以使描述性的说明更精确。

6、 联合作用的检查将第三个变量作为一个自变量,以了解它与原来的自变量以怎样的互动方式对因变量产生作用。这种作用就是联合作用。它包括四种类型: 1)独立作用:如果将两个变量XY间的不对称关系用 表示,引入第三个变量A,将其视为自变量并假设AY也存在着非对称关系,则变量间的关系就变成 XAY的作用可分为: <1>两个自变量在不受对方作用的下对Y独立作用<2>XAY共同作用<3>XA形成新的变量后对Y的作用

独立作用又分为两种情况第一,两自变量之间彼此无关,各自独立的对因变量起作用。 第二,两自变量彼此密切相关地对因变量发生作用,每一自变量在一定程度上反映着另一自变量。

2)相对作用:假定每个自变量军对因变量有独立的影响,那么何者大?这就是所谓相对作用的问题。相对作用研究在社会学研究中有着极为重要的作用,许多理论问题可以从检验相对作用的大小获得解决。如:是教育还是经济对个人的生育行为影响大?

3)累积作用:是指两个自变量对因变量Y的共同作用,这种共同作用并不一定是两个自变量各自影响力的单纯相加,决定其强度的因素很多,但其中以两自变量间的相关程度为最重要。累积作用的大小主要决定因素是两自变量间的相关程度。

4)类型作用:有时两个自变量或其中某一自变量与因变量并不相关,然后当它们融合在一起时,却能够产生另外独特的作用,这种情形相当于两个自变量融合之后形成一个新的自变量,它是超于组成它的两个单个自变量之上一个新的实体为与原自变量区别,我们称这种变量为“类型”。“类型”与各个自变量的关系就像整体与部分的关系部分组成整体,但整体性质不等于个部分之和。

按自变量的融合方式,“类型”可分为四种<1>特殊类型:指新生成的自变量的涵意不同于原来两个自变量的涵意。<2>修正类型:指新合成的自变量修改了原自变量的本质与特性。<3>一致---不一致类型:指新自变量由两个性质一致或两个性质不一致的自变量合成。<4>相对的类型:指通过两个自变量相互地位的比较所产生的新变量。

由以上介绍可见,详析过程式统计分析与理论分析密切结合的过程研究者不仅要运用缜密的逻辑推理,而且要运用理论的洞察力和想象力对调查资料中所反映的客观事实或现象间关系做出理论解释。因此,在现代社会调查中调查研究人员不仅要努力掌握先进的统计技术,而且更重要的是要掌握科学的思维方式和推理方法,提高对社会现象的分析能力和洞察力。

7、 调查分析的策略 1)详析的程序 <1>确定两变量间关系的类型。若两者相关关系较显著就要进一步分析它们之间的是对称关系、还是相互关系或因果关系,如果是相互关系,我们则要进一步检查其相互影响,比较两者谁是更具持久性和固定性的变量,以尽可能决定影响的主要方向。如果是因果关系,则要确定谁是自变量,谁是因变量。 <2>确定关系的真伪。分两种情况:(A)两变量统计相关:应考虑这种关系是否有内在的或有意义的关系是否受到某外在变量影响的结果。(B)两变量统计无关或相关不显著:要看其关系是否被抑制变量所抑制,特别是在理论和实际观察都表明他们有可能有关系时。当量变量间的原关系的方向与我们所了解的和理论所提供的方向相反时,就要考虑是否歪曲变量在起作用。 <3>将量变量间的关系具体化。确定两变量关系为真之后,则可检查内含变量,以使这一关系更具体。 <4>寻找变量间的因果链。进行中介变量的检验,目的是对这一关系做出说明。有时,我们可以进一步通过追寻前导变量来扩大因果链条。 <5>检查是否存在条件关系。许多有价值的资料都是由这一步骤获得的。 <6>进行联合作用的考察。进一步考察两两个变量是否存在独立作用。如果两变量彼此独立起作用时,就要进一步考察两者何者为大,此外还要考察累积作用。最后可检查两自变量是否可以建立一个新的变量类型。

需要特别指出的是:在调查分析中,两变量关系只是代表分析的开始,而非结束。实际上在详析的过程中,每一部的分析都会得到一些结果,这些结果会产生一些新的问题,需要进行进一步的分析。分析是一个不断探寻的过程,每一步分析都会产生一个新的问题,而须检验新的资料,进行新的分析,新的资料又产生其他问题,如此循环反复就使得我们对于调查资料的利用更加充分并进而导致对社会现象的认识不断深化。

2)假设检验与概念追踪:在调查研究中,虽然假设检验具有极大的价值,但它并不是唯一的,有时甚至不是最主要的一种方法。这是因为即使假设是由理论抽离出来的,也能获得资料的支持,但资料并不能证明理论,资料只能给理论以支持,虽然研究的发现与假设所根据的理论一致,但这些发现也可能与其他理论一致。实际上,经验研究远远超出了检验理论的被动功能,它不仅仅是证实或反驳假设。如果能适当的运用其他一些分析的策略与技巧,经验研究在创造、改进、反思和澄清理论上也能发挥积极的作用。许多调查分析采用一种所谓“概念追踪”的分析方法,它是一个理论与资料动态地交互作用的复杂过程。概念追踪与纯粹假设检验模型不同。假设检验是由理论起,理论发展出假设,收集相关资料,然后检验假设一决定其是否获得支持或否定。概念追踪则是在理论与资料间进行互动,它由资料出发,资料常迫使理论家进一步对其加以解释,而这些解释与理论又指引适当的资料以进一步验证理论或使理论更为周密

3)偶然重大发现的利用:科学的历史充满了未曾假设的意外发现。实际研究中,这种以偶然或智慧获得发现极为重要,因此对于这种偶然性发现的警觉是研究策略的关键要素。这种意外地发现可以促使产生新的理论或对原有理论作出修正。有时意外发现的贡献不一定是突破性的,但对于资料的意外可能性保持高度警觉,研究这就能够更充分的利用这些资料,并增进对社会学理论与知识的贡献。

4)证据的分析:任何科学的目的是达到概括论断,即由具体的事物得到一般的原则或模式。概括论断可分为两类:经验的与理论的,前者是指根据一些个案所得到的结果概推到较普遍的总体。而后者是指从各种不同情况中得出一般原则,在这种概括论断中,具体的变量被看作是较抽象的概念的一个指标。 由经验得到概括论断,应进一步加以确证,以增加他的可信度和解释力。对于经验型概括一般是通过复验进行证实的 复验的主要方法有 <1>将资料与来自同一或可比总体的其他样本作比较。<2>在不同的总体中作相同的经验性概括论断。<3>配对比较方法。

证实理论性概括论断的基本方法是选择代表同一概念的不同指标。杜尔克姆对自杀的分析提供了整理证据的卓越例子,他将许多经验性概推整合成单一的理论性概推,即高度的社会整合与低自杀率相关。将相同命题的证据累积起来就使其论点特别有说服力。需要指出的是,在验证理论性概推时,对于同一个研究与理论命题相关的一切资料都需要加以检查,而不能任意进行选择。

证据分析对于理论性概推的主要贡献主要有以下几点:<1>可以支持对结果的解释,由此可以产生更强有力和更有包容力的理论概推。<2>可以对某一理论的解释提出问题,从而使我们注意寻找更符合事实的其他解释。<3>可使在对原有结果的不同解释间作出正确的解释。<4>可在同一研究中进行验证,经验的概推除“配对比较”外,不可能在同一研究中对自身的结果进行验证。<5>有时能使我们对理论概推比经验概推在统计上更有信心。

5)事后解释:是先有资料,然后再找符合它的解释。因此事后解释只是一种可信性的解释,而无法达到“证据确凿”的解释(高度肯定),即这种解释知识与一套资料相符而已。

事后解释的三大缺陷<1>伸缩性过大,即对一种调查结果,可有多种解释。<2>不能将其完全抛弃。<3>无法以来外在的确证。事后解释因为是有了资料后才加以解释的因此无法肯定这一解释的正确性我们无法再检查资料以获得确证。

对于上述三大缺点,我们可以通过详析程序和证据分析程序部分加以克服。这两个程序都是由解释抽取出推论,然后将其付诸验证。因此,事后解释并非分析的结束而只是它的开始。社会调查研究中不得不使用事后解释,但在使用这种方法时,必须注意他所具有的局限性,必须运用上述的程序对他们进行处理。

2007-01-22

没有评论: