谢宇教授方法论系列讲座(二)
主题:因果推理
Causal Inference
主讲:谢宇教授(美国密西根大学社会学系教授)
主持:马戎教授(北京大学社会学系主任,博士生导师)
时间:2002年10月23日晚7:00-9:00
地点:五四体育馆体教电教厅
马戎教授:今天这个讲座是谢宇教授方法论系列讲座的第二讲,主题是因果推理。下面我们用掌声有请谢宇教授给我们做报告。
谢宇教授:谢谢大家光临来听我的讲座,我今天要讲的是方法论的第二讲因果推理。上一讲我们讲的是比较抽象的哲学比较。这一讲我会讲得更具体,更深入一些。要讲因果推理,我们首先引入几个因果关系的问题(Causal Question),第一个是9.11事件会使美国人感到恐怖吗?如果会的话,9.11事件就是因,美国人感到恐怖就是果,是9.11事件导致了美国人的恐怖感。第二个例子是你们来参加我的这次方法论系列讲座有收获吗?如果有收获的话,你们参加讲座就是原因,收获知识就是结果,如果你们不来参加这个讲座可能就没有这种收获,但可能会有别的收获,是你参加这次讲座造成你在方法论方面有了这种收获。因此,因果关系问题是一个形式上简单的问题,它包含两个理论性概念之间的关系:原因(cause)和结果(effect)。是不是有原因就会导致结果?如果把原因变量定义为X,把结果变量定义为Y,是不是有X=>Y?这就要求我们正确的理解因果关系。因果关系是所有科学研究的基本目标。通过研究因果关系,我们可以准确的预测未来,为政策干预提供科学根据,还可以验证和丰富认识客观世界的理论知识。
为了理解因果关系,我们先引入简单比较的概念。简单比较是一种简单的方法,就是比较试验组和控制组。下面我举一个例子来说明这种简单比较的方法。在一个社区内,X1个儿童参加了一个启蒙教育项目(Head Start),这些儿童就是试验组,而另外X2个儿童没有参加这个项目,这些儿童就是控制组。27年后再来测量这两组人各自得到的受教育水平。我们用Y1来表示参加了启蒙教育项目的试验组儿童的受教育水平;用Y2来表示没有参加启蒙教育项目的控制组儿童的受教育水平。结果是受过启蒙教育的儿童的受教育水平比没有受过启蒙教育的儿童的受教育水平要低。那我们是否可以得出这样的结论,启蒙教育项目对受教育水平有负向作用。60年代前期,Westinghouse就报告了这个结果。从观察到的数据来看,参加启蒙教育项目与受教育水平的关系好像是负向的。但是,我们这里忽视了一个变量的作用,就是社会经济地位。参加启蒙教育的儿童一般是来自贫困家庭,需要通过政府资助才能上学,而那些没有接受启蒙教育的儿童来自比较富裕的家庭,他们父母能够供他们上学,并且能提供较好的学习环境。因此这两组人根本就不具有可比性,因此在这个试验中把家庭条件较好的儿童定为控制组就是不合理的,因为在家庭经济地位的影响下,我们根本就看不出参加启蒙教育与不参加启蒙教育对贫困儿童受教育水平的影响。因此在这个试验中不应该把家庭经济地位较好的儿童设为控制组,而应该选择两组都是来自贫困家庭的儿童,一组作为试验组,另一组作为控制组,再来测评启蒙教育对他们受教育水平的影响,这才有意义。另外一个例子是,加州大学伯克利分校研究生录取的性别比例问题。我们先来看一下总的录取数据。
申请人数 入学比例
男性 8442 44.2%
女性 4321 34.58%
表面上看,好像男性的录取率要比女性要高,但实际上是不是这样呢?我们来看一下具体某个专业的录取率,从专业的录取率来看,女性集中报考在录取率较低的热门专业,并且在这些专业中女性的录取率还比男性要高,在其他相对冷门的专业里,女性的录取率都不必男性低。但是,为什么总的录取率中,女性会比男性低很多,致使当时掀起了一股女权运动。主要是因为报考的女性基数比男性要小很多,只有男性的一般左右,当大部分女性集中报考那些录取率比较低的热门专业时,其总录取率必然较低,但男性虽然也有不少人报考了录取率较低的热门专业,但是他们还有很多人(相当于女性的总人数)报考了其他录取率较高的专业,因此平均下来,男性的总录取率会高于女性。因此这里根本不存在性别歧视的问题,只是因为一些人只看到了表面数据,而没有深入分析。因此在这个案例中,性别与专业选择有关系,性别影响专业选择,专业与录取率又有关系,不同的专业有不同的录取率,由于录取率在各专业之间有很大的差异,女性多的专业录取率低,男性多的专业录取率较高。这就导致了总录取率上男性要高于女性。
下面,我们来看一下其它三个社会学案例。第一个是从受教育水平来看,是兄弟姐妹多好还是独生子女好?是独生子女受教育水平高还是有兄弟姐妹的孩子受教育水平高?我想听一下大家的意见
学生一:我认为这个问题要从两个方面来看,一个是当经济发展水平较高,家庭收入相对较高,受教育机会均等时,多子女之间由于有相互协作,他们的受教育水平就会比独生子女要高。当经济发展水平较低,家庭普遍比较贫困时,独生子女的受教育水平就会相对比较高,因为这个时候受教育的机会不均等,子女多的家庭难以支付所有子女上学。
谢教授:你分析地很好,但是我要补充一点,就是事实上当机会不均等时,独生子女享有更多的受教育机会,但是这并不能说明独生子女的受教育水平会比非独生子女要高。由于非独生子女受教育机会难得,他们往往会非常珍惜这种机会,因此他们有很强的学习动力,这往往时他们在学习时候比独生子女要刻苦,而独生子女因为家庭条件优越,往往没有什么学习进取心,当然我这里是讲一般情况,不乏有特例,因此就学习成绩而言,有的非独生子女往往比独生子女成绩要好,但是由于家庭经济条件的限制,非独生子女获得本科和本科以上的受教育机会很少,因此总的而言,独生子女的受教育水平会高于非独生子女。
我们的第二个案例是婚前同居使离婚的可能性增加了还是减少了?我还是先听一下你们的看法。
学生一:我认为婚前同居会增加婚姻的稳定性,因为婚前同居会使相互之间加强了解,增进认识,形成较稳定的认同,这会使他们的婚姻更加稳定。
学生二:我认为婚前同居不利于婚姻的稳定性。从观念上考虑,选择婚前同居的人一般是观念比较开放的人,他们在结婚以后如果婚姻遇到挫折的话也会很轻易的选择离婚;而那些受传统观念影响的人不经过婚前同居而结婚,他们就会很看重婚姻的稳定性,而不会轻易的离婚。
谢教授:从理论上来分析,结论和第一位学生比较接近,因为同居关系的确立会增进相互之间的了解,导致婚姻更加稳定。但是统计数据表明
婚前同居会使离婚的可能性增加。为什么呢?原因就跟第二个同学将的差不多。由于选择同居和部选择同居的人在观念上存在差异,选择同居的人一般观念比较开放,他们会轻易的选择同居的话,他们在结婚以后如果相互之间出现矛盾的话,他们也会很容易选择离婚。而不通过婚前同居而直接结婚的人,他们的观念相对比较传统,他们会比较重视婚姻的维系。因此婚前同居并不一定会增加婚姻的稳定性。
案例三是接受了大学教育后有什么回报?你们都上了北大,将来都会挣很多钱,但是当你挣钱的时候,你是不是会认为你能挣这么多钱是因为你在北大受教育的结果?在考虑这个问题的时候,我们不能通过比较在上大学的人和没有上大学的人来获得认识,因为我们不知道在上大学的人如果他现在没有上大学的话,他会是什么状况。而那些没有上大学的人,他们如果上了大学后又会是什么状况,这些都是我们无法知道的,因此我们直接把在上大学的人和没有上大学的人放在一起比较是不科学的。那么,我们能不能通过试验来获得对这个问题的认识,就是我们能不能让一个人既去上大学又不去上大学,然后再来比较上大学与不上大学的区别呢?这显然是不行的。当一个同学在上大学时,我们就不知道如果他不上大学会是什么样,如果一个人没有上大学,我们也不会知道如果他上了大学会是怎么样,这是无法通过试验来获得对这个问题的了解的。因此,归根结底,因果关系问题实际上是一个反事实问题(Counter-Factual),就是你要反过来想一想你在做某一件事情的时候,你没有做的事情。因此,在做因果推理的时候我们必须考虑反事实的问题,对于那些接受了“试验”的人,你要想如果他们没有接受这种试验会是怎样的情况。比如那些受过启蒙教育的儿童,假如他们没有受到这种启蒙教育,他们会是怎样呢?就是对相同的人来讲,得到了treatment,和没有得到treatment,会有什么区别。对于那些没有受过试验的人,假设他们接受了试验,那么又可能是怎样的状况呢?比如独生子女的孩子没有受过非独生子女的待遇,非独生子女的孩子也没有独生子女的经历,婚前同居的人不知道婚前不同居的人的感受,婚前不同居的人也不会了解婚前同居的人的体会。因此我们在想问题的时候不仅要想组与组之间的差别,更要想同一组人在两种不同情况下的差别。因为这是一个反事实的问题,我们根本不可能通过试验得到验证,因此这里就有一个很现实的问题,就是一个缺乏数据的问题。对于一组人,我们只能知道他在一个时间内进行一件事情的情况,而不可能知道在这个时间内如果他去做其他事情的话,他会是一种什么情况。比如对一个上大学的学生,我们不可能获得他不上大学的情况的数据。一个婚前同居的人不可能知道如果他婚前不同居会是什么情况。但是,这种数据的缺乏并不能阻止我们通过逻辑思维来对这个问题进行思考。因此这里就需要对无法验证的现象进行假设。但是我们引入假设也是有代价的,假设是否合理会直接影响到结果的正确与否,就是你必须从最牢靠,最基本的现象来看问题,必须把你的假设建立在事实的基础上,你的结果错了就完全有可能是你假设错误,因此假设也是有代价的。但是由于我们无法获得反事实现象的数据,我们不得不通过逻辑思维进行假设,这就引入了简单比较所需的假设问题。
如果试验组对象与控制组对象大体上是相当的,那么可以用这样的假设来简化问题。我这里为什么要说大体上是相当的,因为他们之间的差异还是有的,比如性别上的差异,年龄上的差异,但是通过大样本取平均值就可以忽略不计。就是假如组与组之间只有接受treatment和不接受treatment之间的差异,而没有其他的差异的话,我们就可以简化问题。对于第一组,我们知道了他接受了treatment的情况,但我们不知道如果他们没有接受treatment会是什么情况,我们就可以假设他们和控制组是差不多的,他们没有接受treatment的情况会和控制组没有接受treatment的情况差不多。同样,对于控制组,他们没有得到treatment,我们不知道他们得到了treatment后会是什么情况,我们也可以假设控制组和实验组是大体相当的,实验组接受了treatment的情况就会和如果控制组也接受treatment的情况差不多。当这两个假设都成立时,第一组的处理效应减去第二组的处理效应就会等于第二组的处理效应减去第一组的处理效应。一般我们做简单比较时会有代价,这种代价就是因为我们认为被处理过的和没有被处理过的组大致是相同的,在大致相同的假设下才可以用简单比较的方法。比如就我前面讲的例子,假设婚前同居的人和婚前不同居的人在观念上、性格上大体上是一样的,如果这个假设成立的话,我们就可以对同居和不同居的人进行简单比较。另外一个例子是上大学的人和不上大学的人,假如他们之间在能力,年龄,机会和把握机会的能力上是基本相同的话,我们也可以对他们进行简单比较。但是如果假设不成立的话,你得到的结果就会有很大的偏差,而当你的结果出现偏差的时候,你也会知道你是在假设上出了错误。所以在假设成立的时候,就可以进行简单比较,但是简单比较也是有代价的,当假设不成立时,你得到的结果就有可能是错误的。在现实情况下,这种假设一般是不成立的,你只能在试验的时候对外部因素进行限制和排除才能使这种假设成立,但是这在现实社会中是不可能的。比如婚前同居的人和婚前不同居的人他们在观念上,生活习惯上,个人性格上就会存在很大的差异,他们之间是不会大体相同的。另外,上大学的人和不上大学的人在能力、个人兴趣等方面也是有很大差异的,我们也不能把他们完全等同。而这些东西又是我们不能通过试验来实现的,我们不能强制一些人婚前同居,一些人婚前不同居,我们也不能强制一些人去上大学,一些人不去上大学。所以用简单比较的方法计算回报率得到的结果会偏高。
为什么是偏高而不是偏低,这就引入了一个比较具体的问题,就是忽略变量偏差(Omitted Variable Bias),这种偏差是不可避免的,但是我们必须把这个偏差的方向搞清楚,就是我们要知道为什么会有偏差,而且偏差是正的还是负的。如果试验组与控制组对象在观察到的有关特征上具有明显差异,那么这种选择性就被称为“观察到的选择性”(Observed Selectivity)。我们社会科学方法论上最头痛,最难解决的问题就是选择性的问题。人的行为是理性的,他做一件事情的时候会有他的道理,结婚也好,同居也好,这都是他们自己的选择。所以假如这里所有的选择性我们都能够观察到,那我们还能够解决,关键是有很多选择性是我们观察不到的。比如第一个启蒙教育项目的例子,这里的选择性假如是由于家庭经济地位造成的,那么我们就应该对这些家庭的经济状况进行测量。所以选择性是一个潜在的东西,要解决选择性的问题,有一种方法是把这些所有可能的危机全部都找出来,因为这些危机是可能导致我们得出的因果关系是假的。就是假如你知道某些变量是重要的,但是你忽略了这些变量,就有可能会导致忽略变量偏差。在多元分析当中,我们可以通过统计控制,使这两个组具有可比性,从而解决这个问题。实验组和控制组是有差异的,是不相同的,但是我们可以通过统计的方法来对它们进行控制,使他们达到基本相同。比如,如果我们不考虑年龄的因素,我们会发现佛罗里达州的死亡率会大大高于其他州,为什么呢?当我们从年龄结构上去分析时就会发现,佛罗里达州的老年人人数大大多于其他州,这就直接导致它的死亡率很高。所以当我们忽视了年龄这个变量的时候就会导致忽略变量偏差。因此,你在做统计的时候,就要尽可能地考虑到所有能够产生影响的变量。这就是我们要做多元分析的基本点。在因果关系里我们想知道的就是两个东西,一个因,一个果,由于组与组之间存在差异,所以我们在针对一个结果去找原因的时候我们就要想到多个因,通过多元分析来掌握其中的因果关系。这就是为什么统计很难做,为什么问卷要设计很长,就是因为我们要尽可能的考虑到可能对某个结果造成影响的各个变量。但是并不是所有的比较都会造成忽略变量偏差,很多时候并不会出现忽略变量偏差,因为忽略变量偏差要成立的话,它必须满足两个条件。这两个条件中缺少其中的一个都不会出现忽略变量偏差。第一个是有关条件,就是你忽略的变量要对因变量产生影响,也就是你忽略的变量要与原因有关系。第二个是相关条件,就是你忽略的变量要与主要的自变量相关,第一个是要和因有关系,第二个是要和果有关系,只有这两个条件同时成立时才可能会出现忽略变量偏差。在伯克利分校录取率的案例中专业与性别也是有关的,不同性别的学生集中在不同的专业,另外专业与录取率是有关的,不同的专业录取率不同,忽略了专业这个变量时就会造成忽略变量偏差,假如说专业与性别没有关系,或者专业与录取率没有关系的话,就不会出现忽略变量偏差。只有当专业与性别有关系并且跟录取率也有关系时,如果你忽略了专业时就会造成忽略变量偏差。另一个就是同居与离婚率的关系问题,如果观念与同居没有关系,或者与结婚后的选择离婚没有关系,就不会出现忽略变量偏差。正是因为人的观念既影响了婚前的同居,也影响了婚后对离婚的选择,因此忽略观念在这两者中的作用就会导致忽略变量偏差。
下面我们来看一个例子,我们这个社会对两个东西最感兴趣,一个是钱,一个是婚姻。我要举的这个例子把这两样人们最感兴趣的东西都包括了。这个案例就是在美国社会有一个很奇特的现象,就是婚礼花费的费用对婚姻的稳定性有正向作用。这一结果是否是忽略了有关变量造成的。我想问一下你们为什么婚礼的花费会对婚姻的稳定性产生正向影响?
学生一:应为婚姻花费越高,沉没成本越高,而这种沉没成本是无法回收的,因此在他们通过巨额的开支而结了婚后,如果要离婚的话,一是意味着他们投入的沉没成本没有获得收益,第二他们就会考虑下一次再结婚又要投入很大的沉没成本,因此他们更可能会选择维系现存的婚姻。
学生二:我觉得有两个原因,一个是如果他的婚礼办的比较大,就会牵动较多的关系,当他们要选择离婚时,要面对比较大的舆论压力。另外一个是他的婚礼花费高意味他的经济条件比较好,而经济条件好的家庭更容易维系婚姻。
谢教授:你们讲的很好。在美国,婚礼的费用一般是由女方家庭来出的,你们讲的成本,舆论压力,经济条件都是影响婚姻稳定性的因素。因此婚礼本身的稳定性并不是由钱这一方面的因素造成的,他还通过很多中间变量在起作用,因此简单地说婚姻花的钱多,婚礼的稳定性就高,也是忽略变量偏差导致的结论。因此这不是一对真正的因果关系。
现在,我们来讲忽略变量偏差的可能情况,和偏差的方向。忽略变量偏差有三种情况。在第一种中,忽略的变量用Z表示,原因用X表示,结果用Y表示,Z分别是X、Y的决定因素,Z对X的关系是C,Z对Y的关系是B,如果B和C有相同的符号,那么忽略变量Z导致的偏差是正的,如果B和C符号相反,那么忽略变量Z造成的偏差则是负的。比如假设X是受教育水平,Y是职业,Z是智力水平。智力水平是受教育水平和职业的决定因素,他会对这两者都产生影响,智力水平对职业的影响是正向的,对受教育水平的影响也是正向的,因此如果你忽略了智力水平在这两者之间的关系,造成的偏差就会是正的。第二种情况是Z和X相互影响,不是Z导致了X,而是Z和X相互影响,并且Z是Y的决定因素。如果Z与Y的关系B和Z与X的关系C具有相同的符号,那么忽略变量造成的偏差是正的,如果B与C的符号相反,那么忽略变量造成的偏差则是负的。第三种情况是Z是X作用于Y的一个中间变量或是解释变量,如果B和C有相同的符号,那么对直接作用而言,忽略变量Z导致的偏差是正的,如果B和C符号相反,忽略变量Z造成的偏差则是负的。比如女性的数学成绩比较低,假设数学成绩对职业选择有很大的关系,如果忽视了数学成绩在这两者之间的关系,就会造成负的偏差。
下面我们来讲一个比较重要的东西,这一段我没有翻译出来,主要是讲Propensity Score. P(T)=probability of treatment, if observed selectivity is present, P(T) is a function of observed variables vector Z, we can estimate P(T) through a logit model, under the assumption of no other omitted relevant factors, group T and group C are comparable, within levels of the estimated propensity score. Adjustment is thus made through a single dimension of propensity score. Propensity Score是1984年发现的,发现之初并没有很多人使用,但是现在用的人比较多。
最后我要讲概率性的因果关系。我们讲的因果关系都不是绝对的,都是概率性的因果关系。概率性的因果关系就决定了我们只能做相对的平均值分析,做趋势的分析,而不能做绝对的分析。在这种分析中我们要讲到嵌套的原因,这种概率性原因对个案的分析是不适用的,另外我们还会讲一下回归和相关在因果关系分析中的作用。我们第一个要讲的是同因不同果,因果关系的经典注释是决定性。我们讲的这种绝对性是指概率性和随机性,因为变异是社会科学的本质,相同的原因会导致不同的结果。变异又分为总体变异和时间变异,总体变异是不同个体之间的变化,比如在座的同学,你们同样是听了2个小时的讲座,但是你们对这个讲座的接收程度就不一样,有的人接收得较快,有的人较慢,这就是总
体之间的个体差异。时间变异是相同个体在不同时间的变化。比如不同的时候,人的态度,人的反应是不一样的。概率性的原因就是强调平均值和趋势。随着样本规模的扩大,因果关系渐趋近于平均值,但是这种平均值并不是针对个案而言的。这个概率性原因有两层含义,一个是有原因不一定有结果,比如子女多的家庭未必子女的受教育水平就低。相反,另外一层含义是结果可以在没有某个原因的情况下发生。比如吸烟与肺癌之间的关系,一个人得了肺癌不一定就是因为他吸烟造成的,虽然在统计上而言吸烟对肺癌有直接因果关系,但是这种因果关系并不是决定性的。第三个要讲的是嵌套原因,嵌套原因是必要条件而不是充分条件,这事实上是一个风险问题。另外,概率性原因对个案是不适用的,只有在有重复事件时,概率性的因果关系才会有意义,概率论的基础是重复,假如没有重复,就不可能有概论,也不会有概率性的因果关系。假如你要研究很具体的事件,我建议你不要用统计的方法,这基本上是行不通的。
第五个要讲的是相关和回归,它们是发现因果关系的工具,这个我在以后的讲座中还会着重讲。相关和回归是一种分析的方法,但是两个事情相关并不代表他们之间存在概率性的因果关系,因为相关的关系可能有很多种,不仅仅是因果相关,因此大家不要把相关当作因果相关。由于时间的关系,我今天的讲座就到这里,谢谢大家!
马戎主任:由于时间的关系,我们就不提问了,今天的讲座到此为止。
发表时间:2004-12-9 12:54:00
2007-01-22
没有评论:
发表评论