2007-01-22

谢宇教授方法论系列讲座:研究设计和抽样理论的基础

主题:研究设计和抽样理论的基础

Basics of research design and sampling theory

主讲:谢宇教授(美国密西根大学社会学系教授)

主持:马戎教授(北京大学社会学系主任,博士生导师)

时间:20021025日晚700900

地点:交流中心新闻发布厅

马戎主任:今天,我们欢迎谢宇教授给我们做方法论系列讲座的第三讲。

谢宇教授:这是我的方法论讲座的第三讲,在第一讲里,我强调了社会科学与自然科学的差异,它们之间有很不同的支点,那就是个体与个体之间的差异和由个体组成的整体之间的差异。第二讲我讲的是做因果关系分析时经常遇到的问题,这个问题的来源就在于个体与个体之间有差异。你比较两个人或者两组人,两个国家,两个文化,除了你看到的支点以外,还有隐藏的你看不见的东西,这就是我讲的选择性。假如这些选择性是我们可以观察到的,能用统计方法测量到的,我们就能够用统计的方法来控制。我在第四讲和第五讲会详细的讲一些方法上的问题,就是假如这些选择性没有被观察到的话,我们该怎么办。另外我还讲了造成忽略变量偏差的两个条件,就是在什么情况下,你忽略了变量会导致偏差。这些都是因为人与人,一件事情和另外一件事情,个体与个体之间存在差异造成的。

今天我要讲一些相对比较传统的一些概念以及方法上的研究设计,还要讲一点抽样理论的基础,抽样理论基础这部分今天讲不完,我在第四讲里会接着讲,在这一讲我会把我认为最重要的东西强调一下,有的可能你们已经学过了,我只是给你们把重要的东西强化一下,系统的讲一下。一般讲研究设计是从分析单位讲起,然后会讲到分析单位的层次问题,再讲分析单位的总体和几种重要的分析单位。我们先来给分析单位下一个定义,分析单位就是被研究的社会实体,这些实体可能是个人,可能是家庭,可能是组织,任何我们社会学研究的对象都可以叫做研究实体。他们是研究者需要观察、了解、描述的对象。所以分析单位是很简单的,就是你想研究的东西。分析单位是有层次的,一个较高水平上的分析单位可能包括多个其他较低水平的分析单位。比如个人是生活在家庭中的,所以一个家庭有很多个人,很多家庭又组成一个社区,多个社区组成一个县,再组成地区,再组成国家。我前面讲的社会现象存在差异,而差异就表现在分析单位的不同层次上,差异所在的地方,就是你要解释的地方,假如你不知道差异在什么地方,你就不可能找到合适的解释。比如说文化,如果你找不到文化之间的差异,你就很难解释两个国家之间的差异。因此,解释的差异和结果的差异要吻合,要不然你的解释就是失败的。所以,你知道了你的研究对象在什么样的水平,你解释的差异和结果的差异就要在同一层次上。因为我要讲的内容很多,我会讲的比较快,如果你们有问题的话可以提出来。我讲课有一个假设,就是如果你们不提问题的话,就说明你们听懂了,如果你们没有听懂就要提问题。

你一旦建立了你的分析单位就要知道你的分析单位的总体是什么,确定分析单位的总体是非常重要的,因为你要解释的是所有现象,而不是一两个现象。我们举一个例子,如果我们要评估北大社会学系20年来的教学质量的趋势时,什么是总体?我想听一下同学的回答。

学生一:是社会学系。

谢教授:社会学系不是一个变量,假如有几个系的话,我们可以做一个比较,但是只有一个系的话, 他不成为一个变量。

学生二:是不是北大社会学系每年的招生质量。

谢教授:很好,你讲的是生源的质量,我的答案是所有社会学系20届的大学生。以每一届学生为一个观察点,你想知道20年来教学质量的变化的话,就对每一届学生进行一个比较分析,从一届到另外一届,他的教学质量有什么差别。因此这里的分析单位是一届学生,而分析单位的总体就是整个20届北大社会学系的学生。所以你选定一个研究对象后要知道他的分析单位是什么,知道了分析单位后要知道分析单位的总体是什么,这是做研究的第一步。在具体的研究中,我们会用到那些具体的分析单位呢?我这里讲几种重要的分析单位。一个是个体(Individuals),个体在社会学中基本上是指个人。个体是社会学最基本的分析单位,其他的分析单位都是由个体组成的,没有比个体更小的分析单位。第二个分析单位是人群(Groups),人群也可以作为分析单位,人群的很多特征是由个人的特征汇总而成的,对人群的测量是通过对个体的测量汇总而来。比如种族,社区,家庭等以个体集中起来的一个群体。再比如我们讲男性工作者的工资要比女性高,工资本来是以个人为单位的,我们这里讲的两性的比较就是通过对不同个体的汇总得来的。下一个概念就是组织(Organization),组织不仅仅是个人的集体,它重在于组织成员之间的关系。关系是一个人没有的,没有学生就没有老师,就没有师生关系。组织的重要性在于它强调了关系,涂尔干就强调了社会学研究的是社会现象,社会现象不是由单个人造成的。当人们参加组织和团体活动时,个人的力量就被组织力量所掩盖。社会学之所以重视对组织的研究,是因为组织虽然是由人组成的,但是它已经超越了人本身而形成了一种关系,这种关系就是一种社会事实,而这种社会事实就是我们社会学要研究的重要部分。第四个分析单位是社会艺术品,比如书籍,建筑,绘画等。这些东西你们都熟悉,我在这里就不多讲。

下面我要讲的是时间性(The Time Dimension)。时间性是一个很重要的概念,假如我有更多的时间,我会多讲一点关于时间的东西。你要研究社会现象,你就要关注时间,时间从方法论角度来讲是一种信息;从理论角度来讲是研究的对象。因为我们要研究社会变化,我们也要研究人的行为,人的行为是随着人的经验、经历而变化的。以前的经历会对你以后的经历产生影响,你这方面的经历对你那方面的经历会有影响,这都是与时间有关系的。你在考虑社会变化和个人变化时,都要考虑到时间性。我们做方法论的也要注意时间性,什么事情先发生,你先观察到什么,什么东西是后发生的,是你后观察到的。因此时间性是一个很重要的概念。

根据时间性,我们可以把研究设计分成两大类,一类是横向分析,另一类是纵向分析。横向分析是对一个时点上的分析,是社会发展历程中的一个“快照定格”,要了解一个社会就要从横向分析开始,这是最基本的分析。虽然横向分析给你的信息是有限的,但是这些信息还是很有用处的,这是研究社会的第一步。比如在美国每十年进行一次人口普查,中国第五次人口普查也刚刚做完,数据刚刚出来。一次普查就是一次横向分析,是对社会的一次解剖,解剖的时间是人为定的。在美国还有很多横向分析,我这里举两个,一个是“现时人口调查”(Current Population Survey)简称CPS,它起源于美国的大萧条,美国政府为了监测经济发展情况,防止大萧条的再度发生,由政府出资,每个月都对经济发展的一些指标进行统计分析,通过这些指标来了解经济发展的状况,看当前的经济状况是有发展还是面临危机。我们经常跟学生开玩笑,问他们知不知道CPS,知不知道CPU,知不知道CPICPI是通货膨胀的指标。通过调查CPS,算一算CPU得出来的就是CPI。另外一个横向研究是“监测未来”(Monitoring The Future)。这是我们密西根每年都做的一个很大的调查。这个调查是对中学生做的,美国青少年有很多不良现象。这个调查就是监测青少年的不良行为,包括吸烟、喝酒、吸毒等,这是美国每年都在密西根做的一个项目。但是横向分析给你的信息是有限的,因为他忽略了动态的东西,为了知道动态的现象,我们就要采用纵向分析的方法。

纵向分析有助于推倒因果关系。因为从纵向分析中你会很清楚地看到什么事情先发生,什么事情后发生,从道理上来讲先发生的是原因,后发生的是结果。比如美国一个很重要的发现就是父母离婚对小孩的教育,成长状况,心理健康以及以后的行为都是不利的。如果你要研究这个项目的话,你首先要观察到什么样的家庭是离婚的,父母离婚前小孩的行为和父母离婚后小孩的行为有什么不一样,父母离婚后,小孩会改变他的行为,离开他原来的生活轨迹。所以说纵向分析对社会学研究有很大的帮助。关于纵向分析怎么具体的来推倒因果关系,我会在后面的讲座中讲到。纵向分析有两种类型,一种是趋势分析,一种是追踪分析,其中趋势分析其实不是真正的纵向分析,我们把他们放在一起是要你们知道他们的区别。趋势分析是在不同时点上对同一总体进行独立重复的抽样研究。我要强调的是趋势分析是对同一总体的研究,研究对象可以是不同个体,但必须是来自同一总体,而且第一次研究和第二次研究是独立的重复研究。因此,从方法论角度来讲,趋势分析实际上不是纵向分析,他可以称作是汇集的横向分析(pooled cross-sectional studies),就是把不同的横向分析在不同的时点汇总起来。我们做横向研究并不是一次就做成的,比如人口普查,每十年就要做一次,你把一次次的数据汇总起来就可以看到社会的变化。我们对国家,对社会,对任何总体在不同的时间抽不同的样,就是想对总体的趋向有一个了解。比如说人口的增长,教育对人口素质的影响,这些趋势都是我们需要研究的。

这些都是通过在不同时候抽不同的样来反映总体的变化。因此趋势分析也叫做重复的横向分析。如果你在不同的时间,多次重复抽不同的样本,就能看出研究对象的发展趋势。趋势分析的例子就有前面讲过的美国的pooled census, pooled CPS等。你要了解美国社会的变化,你只要把这些资料汇总在一起,就能看出美国社会的很多变化。我为什么说这些趋势分析不是真正的纵向分析呢?因为真正的纵向研究是追踪研究。追踪研究是对同一人群,同一样本在不同时点上做的重复观察。前面的趋势研究是对同一总体取不同的样本,通过不同的样本来反映总体在不同的时候的状况,从而看出总体在一段时间内的变化趋势。而追踪研究是对同一个样本的研究,我们的样本没有发生变化,第一次取样后,我们就一直针对这个样本进行研究。由于样本有时候是流动

的,因此我们做追踪研究的成本很高,花费很大。我们要跟着原来的样本流动,核实样本的真实性等等,因此做追踪研究的成本是很高的。但是花费高成本来做追踪研究是有回报的,因为追踪研究要比汇集的横向研究提供更多的信息,得到的资料更加有效,科学价值更大。利用这些资料,我们可以做出更好的,更科学,更可信的研究,这就是我们花这么多钱和精力去做追踪研究的原因。例如从1972年开始,美国做了一个“全国高中生纵向研究”的项目,研究者抽查了一部分在1972年读高二的学生,然后于19731974197619791986年分别对第一次抽样调查的那批人进行追踪调查。这是由政府出资,由大学学者做的,做出来的资料在全国范围内共享,谁要用都可以,我就用这个数据做了我的博士论文,现在我还在用这个数据做关于教育方面的研究。为了让你们更明白趋势分析和追踪分析得到的数据的差异,我给你们举一个例子。

这是性别与劳动参与情况的表格

1970 1980

有工作 无工作 有工作 无工作

男性 90 10 85 15

女性 50 50 60 40

在所抽样本中,1970年男性有90%有工作,10%无工作;女性50%有工作,50%没有工作,而到了1980年,男性85%有工作,15%没有工作,女性60%有工作,40%没有工作,可见在这10年内,女性的就业率有所增加,也表明女性的社会地位有了提高。这种研究是趋势研究中比较典型的,他是通过横向分析的数据汇总而来。但是在1980年的数据中有工作的人到底是在1970年就有工作,还是原来没有工作后面找到工作,而1980年没有工作的是1970年有工作的还是1970年就没有工作的呢?这些问题我们从这个表中就得不到解决。因此,趋势分析只是能够看清研究对象的发展趋势,但是它有很大的缺陷,就是无法知道具体个体的变化。这种缺陷要怎样来弥补呢?下面我们来看一下第二个表格。

80年有工作 80年无工作 80年有工作 80年无工作

70年有工作 80 10 15 35

70年无工作 5 5 45 5

从这张表中,我们就能看到男性中1980年有工作的人有80%在1970年就已经有工作了,有5%在1970年没有工作,到了1980年就已经找到了工作。另外有10%的人在1970年有工作,因为某种原因如退休,失业等,到了1980年就没有工作了。而有5%的人在1970没有工作,到了1980年还是没有工作。在女性中,1970年有工作的只有15%在1980年还有工作。而在80年有工作的女性中有45%在1970年没有工作,可见女性做临时的工作比较多。从这张表中我们就能很具体地看出具体的人群的就业情况的变化。这种研究是追踪调查中比较典型的,他包含的信息量就比趋势分析得到的信息量要多得多。这就是我们为什么花费很高的成本去做追踪调查的原因。追踪调查比趋势调查能提供更多的信息,并且根据追踪调查你可以推断趋势,因为你能掌握不同个体在不同时间的状况,把这些个体汇总后就是总体的化趋势,而趋势分析仅仅能够知道研究对象大致的变化趋向,但是不知道总体中具体的个体的变化。我马上要接着讲下一个题目,现在有什么问题大家可以问。

问题一:谢教授,我想问一下追踪调查是不是一定要以个人为单位?

谢教授:不一定,这要根据你的分析单位具体而定。如果你的分析单位是组织,是学校等,就不是以个人为单位。因此追踪调查的单位要视具体的总体的分析单位而定,并且在调查中分析单位不能变。你要根据你的分析单位来抽样,抽样好了之后就要追踪这些样本,收集他们的信息和资料。

问题二:追踪调查的时间是怎么选定的?

谢教授:这是一个很好的问题,这要根据你对这个问题的了解。在这里,经验研究很重要,理论也很重要,理论就是你对这个世界的了解,你对全部现象的了解综合而成就是你的理论。因此对时间的选择关键在于你对这个事件的了解,如果他变化很快,你定的时间就要频繁一点。比如教育,教育在70年代变化特别大,因此那个调查项目在73年、74年连续调查了几年,你上不上大学,上大学又上什么专业,毕业后有什么打算,这都是变化很快的,因此要比较频繁地进行调查。而有些东西的变化就比较慢,如人口的增长,退休后老年人生活状况变化也变化较慢,像这些现象就可以间隔较长一段时间做一次调查。所以选定追踪调查时间要看你所要调查的社会现象的变化速度,变化速度较快,前后调查间隔的时间就要较短,变化速度较慢,间隔时间就可以相对长一些。

问题三:如果选择的分析单位是一个群体和一个组织,如果在一段时间内组织内部发生了人员变动,这会不会是追踪调查退化成趋势调查?

谢教授:这个一个比较复杂的问题,这个问题的关键还是分析要看分析单位是什么,假如分析单位是机构的话,你设计的观察项目和指标就会跟观察个体有所不同。因此你在做机构和组织的追踪调查的时候,你不需要考虑到组织下面个体的变化。比如研究企业的,我们就追踪企业的发展变化,看它什么时候诞生,什么时候转型,什么时候破产等。虽然在追踪组织的时候,组织内部的人员结构,人员个人能力等都会发生变化,但是这些都不是我们要追踪的范围。

问题四:追踪研究可以推断出趋势的变化,那它是不是可以代替趋势研究?

谢教授:这个问题很有意思,很多人都认为可以,所以美国可能成为较早的不用趋势研究而直接用追踪研究的国家,因为如果你能够对每一个个体都进行追踪的话,就可以不需要趋势研究了。这就有两个问题,一个是成本的问题,追踪研究的成本很高,花费很大,它要比趋势研究贵很多。第二个是追踪研究的对象会有损失,由于很多原因比如研究对象不愿意被研究,或者是你找不到原有的研究对象等,这些原因就会导致一些追踪调查无法进行下去。所以,你假如要用从留下的人那里得到的资料做一个推广的话,就一定要做一个假设,就是没有被追踪的人可以用已经被追踪的人来代替,可以用统计的方法来推论他们的情况。因为这里需要做一个假设,所以很多统计学家对这个不满意。还有一种方法就是不断地补充,像一个渠道一样,一定要有源头活水,这样才能保证样本的新鲜性,从而使调查资料更具有科学性。

问题五:这种追踪研究能否反映总体的结构变化?

谢教授:应该是可以的,虽然有一些东西通过追踪调查还是观察不到,但是就趋势调查和追踪调查来讲,趋势调查能做的,追踪调查基本上都能做到,只要总体不发生变化,保证了这一点,就可以通过追踪研究来观察总体结构的变化,因为你不仅能够知道总体的变化趋势,你还能知道具体的个体的变化情况,因此通过对个体的全面了解,你就能够把握总体的结构。下面我们接着讲下一个题目。这个题目叫概念化(Conceptualization),概念化实际上是把理论的东西变成可以测量的东西,我会先给它下一个定义,再讲一下概念化的三个测量维度,然后再比较一下这三个维度,再给你们一个例子。先给你们一个定义,概念化是建立并澄清概念的过程,也就是用语言和例子来说明一个概念,以期得到一个准确的定义。只有对概念给了一个准确的定义以后,我们在研究和讨论问题时才会有一个相同的起点,否则公说公有理,婆说婆有理,这就很难形成一个共识。因此概念化就是要把不同的观点放到同一个平面上,给他一个定义,这个定义就是一个共同的起点,有了这个起点,其他的研究才可以进行。比如什么是教育,上学是教育,实践也是教育,但是当我们研究教育时,我们就必须对教育下一个很明确的定义,给出一个概念。这就是我们经常把教育定义为在学校中得到的知识和培训。这样就把教育限定在学校中,你在学校之外得到的知识和培训就不算教育。有了这个概念以后对教育的研究才有了一个共同的起点,一个出发点。为了让大家进一步了解概念的含义和测度,我要问你们一个问题。什么是社会地位,划分社会地位的标准是什么?

学生一:社会地位有很多种,一种是根据财富划分的社会地位,一种是根据政治职位,还一种是根据职称,比如教授等,还有可能是根据年龄和血缘关系等,这都可以用来划分社会地位。

谢教授:你讲的都是具体的标准,但不是概念性的。假如我们是讲理论上对社会地位比较重要的概念,你会想到什么?

学生二:职业及其社会影响。

学生三:个人在不同社会阶层中的地位。

学生四:社会地位的不同,关键在于划分的标准不同。

谢教授:那什么标准比较重要呢?

学生五:占有资源的标准。

谢教授:资源,还有呢?

学生六:声望。

谢教授:好,讲的很好。从我自己来看,衡量社会地位时,有三个概念很重要,你们讲的东西都可以用这三个来概括。一个是财富,一个是声望,一个是权力。有财富就有社会地位,但是有钱也不是万能的,如果他只是有钱,而没有声望和权力也不行,哈佛的教授工资不是很高,但是他们很有声望,因此声望也是一个很重要的标准。有的人他的工资不高,声望也不高,甚至有时候还有点坏,但是他很有权力,这也能给他带来很高的社会地位。但是这三者不是一样的,有的人有财富但没有声望和权力,有的人有声望但没有权力和财富,有的人有权力但没有财富和声望。当然,很多人都想同时拥有这三样东西,但这是很难做到的。

这个例子讲的就是一个理论上的概念可能会有不同的测量维度。维度就是根据不同的含义区分成不同的类型,这些类型就被称为维度。一个概念可以包含几个维度,因为有的概念无法通过一个维度来测量。在概念化中,我们就可以给社会地位三个维度:财富,声望和权力,这三者是衡量社会地位的三个维度。当维度不能被直接观察时,这个时候就要用到指标来观察。指标是很具体的,是可以直接被观察到的,是概念具体的量化标准。比如为了衡量权力,我们可以用这样一些指标。一个是管辖的人数有多少,管辖的人数越多说明你的权力越大。另外一个是管辖范围有多大,管辖的范围越大,你的权力越大,比如系主任管辖的范围就太小,而军官管辖的范围就很大。这就说明系主任的权力较小,而军官的权力很大。衡量权力的指标还包括每年的预算的制定,你每年的预算也是对你的权力的衡量,你的预算越多,你的权力越大,尤其是在计划经济时代,预算越多,要的越多,下一次预算就更多,这是计划经济体制的弊端。另外一个衡量权力的标准是你所控制的设施的多少,你掌握的设施越多,你的权力就越大。

下面我们来比较一下概念、维度和指标。这三者在某种情况下是一样的,可以相互转换,比如一个研究对象只有一个概念,一个维度,一个指标时他们三者就是一样的,而他们的区别就在于概括的层次不同。概念是高度的概括,维度是一般性的概括,而指标是很具体的。所以这三者的关系就在于具体的程度。有的概念比较简单,比如性别,概念,维度,指标都是性别,只有两种可能。一个概念可以存在多个维度,一个维度可以有多个指标。当一个概念只有一个维度,而且这个维度只有一个指标时,这就是一个变量。变量是一个统计术语,是指可以取不同的数值的量,维度和指标都可以是变量。比如权力,可以大可以小,这就是一个变量。性别可以男也可以女,这也是一个变量。在复杂的情况下,一个概念可以有几个维度,一个维度可以有不同的指标。指标是一个操作性的东西,是具体的,概念和维度是比较抽象的东西,是思想性的。下面我们讲测量(Measurement)。当我们谈到测量的时候,就必然涉及到变量和指标。因为变量和指标是很具体的,我们在做测量时必然要引入变量,而变量的测量要通过指标来表示。测量就是给分析单位赋以一个具体的数值,以表示变量的类别和差异。这个数值在不同的情况下表示不同的意义,很多人在这方面会犯错误。测量就是要抓住事物之间的差异,通过一定的指标来衡量这种差异,把研究对象区分开来。我刚才讲了数字在不同的情况下含义是不一样的,为什么呢,因为测量的时候有不同的尺度,用不同的尺度测量出来的数值表示不同的意义。

因此我们接下来要讲测度的类型。测度的类型有四种,名义测度,次序测度,间距测度和比率测度。名义测度是根据某些变量,将案例区分成两个或者多个类别。比如你把所有的人分成不同的类,好,中,坏等。名义是可以任意赋值的,这些数字是代表任何数学意义的。比如白人=1,亚裔=2,黑人=3,因此这些数字本身并不代表任何数学意义,它不能用来进行运算,这里的数字只是起到一个区分的作用。这里的分类有两个原则,一个是穷尽性,就是每个个体都必须归到其中一类,第二个是排斥性,就是一个个体不能归到两个或多个类。测度的第二种类型是次序测度,在次序测度中,赋值只是表示一个维度上的排序位置,它只能说明排序的高低,比如最典型的立克特量表。事实上次序测度并没有内在的测度标准,你仅仅知道他们之间的相对排序,不能用来做简单运算。假如你想知道不同测度之间的差距,你就要用到间距测度。间距测度假设数字间有相同的距离或间隔,间距测度的数据不仅表示排序位置,而且也表示数值。如果一个间距测度有一个绝对零值时,那么这个间距变量就是一个比率测度变量。比如重量,它有一个绝对零值,它还有单位,因此它是一个比率测度变量。下面,我们来比较一下这四种测度,名义测度只告诉你分类,次序尺度不仅告诉你分类,还告诉你各个类型之间的排序,间距测度不仅告诉你分类,告诉你次序,还告诉你大小,而比率测度则既告诉你分类,告诉你排序,告诉你大小,还告诉你绝对零值。所以这四种测度是由一般向特殊变化的,最一般的是名义测度,所有的研究都是从这里开始,因为最开始我们要根据研究对象的差异分出不同的类别,然后随着研究的深入,测度也要不断地特殊化,具体化。

下面,我们讲估计的基础知识(Basics Of Estimation)。统计的知识很多,书本上讲的不是很难,但是要问为什么就比较难。所以我想给大家重温一下估计的基础知识。我们做统计,首先要知道我们做统计是不得以的,如果我们可以直接研究总体的话,我们就不需要样本,就不需要统计,因为我们做统计是用样本来推论总体,如果我们能够直接对总体进行研究分析的话,我们就可以不需要统计。什么是总体,总体就是在一个封闭的系统中,所有元素的完全排列。样本就是总体中的一个子群,总体中的任何一个子群都可以叫样本。我给你们举一个例子,我住的那个地方1990年普查的时候有109592个人,我们抽了一个1096个人的样本进行研究。我下一次会讲到具体抽样是怎么抽的,在这里先不讲。然后是参数与估计。具体而言,我们研究总体就是要研究总体的参数,参数是总体的某个特征,比如中心趋势的测度和离散趋势的测度等。我们用sita来表示总体参数(population parameter),这个总体参数是我们永远得不到的,我们只能通过估计来得到一个尽量接近总体参数的估计值。估计是根据样本来推算真实参数的估计值,这就是样本估计值,用T表示。样本估计值也被称作样本统计量(sample statistic)。这里有两个名词我希望大家能记住,一个是总体参数,一个是样本统计量。我们想要总体参数,但是我们得不到,我们只能通过样本统计量对它进行估计。比如我们想知道以下总体的参数,如总体的均值,总体的方差,总体的相关性,总体的交互表等。我们就可以通过样本统计量来对总体参数进行估计,比如用样本的均值来估计总体的均值,用样本的方差来估计总体的方差,用样本的相关性来估计总体的相关性,用样本的交互表来估计总体的交互表。样本统计量是我们可以计算出来的,通过样本统计量来估计总体参数就叫做统计推论(statistical inference)。统计推论是用来评价样本统计量的可靠性的一种方法。对于任何总体参数都会有许多样本统计值,为了评价样本统计值的好坏,我们就要进行统计推论,而要进行统计推论,我们首先必须对总体进行抽样。最简单的抽样方法就是回置的简单随机抽样。它有几个特点,一个是简单,简单是指总体中每一个元素被抽到的概率是一样的,随机是指任意抽取样本,回置就是指抽中的元素要重新放回总体。回置还要看总体和样本的大小,假如样本相对于总体而言很小的话,回置与不回置是没有多大区别的。我在这里举一个例子,在一个封闭的区域内,科学家要怎样来估计熊猫的数量。这里使用的方法是一种我们很常用的方法,叫做“捕捉――再捕捉”的方法,这里有一个假设,就是假设捕捉是完全任意的。我们先捕捉一批熊猫,做上记号后放回去,过一段时间后我们再捕捉一批熊猫,看第二次捕捉到的熊猫中有多少是第一次捕捉到的,如果第二次被抓住的熊猫中很多是第一次被抓住的,就说明总数很小,而如果第二次被抓住的熊猫中很少是第一次被抓住的,就说明熊猫的总数很大。假如通过抽样我们得到这样一个数据。

第二次捕捉 总数

捕捉到 未捕捉到

第一次捕捉 捕捉到 10 90 100

未捕捉到 90

总数 100

第一次抓了100只,第二次又抓了100只,第二次抓的100只熊猫中有10个是第一次抓到的。我们假设这两次捕捉是独立的,是不相关的,那么两次被抓住的可能性是第一次被抓住的可能性乘上第二次被抓住的可能性,我们假设熊猫总数为N,第一次被抓住的概率是100/N,第二次被抓住的概率也是100/N,而两次都被抓住的概率则是10/N,就有100/N乘上100/N等于10/N,算出来的N就是1000。然后我们要讲估计值的抽样分布,我认为统计中很大的一个障碍就是你们不了解抽样分布。当我们做统计时,我们并没有观察总体,而仅仅是观察了一个样本,假设我们从一个总体中重复的抽样,所抽取的各个样本可能是不同的,根据许多次重复的抽样,同一估计值可以形成一个分布,这就是抽样分布。在我们实际的操作当中,我们总是把自己通过统计得到的样本统计值放在抽样分布的中间,认为即便这种分布会发生变化也只是在这个样本统计值左右变化。这种分布是假设性的,因为我们只取了一个样本,只得到了一个样本估计值,而其它的估计值是在假定的重复抽样条件下设想出来的,因此这种抽样分布是假设性的。今天我们就讲到这里,谢谢大家!

马戎主任:由于时间关系,我们就不提问了,今天的讲座就到这里。

 

发表时间:2004-12-9 12:55:00





2007-01-22

没有评论: