2007-06-27

今天国光老师上课提到的一些统计学习资料

今天是国光老师《纵贯和多层数据分析》的第二次课,这节课主要介绍了一些国外常用的统计模型:
比如Random Effects Models(随机效应模型)一般在经济学领域用的多;
Multilevel models(多层次模型)和随机效应模型其实是一回事,社会学方面用的多,名字不同而已,统计公式差不多。还有个Longitudinal models,这个就是所谓的纵贯模型,和前面两者统计公式完全一样的。
另外还大概介绍了Latent Growth curve models、Fixed Effects models(控制了不变效应的模型)、Multilevel models for binary data、Multilevel models for count data、GEE(General estimating equation)、Robust estimates等。
除了固定效应模型和GEE模型之外,其他七个模型都是随机效应模型。而Latent Growth curve models是结构方程模型中的一种。
然后国光老师用一个包括了学生ID、多个学生多次测量的IQ的数据表和另一个包括了学校ID、学生ID和多个学生各一次测量的IQ的数据表对比说明了纵贯数据也可以看成是一个特殊的多层数据,即对一个学生的多次测量可以将每一次测量看作一层、学生ID看作另一层,这样一个纵贯数据就变成了两层次的数据,但是这会存在一个问题:对同一个学生的多次测量的数据之间会存在一个渐强的相关关系,即对一个学生在86、88、90、92、94、96六年分别测量的IQ值之间,会存在渐强的相关关系,即,86年的IQ值与88年IQ值的相关系数要大于86年的IQ值与88年的IQ值之间的相关系数,因为同一个人的IQ值应该是逐渐变化的,而不是突变,所以时间越接近,相关性越强。而在一般的多层次数据中,比如考虑了学校和学生这两个层次的数据中,数据内部不会存在这样渐强的相关关系。

然后还给我们介绍了一些有用的多层数据模型的学习资料,当时是在机房采用系统广播的方式演示的,演示速度比较快,所以有些都来不及记录,不过我大概记录了几个关键词,可以把这些资料给google出来:
http://www.ats.ucla.edu/stat/examples/alda
http:// www.ats.ucla.edu/STAT/paperexamples/singer/default.htm
以上两个网址可以通过在google中搜索"Judith singer"这个关键词出来的第三项得到。
另外还有Singer的一本书:《 Using SAS PROC MIXED to fit multilevel models
http://gseweb.harvard.edu/~faculty/singer/
Applied Longitudinal Data Analysis:
http:// gseacademic.harvard.edu/alda/

Review of Joop Hox Multilevel Analysis

http:// repositories.cdlib.org/uclastat/papers/2003071401/

Amazon.com: Introducing Multilevel Modeling 

http://www.amazon.com/Introducing-Multilevel-Modeling-Statistical-Methods/dp/0761951415

Stata Textbook Examples: Multilevel Analysis: Techniques and

http://www.ats.ucla.edu/stat/stata/examples/mlm_ma_hox/

Questioning Multilevel Models - De Leeuw, Kreft (ResearchIndex)

http://citeseer.ist.psu.edu/25804.html

另外还学了个stata命令,将多次测量的同一对象的宽数据转换成长数据:
reshape long iq,i(id)
将同一对象多测量的长数据转换成宽数据用:
reshape wide iq,I(id)
--
最新奇有趣的新技术、科幻、社会学信息:
http://www.qixianglu.cn
forcode科幻小说《抽水马桶的秘密》:
http://www.cmfu.com/showbook.asp?Bl_id=60008

没有评论: