2009-05-16

美国民意调查简史

十八世纪,出现了调查的书籍,记录谁投票和怎么投票;

Jefferson政府期间(1801-1809),开始了常规性的党内投票者倾向清点活动(canvassing of voters),只问投票者的倾向,个人基本变量和态度等问题没有包括在内。

十九世纪,上述党内投票者倾向清点活动由自愿者群体在全国范围内展开。

1824年7月24日,Harrisburg Pennsylvanian 和Raleigh Star newspaper公布了总统竞选预测结果。报纸调查方在(Delaware)特拉华州的Wilmington市对公众进行了调查,问他们最喜爱的总统候选人。调查结果显示:军队英雄Andrew Jackson获得70%的选票,政府部长John Quincy Adams获得23%的选票,Henry Clay和William Crawford分别获得4%和2%的选票。在公布调查结果时,报纸评论说这个调查是"无偏见的结果",是19世纪最诚实的结果。虽然没有明确说明什么是偏见的结果,但是已经可以清楚看到政党内的大规模投票倾向清点工作成为靶子,而本调查的合理性也由此体现出来。实际上,这个评价对调查业的基本的理念有了最基本的诠释——第三方、无偏见、诚实。

1850年,1850年全国人口普查的负责人J.D.B. DeBow运用随机样本的概念,抽取了23个州,分析了婚姻、入学和福利的不平等问题。

1888年,"黑马"一词出现的Boston Journal上,描述不被看好的候选人迅速崛起的现象,将马的种族词汇用于对竞选的观察和候选人的观察。

1892年,民主党全国委员会花费2.5亿美元在全国各地散发宣传册、写信、并进行演讲,而共和党在1896年花费3.5亿美元宣传Richard Jensen所著的《民意》一书,其宣传攻势之强"前无古人"。

1896年,芝加哥报进行了McKinley-Bryan竞选调查,花费60000美元,采用邮寄的方法对芝加哥地区的选民和和中东部州的选民,回收了25万张,预测McKinley获胜,在芝加哥预测值与实际值只有0.04%的差异,但是芝加哥以外的地区预测都失败了。

在20世纪三十年代之前,众多的报纸介入到民意测验领域,主要包括Hearst Newspapers, New York Herald, Cincinnati Enquirer, Columbus Dispatch, Chicago Tribune, Omaha World-Herald and the Des Moines Tribune等。

1916年,Columbus Dispatch在俄亥俄开始系统的民意调查,到1920年,应用地理区位和配额抽样的方法进行抽样调查,其配额的变量包括:政党、性别、宗教、民族和经济状况等。

同年,著名的周刊杂志Literary Digest第一次进行美国总统竞选预测的民意调查。

第一次世界大战期间,心理学家在征兵工作中进行了智力和适应性测试以利于人尽其用,问题设计的技巧得到很大改善,并且通过统计分析的方法分析了人们的行为模式。

二十世纪二十年代,广告机构开始消费者态度研究。

二十世纪三十年代,媒介研究机构、政府机构和学术研究机构改进了抽样技术,正式采用配合抽样方法。

1932年,心理学家、媒介、广告与市场研究专家Henry Ling建立了第一个现代民意调查机构the Psychological Barometer(心理晴雨表),在众多的领域为心理学会提供公众态度调查,Ling的调查机构采用的资料收集方法是入户,取代邮寄,消除了无回答的困扰。

同样是1932年,Mrs. Alex Miller作为民主党的候选人竞选依阿华州长,他的继子,正在攻读博士学位的George H. Gallup正在改进公众调查的抽样技术,给予她许多帮助,结果当Mrs. Alex Miller竞选获胜的时候,George H. Gallup开始从事民意调查事业。

1935年,George H. Gallup,Archibald Crossley and Elmo Roper推出现代民意调查系统,他们不仅预测总统竞选,同时关注更多的方面,他们成功地预测了富兰克林.罗斯福在1936年的选举中获胜。Gallup poll的结果登在报纸上,而Roper(the Fortune Poll的奠基人)则在Fortune magazine发布其结果。

1936年,Gallup、Crossley、Roper都预测罗斯福将当选总统,他们的预测结果分别是:55.7%、53.8%、61.7%,实际的结果是62.5%。与此同时,Literary Digest预测兰登将获胜,使得调查声誉收到很大影响。

1936年,the Crossley Poll成立。

1940年,罗斯福总统运用调查机构收集到的民意进行公共决策。

二十世纪四十年代,媒介支持或者建立的调查机构纷纷建立,包括:Joe Belden's Texas Poll (1940), Mervin Field's California Poll (1947), the Des Moines Register Iowa Poll (1943) and the Minneapolis Tribune's Minnesota Poll (1944)。

1948年,主要调查机构都预测杜威获得压倒性的胜利,结果失败了,调查的可靠性成为制约行业发展的重要因素。

1956年,Harris survey成立。

1960年,肯尼迪总统在竞选过程中运用民意调查。

二十世纪60年代,CBS/New York Times, NBC/Associated Press. ABC/Harris, the Washington Post and the Los Angeles Times纷纷建立调查机构,time和新闻周刊介入民意调查。

1967年,cbs新闻介绍了调查的出路(Exit polls),被访者需要回答他们投票意向的同时,还要回答一些自然变量(人口统计学变量),1972年,cbs调查中加入了情绪与动机的调查。

1972年,Amitai Etzioni's MINERVA system增加了调查研究的能力,它可以召集30个人在普通家庭电话旁参加讨论会议。

1976年,卡特任用民意调查专家Patrick Cadell作为其竞选顾问,当卡特总统当选时,Patrick Cadell走向前台,成为进入白宫核心圈的第一个民意调查专家。

1980年,nbc在8:15之前预测里根获胜,而此时,在西部各州的调查还没有结束。

2009-05-15

中国家庭动态跟踪调查数据向北京大学师生免费开放

"中国家庭动态跟踪调查"(CFPS)2008年测试调查数据已经清理完成,根据《北京大学中国社会科学调查中心章程》,在北京大学建校111周年之际,向北京大学全校师生公开发布。
CFPS是北京大学中国社会科学调查中心整合北京大学社会科学各院系的学术力量设计并组织实施的一项重大社会科学实证研究项目。旨在通过跟踪搜集个体、家庭、社区三个层次的历时数据,反应中国社会、经济、人口、教育和居民生活质量的变迁,为学术研究和政府决策提供第一手的实证数据。
CFPS2008年的测试调查问卷分为村/居问卷、家庭问卷、成人问卷和少儿问卷四种。调查主题包括:经济、教育、婚姻、就业、健康、日常生活、养老、社会保障、社会交往、价值观、少儿社会化过程等。2008年的测试调查采用多阶段、概率与规模成比例(PPS)的方式在北京、上海、广东各抽取了8个区/县的32个村/居的800户家庭,每户家庭所有成员都是受访对象。数据库内容丰富、翔实,是进行社会科学研究非常宝贵的资料。
CFPS数据库将首先对北京大学全校师生进行免费开放。有意者请关注北京大学中国社会科学调查中心网站公布的数据内容列表及相关说明。
http://www.isss.edu.cn/index.php?catid=48&action=index

2009-05-14

四华裔科学家当选09年度美国国家科学院院士

〔科学网综合报道〕4月28日,美国国家科学院在第 146届国家科学院年会上宣布,2009年度新当选72名院士和18名外籍院士。其中有四位华裔科学家,他们是:美国普林斯顿大学数学系教授张圣容,美国 加利福尼亚大学伯克利分校讲座教授蒲慕明,美国斯坦福大学教授王永雄,美国密歇根大学社会学系教授谢宇。
 
其中颇受关注的蒲慕明自1981年起积极投入协助恢复和建设中国生物科学研究的工作,多 次到国内讲课,上讲习班等。1983年至1986年蒲慕明参与筹建清华大学生物和生物工程系,并任首届系主任。1988年至1991年蒲慕明参与筹建香港 科技大学,并负责生物学科发展、招聘人才等工作。1999年11月27日起任中国科学院上海生命科学研究院神经科学研究所所长,其间他积极致力于科研文化 的建设,擅长于融中西方文化为一体,为中国科研体制的改革做出了积极的贡献。
 
创建于1863年的美国国家科学院是美国科学界最高荣誉机构,由科学及工程研究方面的杰 出科学家组成。每年4月底,美国国家科学院都在华盛顿举行年会,并在会议最后一天公布本年度新当选的院士及外籍院士名单。至今年为止,美国国家科学院的院 士总数增至2150人。此前,中国科学家陈竺、张启发和李爱珍等曾当选外籍院士。
 

张圣容 Chang,Sun-YungAlice
个人主页
 

蒲慕明 Poo,Mu-ming
个人主页
蒲慕明实验室
 

王永雄 Wong, Wing H.
个人主页
 

谢宇 Yu Xie
个人主页
 
附:美国国家科学院部分华人院士名录
 
张光直(Chang,Kwang-Chih) 哈佛大学
 
张立纲(Chang,LeroyL) 香港科技大学
 
陈省身(Chern,ShiingShen) 南开大学(数学研究所)
 
钱煦(Chien,Shu) 加州大学圣迭戈分校
 
卓以和(Cho,AlfredY.) 卢森技术贝尔实验室
 
朱经武(Chu,CW) 休斯敦大学
 
朱棣文(Chu,Steven) 斯坦福大学
 
冯又嫦(Fung,Inez) 加州大学柏克莱分校
 
冯元桢(Fung,Yuan-Cheng B)加州大学圣迭戈分校
 
胡玲(Hu,Evelyn) 加州大学圣巴巴拉分校
 
叶公杼(Jan,Lily Y) 加州大学旧金山分校
 
詹裕农(Jan,YuhNung) 加州大学旧金山分校
 
贾兰坡(JiaLan-Po) 中国科学院
 
简悦威(Kan,YuetWai) 加州大学旧金山分校
 
雷干城(Louie,Gwon Sheng) 加州大学柏克莱分校
 
李雅达(Lee,PatrickA) 麻省理工学院
 
李政道(Lee,Tsung-Dao) 哥伦比亚大学
 
李远哲(Lee,YuanT.) 台湾中央研究院
 
李文雄(Li,Wen-Hsiung) 芝加哥大学
 
林伯中(Lin,Robert) 加州大学柏克莱分校
 
林家翘(Lin,Chia-Chiao) 麻省理工学院
 
麦德华(Mak,TakWah) 多伦多大学(加拿大)
 
毛河光(Mao,Ho-Kwang) 华盛顿卡内基基金会
 
沈吕九(Sham,LuJeu) 加州大学圣迭戈分校
 
沈元壤(Shen,YRon) 加州大学柏克莱分校
 
徐遐生(Shu,Frank H) 加州大学柏克莱分校
 
萧荫棠(Siu,Yum-Tong) 哈佛大学
 
谈家桢(TanJiazhen) 复旦大学
 
田炳耕(Tien,Ping King) 卢森技术贝尔实验室
 
丁肇中(Ting,Samuel C.C.) 麻省理工学院
 
钱泽南(Tjian,Robert) 加州大学柏克莱分校
 
钱永佑(Tsien,Richard W) 斯坦福大学
 
钱永健(Tsien,Roger Y.) 加州大学圣迭戈分校
 
崔琦(Tsui,DannielC.) 普林斯顿大学
 
王倬(Wang,James C.) 哈佛大学
 
王晓东(Wang,Xiaodong) 德州大学西南医学中心
 
翁启惠(Wong,Chi-Huey) (加州)斯克里普斯研究所
 
吴以仲(Wu,Carl) 国立卫生院
 
杨振宁(Yang,Chen N.) 纽约州立大学石溪分校
 
杨祥发(Yang,ShangF) 台湾中央研究院
 
姚期智(Yao,Andrew Chi-Chih) 普林斯顿大学
 
丘成桐(Yau,ST) 哈佛大学
 
周光召(ZhouGuangzhao) 中国科学院

2009-05-13

2009年5月13日统一发放ISA-RC28 2009大会旁听证


ISA-RC28 2009 人民大学年会注册须知
    国际社会学学会 (ISA)"社会分层与流动研究委员会"(RC28)2009年年会将于2009年5月14-16日在中国人民大学举行。本届年会由社会分层与流动研究委 员会、中国人民大学社会与人口学院、中国社会科学院社会学研究所、北京大学社会学系、清华大学社会学系联合举办。
    美国密歇根大学的谢宇教授和中国人民大学的李路路教授共同担任本届年会的学术委员会主席。中国人民大学社会与人口学院院长翟振武教授和美国密歇根大学谢宇教授共同负责年会的组织委员会工作。中国人民大学社会与人口学院负责具体的承办工作。


    我们热烈欢迎各位同仁能来参与本次盛会。
    如果您有意旁听本次会议,需先在本大会网站上在线注册(http://www.rc28-2009.org/register/newcn.asp)。填写您的个人信息(旁听者无需提交论文)后,点击"提交!"按钮即可。
    一旦您注册成功并通过组委会的审核,我们会尽快通过电子邮件给您发送邀请函及确认信息。但最近可能会因注册人数众多而有一定的延迟,还请您谅解我们的工作。谢谢!


    我们将于大会召开的前一天(2009年5月13日)统一发放您的大会旁听证。请注意:大会旁听证将是您入场的唯一凭证,请您妥善保管。
    届时请您持邀请函及个人有效证件(护照、身份证、学生证等),于2009年5月13日9:00-17:00,到中国人民大学逸夫会议中心大厅,领取旁听证及会议材料(会议日程手册、包含部分论文全文及全部英文摘要的大会光盘)。



如果您是学生,请注意:
您无需交纳注册费(届时需出示您的学生证);
注册成功后,您还需提交一份教授亲笔签名的推荐信(pdf格式)至sociologyrc28@gmail.com
您的交通、食宿全部自理。

如果您是老师,请注意:
您需要交纳人民币500元的注册费;
您可以享受大会期间的三顿工作午餐(5月14日-16日)和欢迎晚宴(5月15日);
除会议日程手册和大会光盘以外,您还可以领取一份会议摘要手册;
您的交通、住宿则需自理。

特别注意:
    会议期间如您需借用无线耳麦(限逸夫会议中心第一报告厅,中英文同声传译),届时将需要抵押您的个人有效证件(护照、身份证、学生证等)。
    我们的旁听座位有限,还请您尽早注册,以保证您能顺利参与本次会议。
    注册网址是:http://www.rc28-2009.org/register/newcn.asp
    请务必于5月13日(上午9点至下午5点)持邀请函及个人有效证件到中国人民大学逸夫会议中心大厅来领取旁听证及会议材料。过时不候,谢谢合作。
    如果您还有其它问题,请联系:010-8250 2544  sociologyrc28@ruc.edu.cn

我们期待您的参与!

RC28组委会
中国人民大学社会与人口学院
4/23/2009

2009-05-08

远离政治学与社会学(转)

远离政治学与社会学(转)

转自:http://qixianglu.cn/20090508102041.html

forcode:刚在校内看到一位同学的帖子《远离政治学与社会学》,社会学系的学生不好找工作也不算什么秘密了,社会对社会学的需求没有那么大,社会学对社会的贡献也没有那么大,现在有人向我咨询北大社会学考研的事情,我都劝他们慎重考虑。社会学作为一种爱好更合适,当作谋生的手段不合适。不过我还是不后悔这3年的学习,至少我的思维方式和以前不一样了,放长远一点看吧。毕业只是一个新的开始。

远离政治学与社会学  2009-05-03 13:54

   刚把论文初稿交上去了,决定远离政治学与社会学了

   远离它们,因为实在找不出能糊口与维持较好生计的理由、

   自己的生活都不好,何谈国家大事与社会问题呢

   因为你只是底层的一个"社会问题"的一员

   很郁闷的读书  读了这么多  发现社会与国家欺骗了你

   花了这么多钱,负担了这么多良好的期盼

   发现很难有个言以自信的前程

   是应该远离的时候了,除非你是"贵族",才可以玩这么高级的东西

   当你整天为柴米油盐与房租学费发愁的时候

   所谓的政治参与与社会改革是不会帮助你的

   你是一个人在战斗  背负着父母妻儿的"谩骂"

   如果说是无能也是不应该  因为你已经走得很远了

   当然你可以说 很多学政治学与社会学的 有个很好的前途

   是你自己的问题 我的回答是:也许是吧,不过我满消极的

   已经把桌面的政治学、哲学与社会学的打包了

   它们静静地躺在一个书箱里面,也许若干年后或者某时,我会打开书箱

   取出一两本,来翻阅一下,不过我敢肯定我应该不会把它们当作我谋生的工具

   就这样远离他们吧,也许有点失落,也许这么无奈

   毕竟是多年的老夫老妻了,怎么舍得呀

   看着七年的心血,就这样"打包"了

   心里不是滋味,也行是曾经的很傻很天真

   说好了,要搞学问,读什么都无所谓,也行是迷糊了,说是学校好就行了

   哎,事在人为,自己努力吧,别指望它们能给你什么

   他们都是贵族的玩偶,我们下层百姓真的玩不起呀

   远离了,就这样,上千元的书,尽管当年我还说要考政治哲学呢

   后来发现是一场梦,学不学术,真的无所谓的关键是公民

   关键是公民小个体的道义,要养家要体面的活着

   至于什么高尚的知识追求与正义的良心,就留给他们吧

   自己可以再茶余饭后,谈谈聊聊他们,会很惬意

   要把它们当作生存的技能,会活得很穷很累的

   所以,就算了吧,远离吧

   前面再出发吧。。。。。。。。。。。。


2009-05-04

中國人民大學 - 經濟科學實驗室

中國人民大學 - 經濟科學實驗室
http://ecolab.ruc.edu.cn/blog/?itemid=537

社會計算(Social Computing)
觀察人際之間的互動溝通,建立適合的群組/社群模型,透過智慧計算協作電腦呈現社會行為與社群營造,通過信息技術手段促進社會人群之間的溝通、協調與合作。
研究範圍包括:知識建立社群(knowledge-building community) 集體智慧(collective intelligence)協同過濾(collaborative filtering)等。

什麼是社會計算?目前對此還沒有一個明確和公認的定義。籠統而言,社會計算是一門現代計算技術與社會科學之間的交叉學科。不妨從兩個方面看這種學科 的交 叉:一方面,是研究計算機以及信息技術在社會中得到應用,從而影響傳統的社會行為的這個過程。這個角度多限於微觀和技術的層面,從HCI(Human Computer Interaction)等相關研究領域出發,研究用以改善人使用計算機和信息技術的手段。另一個方面,則是基於社會科學知識、理論和方法學,借助計算技 術和信息技術的力量,來幫助人類認識和研究社會科學的各種問題,提升人類社會活動的效益和水平。這個角度試圖從宏觀的層面來觀察社會,憑藉現代計算技術的 力量,解決以往社會科學研究中使用經驗方法和數學方程式等手段難於解決的問題。
對於社會計算著眼於微觀和技術的層面的這一部分來看,這種對社會計算的研究與人機交互(Human Computer Interaction)有著千絲萬縷的聯繫。計算機不單單是一種計算工具,更重要的是,尤其是在計算機網絡出現之後,計算機更成為了一種新興的通訊工 具。於是,社會計算的一項重要功能就在於研究信息技術工具,實現社會性的交互和通訊,使得人類可以更方便的利用計算機構建一個人與人之間的溝通的虛擬空 間。這樣的一類技術也就是所謂的社會軟件(Social Software),其核心問題就是改進IT工具以協助個人進行社會性溝通與協作。從這個意義而言,Email、Internet論壇、辦公自動化系統、 群件(Groupware)等許多傳統網絡工具都是一種社會軟件。而近年來蓬勃興起的Blog、Wiki等應用也更是強調借助網絡工具從而有效的利用用戶 群體的智慧。

在這樣的環境中,計算機成為了一項通訊工具,而用戶利用這一通訊工具,構建了自己的人際交互關係。這樣,利用這種社會軟件提供的便利,用戶也被連接 在一 起,形成了虛擬空間上的社會網絡。一些專門針對虛擬網絡上的社會網絡的應用也被稱為社會網絡軟件(Social Network Software,簡稱SNS)。

隨著Internet的發展,著眼於技術層面的社會計算越來越體現出了在應用方面的重要價值,也成為了一項廣受關注的重要研究內容。許多大公司開始 設立了 專門的小組著力研究該領域,Microsoft、IBM、Intel、HP、Google等諸多公司和研究機構都參與其中,開發了諸如Wallop、 Sapphire等大量的實驗項目。而隨著Web 2.0的興起,更多的新興的應用也已經被迅速的開發出來,得到了廣泛的應用。

著眼於宏觀層面的社會計算,關注的更多的是應用傳統社會科學研究的理論,結合計算技術這一工具,研究現實社會的諸多問題,從而促進人類的社會活動。 正如社 會學鼻祖奧古斯特·孔德最初定義社會學時的宏大願景:社會學希望使用一種類似於物理學這樣的自然科學的方法與理論,統一所有的人文科學學科,從而建立一門 經得起科學規則考驗的新的人文學科。而社會計算也可以說是繼承了這樣的一個理念,即建立一整套用計算科學方法為重要研究工具,以傳統人文社會科學理論為指 導,幫助解決經濟、政治等諸多領域問題的理論和方法學體系。

正如我們所知,經過數百年的發展,傳統人文科學中,諸如經濟學、社會學等領域,都形成了一整套的定量研究手段,形成了嚴謹的基於數學公式的問題求解 方法。 這些偉大而優美的數學方程式用最簡單的方式向人們揭示了各種各樣的原理,然而簡單的使用這些公式卻往往得到一些與現實截然相反的結論。而其中一個重要的原 因在於人們使用這些公式時,有很多因素被忽略了。現實世界的經濟和社會行為往往是一個複雜的系統,在這個系統中,一些簡單的公式可以簡單直觀的描述單一個 體在單一時刻的行為(單一變量的取值),然而由於系統中個體之間的複雜的相互影響的過程,系統就會表現出複雜的行為,而這種行為是難以簡單的通過這些公式 預測的。

上個世紀七十年代,隨著計算科學技術的發展,人們開始注意到經濟與社會系統中的這種複雜現象。以聖菲研究所(Santa Fe Institute)為代表的一些研究機構,開創了複雜性科學這一全新的領域。為了研究複雜性現象,他們提出了複雜自適應系統的理論,用計算機作為從事複 雜性研究的最基本工具,用計算機模擬相互關聯的繁雜網絡,觀察複雜適應系統的湧現行為。相關的研究引發了「人工社會」、「人工科學」等諸多相關的領域,形 成了一系列研究複雜性的科學方法。

進入二十一世紀之後,9-11恐怖事件進一步推動了對社會計算的這種宏觀層面的研究的需求。人們開始進一步意識到,政府應當尋求各種控制或利用信息 技術對 社會影響的政策,從而結合信息技術和社會變化情況制定相宜的政策。然而,目前我們關於信息技術對不同文化不同社會結構的影響的瞭解,不足以確保我們能夠制 定出正確的政策。因此,使用計算機模擬手段測試和驗證社會經濟政策的效果,成為了一個公共政策領域的迫切需求。另一方面,恐怖主義襲擊這種非對稱威脅也引 發了關於社會公共安全研究的新的需求。人們迫切需要開發新的信息處理方法,更有效的分析海量的情報內容,保障社會公共安全。

著眼於宏觀層面的社會計算,其發展的時間至今仍然很短暫,雖然在一些領域,已經獲得了一些理論上的研究成果,但由於社會系統的複雜性,在理論和應用 方面都 仍然存在許多難以解決的問題。我們仍然需要深入的研究如何有效地將社會科學理論知識與計算技術結合,最終達到科學規劃社會發展的目的。

仿真技术在社会科学研究中的应用-1

仿真技术在社会科学研究中的应用

唐碧海


    一、仿真技术
    (一)何谓仿真
    简单来说,所谓仿真就是用模型去模仿真实系统,也就是用物理的或抽象的系统来描述系统的某些行为特征。模型是仿真的基础,只有建立了正确的模型和数据,才能得到正确的仿真结果,仿真才有意义和价值。
    从应用的角度看,仿真技术可以定义为:以相似原理、控制理论、计算机技术、信息技术及其应用领域的专业技术为基础,以计算机和各种物理效应设备为工具,利用数学模型或部分实物对实际的或设想的系统进行动态试验的一门综合性技术。
    仿真其实并不神秘,孩提时期的各种角色游戏就是人类一种很自然的仿真活动。人们的生活中也不泛仿真的例子,如大量电子游戏本身就是人类的某种活动的仿真, 很多训练活动如消防和军事演习等也是一种仿真活动,很多测试和实验活动如风洞实验、产品性能测试等等也是一种仿真(产品使用环境仿真)。
    建立事物的模型是我们认识世界的一种途径,是我们有意或无意间在大脑内时刻在做的一件工作,而自然科学和社会科学则对这件工作进行了细化和正式化。仿真是一种特殊的模型方法,是人们认识世界、提高技能、交流思想、探索真理等过程中经常进行的一种活动。
    研究人员和技术人员使用的仿真技术则是以相似原理、信息技术、系统技术及应用领域中的相关专业技术为基础,以计算机和各种物理效应设备为工具,利用系统模型对实际的或设想的系统进行实验研究的一门综合技术。
    仿真分为实物仿真和计算机仿真,而我们这里所说的仿真技术则是指计算机仿真技术,就是对实际上的或理论上的物理系统设计一个模型,用程序实现这一模型,并在计算机上运行这一模型,然后对仿真输出的结果进行分析。
    由于计算机的广泛普及和性能的极大提高,使得人们可以在计算机上对所研究的事物建立模型、进行仿真,过去只能通过实物模型进行的仿真现在很多都能用计算机仿真来代替,而且成本更低、效率更高,现在,人们通常所说的仿真也大都是指计算机仿真。
    进行仿真之前,通常需要建立一个仿真环境。人们可以利用计算机来驱动仿真所需的综合环境和虚拟世界。通过在计算机内建立人工对象,使这些人工对象与现实的 对象有相似的特性和行为,让各种对象相互作用,在动态的环境中承担自己相应的角色,共同组成计算机内的虚拟世界,从而为人们认识现实世界及其复杂性的方方 面面提供一个极方便的试验场。
    (二)为什么要用仿真技术
    研究一个简单的系统不一定要用到仿真,如线性方程系统(可以直接求出显式解,通常称为解析模型。)然而,现实世界的绝大部分模型都不能求出显式解,这时一般可以通过仿真的办法来研究这个系统,区别于解析模型,称之为仿真模型。在以下情形中,仿真通常是必须的:
     · 模型非常复杂,有很多变量和相互作用的组成部分,这时即使系统有显式解,这个解也非常复杂,难以直接进行研究,而通过仿真可以很方便地研究系统的输入输出关系。
     · 所用变量相互之间有非线性的关系,根据自然科学家和数学家的观点,非线性系统的研究是很困难的,因为大部分这些问题都难以通过解析模型来认识,通常没有一 组可解的方程组来预测系统的行为。研究非线性系统的唯一有效的一般方法是通过建立和运行仿真模型来模拟这一系统。
    另一方面,即使我们能够理解非线性系统的工作原理,这一系统通常仍然是不可预测的,即出现通常所说的混沌现象。股市就是很好的例子,不管我们对股市的性质研究有多么深入,仍然不可能准确预测到股市崩盘的时间。
    由于仿真不必求出系统的显式解,只需给出系统的模型,就可以让计算机根据模型来一步步地模仿系统的运行,使我们可以利用统一的仿真模型技术来研究各种各样的系统,而不必求助于仅适用于求解某些特殊问题的神秘的"锦囊妙计"。
     · 模型包含随机变量,计算机可以通过随机函数来轻松地模拟这类随机系统;而数学上的处理则要相对困难得多。
     · 模型的输出需要用三维的计算机动画来显示,仿真可以利用计算机的多媒体技术使得输出结果更加逼真、直观,用户界面更加友好;而数学公式则没有这方面优势。
     
    (三)仿真技术的应用
    目前仿真技术有以下几个方面的用途:
     · 研究事物的特性,特别是有些特性不能或不便直接观察到时,仿真技术的作用就更加明显。仿真在研究过程中的主要作用是进行实验、验证理论和发现理论。
     · 预测,如果仿真模型能准确生成系统的动态行为,我们就可以利用这个模型来预见系统的未来行为。如常用的人口仿真模型和商业预测模型等。
     · 代替人的能力,如用于代替药剂师、医生等专业人员的各类专家系统、用于代替司机和飞行员的自动驾驶系统等。
     · 培训,用飞行仿真器培训飞行员,用国民经济仿真系统来培训经济学家,这样能避免因实际操作所伴随的巨额成本及失误所造成的巨大损失。
     · 娱乐,如各种电子游戏,有些电脑游戏本身就很接近一个社会仿真系统,如在Maxis公司的SIMCITY游戏中,游戏者扮演一个城市的管理者,去决定这个 城市的规划、基础设施建设、税率、打击犯罪、环境保护等等。另外培训用的飞行仿真器本身就是一个很好的电脑游戏。
     
    人们预测,下个世纪的娱乐和科学前沿将很可能被仿真和虚拟现实这样的技术所主导。

    二、社会科学中的仿真技术
    在社会科学中应用计算机仿真是一个很新的思想,尽管六十年代就出现了第一个这方面的例子,开始时,主要是系统动力学仿真和离散事件仿真,但到了九十年代, 仿真技术才开始在社科界被广泛应用,即使到目前,这一领域还有大量的问题有待人们去研究去开发,这一领域还有巨大的发展潜力和空间。
    (一)社会科学仿真的主要方法及其发展过程
    在六十年代早期,随着计算机在大学研究中开始应用,出现过一些在社会科学中使用计算机仿真的实例。这一时期主要包括离散事件仿真和系统动力学仿真。主要研 究如顾客平均等待时间、城市中警车到达紧急现场的平均时间、世界经济模型等内容,当时罗马俱乐部的世界仿真模型就预测了全球环境大灾难,在世界上产生了很 大的影响。


图1 社会科学仿真中使用的新方法的发展过程  

    后来一个叫"微观仿真"的方法发展得很快,主要受到政策研究方面的推动。这是一个很特别的方法,也是唯一一个在社会科学中一直被广泛认同的仿真形式。微观 仿真模型从微观层次对系统进行仿真,研究系统的微观个体与宏观变量(如政策变化等)之间的相互作用,大多数微观仿真模型都是用于评价社会经济政策可能产生 的效果。微观仿真在某些国家和地区已经形成了较大的市场,特别是在德国、澳大利亚和加拿大,这些国家的养老金制度、累进税制等方面的政策的制定都受到微观 仿真结果的很大影响。
    到了1990年代,人们开始注意多智能体模型(multi-agent model)的研究,这类模型使我们可以研究自治的个体及它们之间的相互作用。传统的社会科学关注合作、协调、组织行为、社会动态、联合与集团、习俗和道 德的演化等社会现象,多智能体模型已经被证明很适合于对这些现象进行建模。对社会中各种现象的研究,如社会组织的形成与优化、文化道德和制度的形成、危机 的产生等方面,已经成为多智能体模型的主要研究方向。利用多智能体模型对社会组织和社会制度的计算机仿真研究,也在吸引着越来越多的计算机科学界和社会科 学界的研究人员。
    一种叫做元胞自动机(Cellular Automata)的模型曾经成功地用于解释磁铁的磁性、流体中的湍流、晶体的生长等自然界中的神奇现象,这些奇特性质都是组成系统的微观单元之间的相互 作用在宏观层面上的整体表现。元胞自动机为研究社会相互作用提供了一个有用的框架,例如研究社会中流言的传播机制、邻里之间的依种群隔离的形成等问题。
    多层建模(Multi-level Modelling)也是一种受到物理学中的思想影响的模型方法,适合于研究类似社会这样的多层次系统。
    1980年代人们对分布人工智能(DAI)的兴趣不断增强,这是一个研究人工智能程序之间相互作用的研究领域。由于分布人工智能系统包含相互作用的自治的智能体,使得我们能够建立用于仿真人类社会的模型。
    在过去的十年,很多人一直致力于"机器学习"方面的研究,不管是仿真个体的认识过程,还是仿真整个社会适应新环境的过程,具有学习能力的仿真模型都是非常有用的。这使模型学习方法、人工神经网络、遗传算法等在社会仿真的应用不断增长。
    社会科学仿真与复杂性科学这一新兴交叉学科的发展有着紧密的联系,两者的研究内容有着很大的共同之处。如:复杂性科学中常用的演化计算、元胞自动机、多智能体等方法也是社会科学仿真的主要方法。

仿真技术在社会科学研究中的应用-2

仿真技术在社会科学研究中的应用-2

(二)国内外社会科学仿真研究和应用的现状
    在西方国家,仿真在社会科学界已经不是陌生的词汇,仿真作为一种研究工具也已经被大部分人所接受,各地的大学和研究机构纷纷开展这方面的研究和教学活动,如:
     · 加州大学洛杉机分校UCLA,1999年11月起动了开放式"计算与社会科学"合作教学计划,筹备建立"计算社会科学中心",五年内投入经费200万美元,并计划开展一系列学术活动,探讨计算机仿真技术在社科领域的运用。
     · 兰德研究生院(RAND Graduate School)也开设了一门 "复杂适应性系统与制度分析"的课程,通过计算机仿真模型来对高度复杂和不确定性系统及制度进行研究。
· 加拿大滑铁卢大学的城市与区域规划学院96年就开始对计算机仿真技术在城市规划协同设计中的应用进行研究。
     · 布鲁金斯学院的社会经济系统动力学中心通过计算机模型来深入研究权益以及个人行为对社会产生的影响。
     
    除了一些社会学家、教育心理学家等应用仿真技术来研究社会社会现象外,一些物理学家、数学家和计算机专家也被这一领域的巨大潜力所吸引,纷纷转入这一研究 领域,或者与社会科学界进行这方面的合作研究。从事理论物理教学、研究50年的美国伊利诺斯大学理论物理学家理查德·盖洛德(RICHARD GAYLORD)就是一个很典型的例子。著名的圣达菲学院(Santa Fe Institute,简称SFI)就是在诺贝尔物理学奖获得者盖尔曼和安德逊、经济学奖获得者阿罗等人的支持下,聚集一批从事物理、经济、理论生物、计算 机等学科的研究人员于1984年组建的,这一研究机构专门从事复杂性科学研究,试图由此找到一条通过学科间的融合来解决复杂性问题的道路。美国麻省理工学 院(MIT)、波士顿大学、马里兰大学近年来已经开展利用计算机仿真技术(如对策论模型)研究国际关系和国际谈判问题。
    仿真不但在理论研究和教学活动中的应用越来越广,而且在实际工作中的应用也越来越多。美国Sandia国家实验室(Sandia National Laboratories)自己开发了一个新的智能经济仿真模型阿斯彭(Aspen),能显著改进对美国经济政策的分析和对比研究。这一模型运行在美国当 时最快的大型并行INTE·计算机上,经济学家们期待这一模型能够充分细致和真实地对整个经济系统进行仿真模拟。这一模型具有广泛的应用前景:为政府、银 行、中介机构、风险投资家提供经济和金融市场预测;分析税法或政府政策变动对经济社会可能产生的冲击;为产业界或市场研究公司提供技术升级产生的冲击影响 评估。英国曼切斯特都市大学工商管理学院的政策模型中心则利用计算机仿真模型来研究不同政策对社会各方面产生的影响,从而为政府提供科学的决策依据。
    与社科仿真有关的国际学术组织如仿真协会(Simsoc)、计算经济学会等,每年都举行多次各类国际学术活动,如每年一届的国际计算机仿真与社会科学会议、计算经济国际会议等。由英国萨里大学主办国际学术期刊《人工社会与社会仿真杂志》1998年开始发行。
    在中国,社科仿真起步较晚,90年代中期,克莱因教授向中国经济学界介绍了美国的阿斯彭经济仿真系统,并给予高度评价,引起了国内不少学者的兴趣;我国著 名数量经济学家张守一教授还在《数量经济与技术经济》1999年第5期上发表了一篇专门介绍这套系统的文章;有的学者还模仿阿斯彭系统开发了一套简化的中 国经济仿真系统;前几年,国务院发展研究中心开展了微观仿真应用方面的研究。1994年,中国人民大学成立了经济科学实验室,并开展了多项相关课题研究, 与美国圣达菲学院建立了较为密切的联系。中国社科院数量经济与技术经济研究所也准备邀请阿斯彭系统的研制人员来我国进行讲学。北京社会科学院也在筹备成立 社会科学实验室。在教学培训方面,中国人民大学开发了一套电子商务教学模拟系统,这套系统采用钢铁贸易为原型,以EDI电子单证的形式,利用网络技术,逼 真地再现了不同类型企业之间进行国际贸易的全过程;广州外语外贸大学的国际贸易仿真实验室也已经成立。虽然我国社科仿真已经开始起步,但与西方国家相比, 我们无论在研究还是在应用方面都有很大的差距,仿真在社科界还是一个新鲜名词,知道社科仿真的人还很少,接受和掌握这一方法工具的社科研究人员则更少。
    社会科学仿真研究的内容非常广泛,除了前面提到的经济、社会中的各种现象和过程外,甚至开始研究人的艺术创造过程,用计算机模仿艺术家进行文学创作、音乐演奏、绘画等等,仿真所用到的智能体甚至具有类似人的情感、信念、认知等特征。
    (三)仿真技术在社会科学研究中的作用
    仿真是人们理解社会过程的一个极好的方法。利用仿真,社会科学家能够对社会建立模型,并把这个模型看作一个人工社会系统,利用这个人工社会,人们可以研究 各种各样的理论,探讨在某个理论的假设下可能会得出什么结果,在另一理论假设下又会得出什么结果等。要做到这点,首先要对用文字表达的理论进行形式化,使 得这个理论能用一个计算机程序来表示。这个"形式化"的过程包括对理论含义的精确化,并使理论自身完备化和内部相互一致。这对于一个理论发展是非常重要 的。仿真在社会科学中的作用类似于数学之于物理学,是把文字表达的理论进行形式化和精确化的极好手段。
    数学方法在物理学中的作用是众所周知的,数学方法也用于社会科学的形式化,但除了计量经济学外,没能在社会科学中得到普及,仿真方法比起数学方法更适合于社会科学,主要原因是:
     · 仿真方法使用编程语言来表示模型,与数学公式相比,编程语言的表达能力更强,没有大部分数学方法那么抽象,至少更易被非专业人员所接受。
     · 比起数学方程系统,仿真程序更容易处理并行过程和活动顺序没有完全定义的过程。
     · 仿真程序通常是模块化的,一部分的改变不影响其他部分,数学系统通常缺少模块化。
     · 易于建立由异质智能体组成的仿真系统,如有不同观点、不同知识水平、不同能力的人组成的群体等。但要建立这样的数学系统则很困难。
     
    社会科学家对仿真的兴趣越来越大的一个主要原因就是因为仿真在帮助人们进行理论的发现和理论的形式化方面有着巨大的潜能。
    仿真在社会科学研究中的另一重要作用就是使得研究人员可以很方便地进行各种"实验"。社会科学的研究对象与自然科学的研究对象相比,其中一个重要区别就是 人们很难直接对社会科学的研究对象进行重复的实验,一方面是实验的成本很大或实验失误造成的损失很大;另一方面实验的环境条件会随着时间不断演进,很难甚 至不可能回复到原来的条件下进行重复实验。
    由于仿真所建立的人工社会系统是计算机内的程序,我们可以随意调整系统的参数和初始条件,不断重复运行仿真模型,就象物理学家和化学家平时做实验一样,社 会科学家也可以对人工的社会系统做各种各样的实验。因此,人们对社会科学中应用仿真技术往往冠之以"实验"、"计算"等,如计算经济学、计算社会学、经济 科学实验室、社会科学实验室等。
    另外,社会科学中应用仿真还有助于人们沟通思想。美国的一所大学想要在学校医院附近建一个停车场,遭到附近居民的强烈反对,后来学校搞了这个设想中的停车 场的仿真系统,让市民们可以直接在计算机上身临其境地体验到这个未来停车场的优美环境,市民对停车场的态度很快就转变了过来,原来预计要花很长时间的市民 说服工作后来都可以免了。
    (四)社科仿真的逻辑框架
    对于人们常用的统计模型,其背后的逻辑框架如图2所示。通过对研究对象某方面的特性和行为进行抽象,研究人员建立系统的模型,这一模型可以是一组方程,其 中含有一些参数,利用有关统计软件包,我们可以通过这些方程对参数进行估计。在建立模型的同时,研究人员还要收集一些数据,用于参数估计。有了参数的估计 值,我们就可以利用所建模型对系统进行预测。最后还要对模型及其预测结果进行分析,一方面检查预测结果与实际观察数据的符合程度,这一般用统计假设检验方 法来做出判断;另一方面要检查参数的灵敏度:如果参数有微小变化,模型预测会产生多大偏差。



图2 统计模型的逻辑框架

图3 仿真模型的逻辑框架  

    仿真模型的背后也有着与统计模型相同的逻辑框架,如图3所示。研究人员对所研究的对象建立模型,但这个模型可能是一个计算机程序,而不是统计方程。然后运 行这一仿真模型,其行为也就被记录下来,得到所需的仿真数据,实际上,这就是我们建立仿真模型的一个主要目的。这些仿真数据与收集到的数据进行比较,进而 检查这一模型是否产生了与实际研究对象相似的输出。
    (五)社科仿真的步骤
    根据前面的社会科学仿真的逻辑,我们很容易得到社会科学仿真应该包含的步骤:
     · 首先是问题识别,就是确定我们想知道但还不知道答案的一个问题,这个问题将成为我们研究工作的目标;
     · 第二步就是要定义所研究对象的模型,这时可能需要对研究对象进行一些考察;
     · 第三步确定模型的参数和初始条件,其中的参数估计需要收集一定的数据作支撑;
     · 第四步设计模型,这时可能需要作一些假设,设计出的模型通常就是计算机仿真程序;
     · 第五步就是运行仿真模型,并记录下仿真的输出结果。
     
    到此为止的以上步骤都是很显然的,后面的步骤可能有些人不一定想去做,但它们确实非常关键。
    其中一个步骤是校核(verification),也称为调试,即保证模型被正确实施,并能够象我们所预期的方式工作,主要检查模型是否符合设计要求,算 法、内部关系和其他技术说明是否已正确实现。对于复杂的仿真,要做到这步是非常困难的,因为很难确定是否所有的错误都被排除了。
     
    另一个步骤是验证(validation),即保证模型的行为与所研究对象的行为相一致,就是这个模型是不是所研究对象的一个好的模型。这是模型有用的前提条件。
    最后一个步骤是敏感度分析(sensitivity analysis),即分析模型参数或初始条件如果发生微小变化时,模型的运行结果会有多大的改变。
    社会科学仿真是一个新领域,人们还在努力寻找更有效的方法来进行基于仿真的社科研究,但是经验正在不断的积累,教训也在不断的总结之中,以下是仿真过程应注意的几个方面:
     · 利用仿真来建立一套理论时,模型不要过于复杂,复杂的模型不利于发现系统的原理和相互联系。仿真提供给我们思考社会和经济过程的一个新方法,这个方法基于 以下思想:"复杂行为通常源自于相对简单的活动"。这一思想不仅在社会科学中而且在物理学和生物学中都得到了广泛的流行,这也形成了复杂性理论的基础。
     · 在运用仿真的过程中,需要综合运用归纳法和演绎法。在仿真研究中,首先由一组假设开始,根据这组假设用试验的方法产生一组数据(这里主要用到演绎方法),然后对这些数据进行归纳分析(主要是归纳法),灵活运用归纳法和演绎法,是成功进行仿真的一个关键。
     · 很多仿真模型都用到随机变量,因此我们不能仅从一次仿真的数据中就得出结论,必须进行多次仿真,使得结论对于随机变量的不同取值都具有稳健性。另外,对模型的各项假设如初始条件、参数等进行敏感度分析在大部分情况下都是很有必要的。

    三、前景展望
    社会科学研究的对象通常是很复杂的系统,仿真技术的研究方法由于具有定性判断与定量计算相结合、微观分析与宏观综合相结合、还原论与整体论相结合、科学推 理与哲学思辨相结合的特点,很适合对社会这样的复杂系统的研究,目前社会科学仿真的研究深度不限于对客观事物的描述,而且更深入到揭示客观事物构成的原因 及其演化的历程,并力图尽可能准确地预测其未来的发展。
    21世纪的科学,将更加突出学科之间的相互交叉、相互融合、相互促进。随着科学自身的发展,淡化学科与学科之间的严格界限是突出的发展趋势。以多学科交 叉、渗透和融合为重要特点的社会科学仿真,将在人类探索各种未知的社会科学奥秘中发挥重要的作用,并推动整个社会科学事业的发展。
    由于社会科学仿真是一门新兴的交叉学科,除了在经济系统仿真、交通网络系统仿真以及有关人口、市场等方面有了一些较成熟的仿真软件之外,很多领域还处于研 究探索阶段,离真正实用还有一段距离。在我国开展社会科学仿真研究,既要结合国际前沿研究,保持与国际同行接轨,也要体现中国自己的特色,同时还要结合一 些重要的有一定影响的实际问题开展研究,如经济系统、社会保障系统、金融系统、企业组织管理系统等方面的问题,并鼓励各个学科之间的交流与合作,这样才能 为社会科学的发展做出贡献。

Computational Social Science计算社会学-《Science》文章翻译

转自:http://www.sciencenet.cn/m/Print.aspx?id=229840
Computational Social Science计算社会学-《Science》文章翻译

Computational Social Science计算社会学

原文:http://www.sciencemag.org/cgi/content/summary/sci;323/5915/721

 

By David Lazer, Alex Pentland, Lada Adamic, Sinan Aral, Albert-László Barabási, Devon Brewer, Nicholas Christakis, Noshir Contractor, James Fowler, Myron Gutmann, Tony Jebara, Gary King, Michael Macy, Deb Roy, Marshall Van Alstyne

 

翻译:许小可(xiaokeeie@gmail.com

 

我 们生活在各种网络中。我们定期检查电子邮件,在各处拨打移动电话,刷卡乘坐交通工具,使用信用卡购买商品。在公共场所,可能有监视器来监控我们的行为,在 医院,我们的医疗记录以数字形式被保存。我们也很可能写博客给大家看,通过在线社会网络来维护友谊。以上的种种事情都留下了我们的数字脚印,这些踪迹汇聚 起来就成为一幅复杂的个人和集体行为图景,同时这些踪迹也有可能改变我们对人生、组织和社会的理解。

虽然收集和分析海量数据的能力已经改变了一些领域如生物学、物理学等,但是数据驱动的"计算社会学"研究却进展缓慢。尽管在经济学、社会学和政治学上的重要期刊都很少关注这一领域,但计算社会学在国际公司如GoogleYahoo以及政府部门美国安全局已经开始被研究。计算社会学要么是私人公司和政府部门的专有研究领域;要么虽然某些有特权的研究者使用私有数据发表论文,但这些数据却无法被其他人评价和复制。上述的场景毫无疑问都无助于公众在知识积累、验证和分发上的长期利益。

基于一个开放的学术环境,计算社会学的价值在哪里?能够增强社会对个人和集体行为的理解吗?什么是计算社会学发展的障碍呢?

到目前为止,有关人类关系方面的研究主要依赖一次性的、自己报告的数据。新的科技,像视频监控1, 电子邮件和"智能"姓名标记这些手段不仅提供了随着时间发展,在不同时刻的交互关系,而且提供了结构和内容两方面关系信息。例如,团体中的交互关系可以使 用电子邮件数据来研究,有关人们交流随时间变化的动态特性等问题也可以被考察:像工作团体是已经稳定下来很少变化,还是他们关系随着时间发生剧烈变化2?什么样的交互模式对应着多产的团体和个人3? 面对面的团体交流能够通过"社会测量法"来评定,而电子设备能够被人戴着从而时刻捕捉人们在物理上的亲密关系、位置、移动以及其他各种个体行为和集体交互 等。这些数据有助于解决很多有趣的问题,比如在一个组织内部的亲近关系和交流模式,以及具有杰出表现的个人或集体的信息流模式等4

我们也能够了解社会的"宏观"社会网络信息5,以及它怎么随着时间进行演化。电话公司拥有数年间他们客户之间通话模式的记录,电子商务门户网站像GoogleYahoo等拥有客户相互交流的即时信息数据。这些数据能够描绘社会通信模式的复杂图景吗?这些交互活动中的哪些方式会影响经济生产力或公共健康?不管怎么样,现在追踪人类活动已经变得很简单了6。移动电话提供了一种大规模长时间追踪人们移动和物理上是否亲密的方法7。这些数据或许会提供有用的流行病学方面的见识:比如一个病原体,像感冒病毒是如何通过物理上的相互接触而在人群中传播的。

互联网提供了一条完全不同的途径来理解人正在说什么以及人们是怎么连接到一起的8例如,在这个刚过去的政治季节中,只要跟踪一下论点、谣言、政治观点以及其他线索在博客空间的传播9,以及个人在互联网上的"网上冲浪"行为10,每一个选民究竟关心什么东西就很清楚了。虚拟世界能自然而然地完全记录每一个人的行为,这也为研究提供了更多的可能性-很多实验在现实中是不可能做和也不被接受的11。相似的,社会网络在线站点提供了独特的途径去理解一个人在网络中的地位对整个组织的影响,从他们的感受到他们情绪和健康12。自然语言处理已经开始不断增强组织和分析互联网以及其他来源的大量文本材料的能力13

简 短地说,计算社会学正在像杠杆一样以前所未有的方式不断增强我们收集和分析数据的宽度、深度和广度。然而,不容易克服的障碍却影响着这一进程。目前存在的 方法不能处理数以兆计的时刻变化的整个人类个体之间的交互关系和位置。例如,目前存在的社会网络理论是往往是通过几十个人的一次"快照"得到的数据建立起 来的,它怎么能告诉我们有关百万计人口的各种信息之间的相互关系,这些信息包含这些人的位置、商业交易和日常交流等数据。这些大量涌现的人与人之间相互交 互的数据能够定量地提供有关人类集体行为的新观点,但是目前我们的研究框架却无法处理这些数据。

从博客空间得到的数据。上图显示的是政治博客社团之间的链接结构(从2004年开始)。红色线代表保守派博客,蓝色线代表自由派博客;橙色线代表自由派连向保守派,紫色线表示保守派连向自由派。每个博客的大小反映了其他博客连向它的数量。【经过计算机械协会允许从文献8中重画得到】

也有一些制度上的障碍来阻止计算社会学前进。从途径上看,物理和生物学上探索的问题更适应观察和干涉。在发现的过程中,夸 克和细胞都不介意我们揭开他们的秘密,也不抗拒我们改变他们的环境。对于基础结构来讲,社会学和计算社会学之间的鸿沟要比生物学和计算生物学之间要大得 多,原因主要是计算社会学需要分布式监控,追踪允许以及编码等。这些在社会学中几乎都没有资源可以利用,甚至从物理距离和管理形式上来看,社会学系和工程 或计算学系之间的差异要比其他科学之间大得多。

可能最痛苦的挑战是如何保证数据可以获取而又很好保护个人隐私。很多数据都是有所有权的(如移动电话数据和商业交易信息等)。由AOL公司公开它的很多客户"匿名化"搜索记录所造成的大混乱突出了个人或公司通过私人公司分享私人数据的潜在风险14。 在工业界和学术界之间合作和数据共享的鲁棒模型是必需的,从而来促进研究、保护个人隐私以及为公司提供保护。更一般的讲,恰到好处的处理隐私问题是最基本 的。最近美国国家研究委员会有关地理信息系统的报告就特别指出,他们可能会经常性的去掉个人外形特征,并且会仔细地匿名化数据15。去年,美国国家健康局和The Wellcome Trust突然去掉了一些基因数据库的在线获取功能16。这些数据看起来已经匿名化了,仅仅报告了某些基因标记者的总体频率。然而研究表明,在统计上,如果利用数据库中所有个体的全部数据,还是有可能重新确认个体身份的17

因为一条个别的违背保护隐私的小事故就会导致扼杀新生的计算社会学的制度和法律条文产生,所以自我调整的与手续、技术和规则都相关的制度必须要建立起来,从而降低风险,保护潜在的研究。作为自我调整制度的基石,美国机构审查委员会(IRBs)必须增强他们的科技知识来理解入侵和伤害个人的潜在因素,因为新的可能性已经无法用他们当前有关伤害的范例来判断了。很多IRBs的人员很难来评估复杂数据被去匿名化的可能性。而且,IRBs可 能需要检查一下是否有必要建立一个专注于保护数据安全的机构。目前,已有的数据在许多组织中传播,这些机构对于数据安全的理解和处理手段是参差不齐的。研 究者必须在保留数据做研究的同时开发技术来保护个人隐私。同时,这些系统反过来可能也有助于对于工业界保护客户隐私和数据安全18

最 后,计算社会学的发展和其他新兴交叉学科也息息相关(像可持续性发展科学),这就需要发展一个方式来培养新的学者。决定教授职权的委员会和编辑部需要理解 和奖赏跨学科发表的努力。最初地,计算社会学需要拥有社会学家和计算学家一起努力。长期地看,这个问题将取决于学术界决定是否应该培养计算社会学学家,或 者计量文献社会学家和社会文献计量学家的团队。认知科学的出现为计算社会学的发展提供了一个很好的范例。认知科学涉及的领域包括生物学、哲学和计算科学。 它已经吸引了大量资源的投入来创建一个共同领域,而且为过去一代的公共货物作出了很大贡献。我们认为计算社会学具有相似的潜力、值得相似的投入。

 

References and Notes

1. D. Roy et al., "The Human Speech Project," Proceedings of the 28th Annual Conference of Cognitive Science Society, Vancouver, BC, Canada, 26 to 29 July 2009.

2. J. P. Eckmann et al. Proc. Natl. Acad. Sci. U.S.A. 101, 14333 (2004).

3. S. Aral, M. Van Alstyne, "Network Structure & Information Advantage," Proceedings of the Academy of Management Conference, Philadelphia, PA, 3 to 8 August 2007.

4. A. Pentland, Honest Signals: How They Shape Our World(MIT Press, Cambridge, MA, 2008).

5. J.-P. Onnela et al., Proc. Natl. Acad. Sci. U.S.A. 104,7332 (2007).

6. T. Jebara, Y. Song, K. Thadani, "Spectral Clustering and Embedding with Hidden Markov Models," Proceedings of the European Conference on Machine Learning, Philadelphia, PA, 3 to 6 December 2007.

7. M. C. González et al., Nature 453, 779 (2008).

8. D. Watts, Nature 445, 489 (2007).

9. L. Adamic, N. Glance, in Proceedings of the 3rd International Workshop on Link Discovery (LINKDD 2005), pp. 36–43; http://doi.acm.org/10.1145/1134271.1134277.

10. J. Teevan, ACM Trans. Inform. Syst. 26, 1 (2008).

11. W. S. Bainbridge, Science 317, 472 (2007).

12. K. Lewis et al., Social Networks 30, 330 (2008).

13. C. Cardie, J. Wilkerson, J. Inf. Technol. Polit. 5, 1 (2008).

14. M. Barbarao, T. Zeller Jr., "A face is exposed for AOL searcher No. 4417749," New York Times, 9 August 2006, p. A1.

15. National Research Council, Putting People on the Map: Protecting Confidentiality with Linked Social-Spatial Data, M. P. Gutmann, P. Stern, Eds. (National Academy Press, Washington, DC, 2007).

16. J. Felch. "DNA databases blocked from the public," Los Angeles Times, 29 August 2008, p. A31.

17. N. Homer, S. Szelinger, M. Redman, D. Duggan, W. Tembe, PLoS Genet. 4, e1000167 (2008).

18. M.V.A. has applied for a patent on an algorithm for protecting privacy of communication content.

19. Additional resources in computational social science can be found in the supporting online material.

 

Supporting Online Material

www.sciencemag.org/cgi/content/full/323/5915/721/DC1

其他信息可以见何老的帖子,写得很好

http://www.kexue.com.cn/m/user_content.aspx?id=12739

该文章翻译的PDF版本可以通过附件下载保存。我只求自己理解这篇文章,肯定N多地方翻译的不准确,多担待吧。


Computational Social Science计算社会学

失业农民工与有组织犯罪

失业农民工与有组织犯罪

转自:http://qixianglu.cn/20090430081134.html

        forcode:刚看到这条新闻:"广东河源近期至少发生4起幼童被抢事件", 让我大觉不妙!颇有些乱世之感!我不知道当前犯罪率上升的具体数据,去年有几千万农民工失去工作,这部分人已经不能被称之为农民,他们本质上是工人阶级。 虽然他们在家乡还保留有土地,但是他们的思维方式、生活方式、生活期望、自我意识、身份认同已经非常城市化了,期望他们跟离开家乡时一样朴实单纯是不可能 的了,也别指望他们会安心务农!

        据说当年国企下岗导致的团伙犯罪具有某些共通特点:原来国企中同一车间的下岗工人结成犯罪团伙,利用原来单位中的组织资源将下岗者组织起来犯罪,这种有组织犯罪纪律性特别好,因为原来国企已经帮助完成了纪律训练。

        外出打工的农民工们经历了城市工厂里的科层制的洗礼,其熟人圈可能以老乡圈和同事圈为主。这两种组织资源也可能被某些失业的农民工们利用起来犯罪。从这篇 "幼童被抢事件"的报道来看,犯罪团伙可能是失业的退伍军人。退伍军人团伙犯罪也不鲜见,同样是利用了原有的社会关系资源来进行有组织犯罪。要知道,黑社 会的组织管理模式与现代企业其实本质上是相同的,也是典型的科层制,不过更加严格罢了。

        正如当年毛主席对工人阶级的分析:工人在地域上特别集中、与最先进的生产方式相联系、特别富于组织性纪律性、和广大的农民有一种天然的联系……这些分析虽 然是80年前的,但是大部分仍然适用于今天的情况。工人阶级所代表制造业的已经不是最先进的生产方式了,但是在作为世界工厂的中国,工人阶级真正成了第一 阶级,不像80年前全国工人数量都不到一千万,今天的工人阶级中光"新工人阶级"(农民工)就有数亿人。这样数千万经过科层制严格组织纪律训练的人一旦下 岗,所能掀起的有组织犯罪能量也非同小可,所以,如果明年经济继续恶化,我们心里要有准备。

        希望政府能够加强对失业农民工的经济援助、加强对有组织犯罪的打击力度,在这种形势下,强化社会控制是非常必须的,否则乱起来大家都没有好日子过了!


美国用计算机模拟技术防止猪流感传播 病毒检测专用芯片亦已浮出水面

forcode:计算机模拟技术肯定会在社会科学领域有更广泛的应用,可惜国内这方面的研究太落后了。

根据美国弗吉尼亚理工大学网络动态与模拟科学实验室的计算机模型(Network Dynamics and Simulation Science Laboratory (NDSSL))模拟结果显示,猪流感可能已经在美国得到了有效的控制,并不会变成严重的流行性疾病。另一方面,用于检测猪流感的快速流感芯片也已经浮出水面。CombiMatrix公司宣布意法半导体公司为其生产的流感芯片能在4个小时之内侦测出猪流感病毒。


 
计算机模拟技术大显身手

NDSSL是弗吉尼亚理工大学生物信息学院的一个内部组织,他们开发了世界上最强大的流行病分析工具。目前,这套工具已经被美国健康与社会服务部(Department of Health and Human Services (HHS))采用。

"我们对包括关闭学校、工厂在内等各种疫情隔离措施做了详细的模拟研究。"NDSSL的Chris Barrett说。"研究表明针对儿童的社交隔离措施将是最有效的。这种隔离所起到的效果甚至能与预先研制高效的流感疫苗起到同等的作用。因此关闭学校是 防止流感疫情进一步扩大的重要措施。不过,如果我们只是关闭单间学校,那么其效用便会降低大半。"

本周早些时候,纽约一家学校在确认发现猪流感疫情后被迫关闭,另外两家学校获知消息后也自觉停课。不过该地区其它的学校则照常运转。

世卫组织已经将猪流感疫情的威胁等级调高到紧邻全球流行病的等级。

"目前为止已经有部分学校因为发现流感疫情而被迫关闭,不过我们的模型却不仅可以模拟出关闭一间学校的结果,还可以分析出关闭更多学校的结果。"NDSSL的副主任Stephen Eubank说。

美国健康部目前还没有准备采用进一步的社交隔离措施,这种隔离措施可以有效控制流感疫情在美国的传播速度。不过,如果美国所有学校都实施停课,而美国政府也关闭边境的话,那么别的国家将不得不采取同样的措施以防止流感疫情的全球性蔓延。

"如果病毒在其它的国家失去了控制,那么我们所能做的就只有降低其蔓延速度,"Barrett说,"不过,如果我们能有效降低病毒的蔓延速度,比如拖住6个月,那么我们也许就有足够的时间能研发出有效的流感疫苗。"

但科学家目前对猪流感病毒仍然知之甚少,不足以在短期内开发出有效的流感疫苗。我们现在只知道H1N1流感病毒中具备人、猪以及禽流感病毒的成分。这样 NDSSL便只能采用近似禽流感的模型进行模拟。猪流感H1N1的代号表示病毒通过一类血凝素(H)进入健康细胞,并在健康细胞内部复制病毒本体,复制成 功后再通过一类神经氨酸酶(N)离开该细胞以便感染下一个健康细胞。

"目前为止,我们还没有搞清楚病毒的孵化期有多长,而病患的传染性将持续多久也并不明了"Barrett说,"不过我们知道在美国发现的H1N1病毒相比在墨西哥发现的已经致人死亡的H1N1病毒而言表现更为温和。"

NDSSL宣称由于目前猪流感病毒的一些未知特性使模拟过程变得更复杂,"我们不得不尝试各种不同的变量值,因此模拟的结果包含多种不同的可能性,对各种不同的可能性,计算机模拟都给出了能最有效防止疫情扩散的措施。"

目前为止美国已经确认了100多例感染猪流感的病患,其中有一名病患已经死亡。

NDSSL的模拟工具中包含Simfrastructure模型,这个模型可以有效分析各种隔离干涉措施对疫情控制所能起到的效用,更方便决策者们按模拟情况作出决定。工具中的另一个模型Simdemics则负责模拟环境参数,它可以通过计算机网络进行分布式计算。

Barrett称,以前,只有在气象、海洋研究以及核工业领域才会使用到这类高级计算机工具。

使用实验室目前的计算机设备来模拟单一一个具备两千万个社交结点的美国大城市只需要1秒钟。工具中的Simfrastructure和Simdemics 模块分布在8个超级计算机簇上运行,在这几个簇中总共包含了1200颗处理器,内存总容量达到了200GB之多,而硬盘总容量则接近1批比特 (petabyte 10的15次方字节,相当1千块1TB硬盘的总容量)。

Simfrastructure和Simdemics模块使用并行计算机阵列来模拟美国大都市中每一位市民的移动状况,并可以与其它上千万市民个体的数据进行互动,这样就能模拟出病毒在人群中的传染状况。

美国健康与社会服务部(Department of Health and Human Services (HHS))正使用此模拟工具计算各种不同的疫情传播结果,以便决定采取何种措施降低疫情的影响。

为了防止流感疫情的进一步扩散,弗吉尼亚理工学院已经向美国健康与社会服务部以及其它政府部门提供了这款模拟工具。这套工具不但能模拟病毒传染过程,还可以对政府的防疫干涉措施对经济造成的影响进行评估。

快速流感检测芯片浮出水面


尽管疾病控制与预防中心已经发布了用于诊断猪流感病毒的软件工具,但在传统的病毒实验室中,这种工具需要经过整晚的长期运行才能给出猪流感病毒的诊断结果。要达到更快的诊断速度,则必须使用专用的流感病毒芯片进行计算。

在这次猪流感病毒爆发的事件中,各大流感检测芯片厂商也纷纷行动起来,取得了一些进展。流感病毒芯片厂商意法半导体公司近期完成了对VereFlu病毒检测工具的升级,他们宣称自己生产的新流感芯片将可以配合VereFlu应用程序以更短的时间诊断出猪流感病毒。

"我们的诊断平台可以测试流感病毒的多种片断,"公司的发言人称,"我们正在与Veredus公司协力研制用于猪流感的诊断设备,预计数周内这种设备就可以被开发出来。"

而CombiMatrix公司则宣称自己已经研制出了可以在4个小时内诊断出猪流感病毒的芯片。

"我们的设备可以在24小时之内具备新病毒样本的侦测功能。"CombiMatrix公司的CEO Amit Kumar宣称:"我们的设备可以识别出包括猪流感、季节性流感等在内的多种流行病毒样本。"

CombiMatrix的流感芯片售价300美元,传统的流感检测用芯片则售价低于100美元。不过这款芯片可以以更快的速度识别出流感病毒样本,并可以提供更多病毒样本的细节信息。

这项由五角大楼出资研究的CombiMatrix流感芯片可以用于防止流行病的传播,其客户多以研究实验室为主。

这款芯片由意法半导体为CombiMatrix生产,芯片内部采用类似内存阵列的结构组织,根据该公司的说明,这款产品可以在4小时内识别出大多数已知的流行性病毒样本。