赫克曼与自选择偏差


论坛文摘主页

送交者: 云儿 于 October 24, 2000 13:25:40:

赫克曼与自选择偏差

云儿


  今年的诺贝尔经济学奖,由两位在微观数据分析领域有杰出贡献的经济
学家获得。詹姆斯.赫克曼开创了处理样本偏差和自选择问题的统计方法,
丹尼尔.麦克法登则建立了可以直接用于数据分析的离散选择理论。现代从
事微观经济学实证研究的人士,对这两个名字可谓耳熟能详。他们所开创的
领域,虽然名称很奇怪---叫作“受限制和离散依变量模型( limited and
discrete dependent variable models)”, 早已经成了当今名牌大学里面
经济计量学的必修课。其获奖,称得上是众望所归,实至名归。

  在我看来最有意思的是,这两位的工作,很突出地说明了社会科学与自
然科学在基础研究方法上的分野。颇见过一些理工科出生的人士,特别自负,
以为社会科学可以不同于理工科,无需特别训练,就可发言。我觉得这些人,
实在应当去了解一下赫克曼和麦克法登这样在基础方法上面的工作,治治自
负病。

  詹姆斯.赫克曼1944年生于芝加哥,本科专业是数学,1971年在普林斯
顿大学拿到经济学博士学位。此人特别牛,早在1974年,他就以一篇研究妇
女劳动供给的论文《影子工资、市场工资与劳动供给》,奠定了他无可争议
的学术地位。

  赫克曼那篇文章,提出了处理样本偏差(sample bias)和自选择( self-
selection)问题的一般方法。长期以来,样本偏差一直是令社会科学研究者
头痛的问题。政客和利益集团用统计调查数据蒙人,也都喜欢在样本偏差上
玩花样。记得去年,法轮功曾大力宣传一份调查材料,声称调查了上万名修
练者,练功后各种疾病有不同程度好转者,达百分之九十以上。然而在懂得
样本偏差和自选择问题的人看来,就算这份调查材料百分之百真实,从抽样
到汇总各个环节都无半点虚假,其结论仍不足采信。

  原因就在于,这份材料只调查了坚持练功的学员,未调查不练功的人,
更没有调查那些一度练功、发现无效而退出修练的人。没有这些资料作对照,
你完全无法判断,修练者是因为练功才有疾病好转的呢,还是因为疾病好转
才坚持下来的?要知道,因好转而坚持,与因坚持而好转,两种情形看似区
别细微,其实有本质的不同。前者不过是纯粹的自选择,与修练的疗效,是
毫无干系的。

  举个例子,我也可以自吹法力无边。任何人,只要每个月到我这儿登记
一下,什么功都不用练,只要他心诚,我就包他疾病好转、百毒不侵。假设
很多人信了我的话,跑来登记。以后疾病有好转的,继续登记;没有好转的,
不再登记。好转者留,不好者去。如此三年五载之后,调查一下留在我登记
名单上的人,准保90%以上的人,都是在登记了之后, 疾病有了不同程度的
好转。我再厚颜无耻一下,就可以拿此“科学调查“材料,作为我真的法力
无边的证据了。

  这是自选择导致样本偏差的一个例子---当事人自己选择是否登记的行
为,决定了留在登记簿上的是什么人。在自然科学中,实验条件一般是可控
的,可以通过恰当的实验设计,比如正交实验之类,来避免样本偏差。社会
科学则不然,基本上无法做受控实验。最好的情形,不过是尽量以好的抽样
方法设计,避免样本偏差。然而很多情形下,样本偏差都是跟人们的自选择
行为紧密相联,单靠抽样设计,根本没有办法消除。这时我们就不得不面临
如何处理样本偏差的问题。

  且看一个劳动市场的例子。我们要研究工资 w 与某个决定工资的因素 x
(比如说教育) 之间的关系。假如我们能够观察到每个人的工资w和教育程度x,
并且绘制出如下的散点图,其中工资和教育之间的关系,应当如图中的实线
所示。然而,在实际生活中,我们无法观察到每一个人的工资水平。许多人,

特别是已婚女子,当其工资低于某个域值时,会选择不工作。而且这个域值
还因人而异,有高有低。对于不工作的人,我们可以了解他们的教育程度,
却不知道他们在市场上,可以拿到多少钱一小时。他们的工资是观察不到的。
继续以上面这张图作比,你只观察得到实心的样本点,空心点是不工作的人,
你看不到他们的工资。假如你只拿实心样本点来作研究的话,得出的关系就
如虚线所示,显然这大大低估了教育对工资的影响。

  不难看出,这种样本偏差,无论你怎么设计抽样方法,都无法消除。即
使你去问当事人,也不一定能得到你所要的资料---这些人知道,自己真去找
工作,工资十之八九会低于某个域值,还不如在家操持家务划算,却不一定
知道具体能拿多少钱。

  赫克曼的最突出贡献,就是找到了一种令人满意的方法,使得我们只要
根据可以观察到的资料,就能够估计出上图中由实线代表的正确关系,避免
由虚线代表的样本偏误。 他的方法, 如今被成为赫克曼称正 ( Heckman
correction),已经成为十分标准的数据分析工具, 在许多中级的计量经济
学教科书上,都有讲授。具体解释赫克曼校正法,牵扯到许多预备知识,三
言两语难以说清。有兴趣者,不妨自己去查阅教科书,我就不多嘴了。

2000年10月12日

所有跟贴:

据说那个赫克曼的研究 - 一老中。SR (64 bytes) 20:09:51 10/12/00 (0)
WOW, 高手 - Alicia (0 bytes) 17:13:16 10/12/00 (0)
嗯?你是怎么把图表夹在文章中的? - 留香 (0 bytes) 16:54:33 10/12/00 (17)
直接寫HTML TAG就行呀 - 云儿  (132 bytes) 17:05:05 10/12/00 (16)
test - Jove (61 bytes) 20:58:34 10/12/00 (1)
test - Jove (0 bytes) 20:59:33 10/12/00 (0)
嗯 - 老王 (4 bytes) 18:51:33 10/12/00 (0)
再试 - 蛮人 (111 bytes) 17:08:31 10/12/00 (11)
看来云儿是藏金示铁呀~ - 蛮人 (0 bytes) 17:09:47 10/12/00 (10)
我是用 HTML EDITOR 中的 COPY&PASTE - 云儿  (77 bytes) 17:19:04 10/12/00 (9)
test - Jove (72 bytes) 20:56:47 10/12/00 (0)
再来 - 蛮人 (83 bytes) 18:20:11 10/12/00 (6)
哎呀,img之前不要留空格 - 云儿  (137 bytes) 18:30:42 10/12/00 (5)
test - Jove (59 bytes) 21:01:17 10/12/00 (0)
test - Jove (73 bytes) 20:55:35 10/12/00 (0)
原来如此,总算学成了~ - 蛮人 (47 bytes) 18:39:09 10/12/00 (1)
Wooops :-( forget that :-) - 蛮人 (0 bytes) 18:40:33 10/12/00 (0)
12 - finger (124 bytes) 18:33:42 10/12/00 (0)
再来 - 蛮人 (78 bytes) 18:19:31 10/12/00 (0)
没错,这么作就可以,不信请看 - 蛮人 (106 bytes) 17:07:20 10/12/00 (0)




论坛文摘主页