Chapter9-受限因变量模型.docx
第1章受限因变量模型这一章讨论响应变量仅仅被部分观测到的情况。引入被部分观测到的潜在随机变量y,y*的实际观测变量为yi引入二元指示变量D,如果ai<<bi,Di=1;否则,Di=0。即Di表示变量是否可以被观测得到。(闻bi)称为观测区间。如果对于Di=I和Di=O都有实际观测数据,当Di=I时,潜在变量与实际观测变量相等,当Di=O时,实际观测变量同样有取值,但不等于潜在变量,这时称数据被归并(censored),即小于ai的数据被归并为ai,而大于b的数据被归并为b。用数学符号表示为:q.,如果y;»=/,如果4";的%如果(1)如果只有当Di=I时实际观测变量yi才有观测数据,即:当Di=I时,潜在变量与实际观测变量相等,而当Di=O时,yi没有观测值,这时称数据被截断(truncated),即小于ai的数据和大于ai的数据被截断了。因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并为一点,而截断数据没有观测值。将潜在随机变量y*的基本模型设定为:>';=4+叫(2)其中,为位置参数,o为刻度参数;匕为独立于M的连续随机扰动项,均值为0,方差为1,其分布函数、密度函数分别为F、f0在这些假定条件下,»的均值为/,方差为2,分布函数为0,概率密度函数为。(证明请参见附录1)。科<好<6,等价于,那么/被观测到的概率为:(3)PKq,;)=Pr(A=D=F(J1.)-F()下面对截断数据模型和归并数据模型分别进行介绍1.1 截断数据模型如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。比如,研究高收入阶层(月收入X100OO)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。假设所有居民的收入服从正态分布,那么高收入阶层的收入只是在X100oO的区间里观测得到的。下面介绍截断数据的分布特征和模型估计。1.1.1 截断数据的分布特征如前面所述,截断数据只包括Di=1情况下的数据。截断分布是指变量高于(低于)某个设定值的未截断部分的分布。如果变量只有在高于某一门限值a时才被观测到(X>3),称之为从下面截断(truncationfrombelow)或者是从左边截断(truncationfromIeft);如果变量只有在低于某一门限值b时才被观测到(X<6),称之为从上面截断(truncationfromabove)或者是从右边截断(truncationfromright)0如图所示。图一截断分布图(上面截断(左图下面截断(右图)下面分析截断数据的分布函数、密度函数、均值和方差。1 .截断变量的分布函数和密度函数给定模型(1)及相应的观测概率(2),那么第/个观测变量力的条件分布函数为(证明请参见附录2):尸V(H) =产(H-M)一户(q)尸-尸(G,如果 , y"4如果y;>bi(注:此处及后面的4的定义均与前面相同)密度函数为:O,f) =J(yf)b)F()-F()0,从截断数据的密度函数(4)式我们可以推出从下面截断或从上面截断的各种不同分布的变量的密度函数。读者可以参阅下面介绍的几个例子。例1截断均匀分布的密度函数和分布函数如果"在区间a,6上服从均匀分布(uniformdistribution),那么f()=,F(X)=T-a<x<h)b-ab-a(6)如果在Y=C处截断,即实际观测值4,如果VC;X=C1如果Y<G这是左截断的例子,即右截断点二仇根据(5)式,在X=C处截断的随机变量X的截断分布的密度函数为:f)=/,)="力=lS-)=1P(Di=I)FS)F(C)-(c-a)(b-a)b-c(7)分布函数为:F(X)Ja)T(C)=(-)s-)-(-。)=二Pr(2=l)-(c-a)(b-a)b-c(8)例2截断正态分布的密度函数模型设定为:M=匕,Yi=W,如果<)';<,(9)yf=ai,如果)'飞W=bi,如果其中%M0,1)。即/*M%o2),其中o分布表示/的均值和标准差。以6分别表示标准正态分布密度函数和分布函数。那么:PRajmK皿工3=(4i(s)=()-()(IQ)d,=dq=4其中,o根据截断正态分布的密度函数公式:1/(y,-A)/<T)£。)=行f(4)_F(cJo,如果4y*bi其他可直接得到4W)';&时方的密度函数:4口)“尸霸毋T)_o=1日均J1-()ifaj-ifbi+(II)根据截断正态分布的分布函数公式:O,FyGJ=F(X-M)b)-F(c)尸-尸(q)如果y;<q.如果Wbj如果y;>bi可直接得到4Y)';,时的分布函数:(3,-)-)Fyy,=()-()()'t勺-C)0(Jr.)-()(<)ifai-a:(v,)-()1-()图二截断正态分布变量的累积分布函数图(设潜变量yM0,1),图中虚线表示标准正态分布函数,实线表示截断正态分布函数,截断点为LD2 .截断变量的均值和方差截断随机变量的均值和方差称之为截断均值(truncatedmean)和截断方差(truncatedvariance),由下面的(5)(6)式可以推出各种不同截断分布的均值和方差。给定模型(9),(13)i=Evici<vi<di='Vdv其中,JqPW-F(C1)”的方差为:(14)Vayil=>J=2Varvici<vi<diVarvici<vi<d,=v2dv-/其中,,,人F-F(q)“(证明请参见附录3I例3:均匀分布的截断均值和截断方差给定模型(6),截断变量X的均值和方差分别为:aa11E(x)=xfxIx>c)dx=x-dx=-(b+c)JCJCb-c2Var(x)=*x-E(xx>c)2f(xx>c)dxal,1=Jx-b+cf-dxJ<2b-c=-b2-c2-(c-a)(b+c)22(15)例4:正态分布的截断均值和截断方差给定模型(9),那么%的均值和方差分别为:ElR=M+仍(16)t=Evlcl<vi<dt=-竺蛆2_其中,(dJ-(q)力的方差为:VatiyiI=IJ=2Varvici<vi<di(17)其中丁畿瑞一«瑞其中,、中分别表示正态分布的密度函数和分布函数。(1)如果Q-F,即数据只是在右边截断,这时¢(G)=0、(G)=0,因此:色=EvJv,<dJ=-给=4(4)W<0(17a)(17b)Varvivi<<J=1+di(di)-(di)(2)如果di+,即数据只是在左边截断,这时¢(嗡=0、()=1,因此:(18a)(18b)i=Evlvl>cl=-=(cl)-(q)>0VarviIvi>=1+()-2()2MdA皿2()=->-(17a)式中(4)称之为InverseMillsRatio,将(18a)式中JC)称之为风险函数(HazardFunction结论lE(yy<3<E(y)<E3y>)°即,如果变量为从上面截断,则截断变量的均值小于初始变量的均值;如果变量为从下面截断,则截断变量的均值大于初始变量的均值。结论2截断变量的方差低于初始变量的方差。图三截断分布的均值(左图)方差(右图)(假定潜在变量M2,2)1.1.2截断回归模型估计下面以左截断模型为例说明截断回归模型的估计。设回归模型为:X=X"w(19)其中,%M0,l)o那么,YMxe根据例4,我们可以得到截断随机变量力的均值和方差。反XIM>。=反凹I匕>«=×1+OF:;)=x,+(ai)-(4)(20)-x其中,cti,ai)=(ai)l-(aiy%HyIK>。=1+,N(,)-4(%尸=1-(ai)(21)其中,;)=(ai)(ai)-ai由(20)式可以看出,截断均值为和X/的非线性函数。同一般的非线性模型一样,变量Xk对y的边际影响不等于其系数:EyIV>d(a)da×da×=+(a)2-()-;=(l-()J(22)因为O<6(3<1,所以变量反对y的边际影响要小于其系数。%的方差也存在类似的缩减(attenuation):(23)Variyiyi>a)=2l-b(,)J<l注:对于yi<6的情况,可以得到相同的结论。下面分析截断模型中参数的最小二乘估计和极大似然估计。1. OLS估计根据也Iy>0=+成(%),截断模型可以写为:yi=Eyiyi>a+vi=xl+i+ul(24)其中,Ui=。%为减去其条件期望,E(0=O.如果以最小二乘法估计(19)式,就忽略了非线性项储,因此OLS估计量是有偏的。另外,M%>a的方差与口的方差相同,由vsyIy>)=/-/即可知,/存在异方差,为:Vr=Vaiui2Vavivj>ai=<2(l-¥+iaj)=2(l-(a1)(25)它是M的函数。2. ML估计对于模型(19),由截断随机变量的概率密度函数可得的密度函数为,fyW-(ai),(26)可以得到的对数似然函数:=-lg(2)+og2-(-x,)2-logl-(-)_.222(27)对于AZ个观测值,JW),其联合对数似然函数为:1.OgLi=-log(2)+IOgb2J-(y1-xi)2Iogll-(-'fi)22M(28)通过最优化方法可以解得上式的参数和G的值。1.2归并数据模型计量经济学当中经常能碰到数据的归并问题,简单地说,归并数据即是被解释变量在某个区间的观测值都转化为同一个值。比如,研究电影院的座位需求情况,电影院总的座位是20000个。如果实际的需求量少于20000,那么观测到的需求量就等于实际需求量,但如果实际需求量大于(等于)20000,那么实际可观测到的需求数量只能为20000这时我们说需求量数据被归并,即所有大于20000的数据都被归并为20000o格林(Greene,2000)列举了经验文献中归并数据的应用。其中包括:1 ,家庭耐用品消费支出TobinQ958)2 ,婚外情次数FairQ977,1978)3 ,劳动力市场中妇女工作的小时数Quest