第12章-多值选择模型资料下载.pdf
- 文档编号:16123346
- 上传时间:2022-11-20
- 格式:PDF
- 页数:23
- 大小:225.46KB
第12章-多值选择模型资料下载.pdf
《第12章-多值选择模型资料下载.pdf》由会员分享,可在线阅读,更多相关《第12章-多值选择模型资料下载.pdf(23页珍藏版)》请在冰豆网上搜索。
这是二值选择Logit模型向多值选择模型的推广。
无法同时识别所有的系数,1,kkJ。
如将k变为*kk(为常数向量),不影响模型拟合。
4通常将某方案(比如,方案1)作为“参照方案”(basecategory),令相应系数10,可得221
(1)1exp()P(|)exp()(2,)1exp()JikkiiijJikkjyjjJxxxx“1j”所对应的方案为参照方案。
此模型为“多项logit”(multinomiallogit),可用MLE估计。
5个体i的似然函数为()11(,)P(|)iJyjiJiijLyj1x其对数似然函数为11ln(,)()lnP(|)JiJiiijLyjyj1x如果假设1,iiJ服从J维正态分布,则可得“多项probit”(multinomialprobit)模型,但涉及高维积分,不易计算。
612.2条件条件Logit模型模型有些解释变量既随个体而变,也随方案而变。
比如,在选择交通工具时,乘车时间既因个体而异(不同个体的行车路线可能不同),也因交通工具而异(坐公交的时间与乘出租车的时间不同)。
这种解释变量称为“随方案而变”(alternative-specific),既包括同时随方案与个体而变的变量,也包括随方案而变但不随个体而变的变量(比如,选择加入某协会时,所有人交的会费都一样)。
7个体i选择方案j的效用:
(1,;
1,)ijijijUinjJx解释变量ijx既随个体i而变,也随方案j而变。
系数表明,ijx对效用ijU的作用不依赖于方案j,比如乘车时间依个体与方案而变,但乘车时间太长所带来的负效用是一致的。
8个体i选择方案j的概率:
1exp()P(|)exp()ijiijJikkyjxxx此模型称为“条件logit”(conditionallogit),也称为“McFadden选择模型”(McFaddenschoicemodel)。
条件Logit模型的估计方法与多项Logit模型类似。
不同的是,在条件Logit模型中,由于系数不依赖于方案,故不需要选择参照方案,也不需要将的某部分标准化为0。
912.3混合混合Logit模型模型上面分别考虑了解释变量不随方案而变的多项Logit模型,以及解释变量随方案而变的条件Logit模型。
考虑这两种情况同时发生的混合情形。
假设个体i选择方案j的效用:
1,)ijijijijUinjJxz解释变量ijx既随个体i而变,也随方案j而变;
解释变量iz只10随个体i而变。
个体i选择方案j的概率:
1exp()P(|,)exp()ijijiijiJikikkyjxzxzxz在文献中称为“混合Logit”(mixedlogit),Stata仍称为条件Logit。
为识别该模型,也需选择一个参照方案(比如方案1),令10。
在多值选择模型中,被解释变量必然为“多项分布”(multinomialdistribution),故一般不必使用稳健标准误,使用普通标准误即可;
这一点类似于二值选择模型。
11如果数据为聚类样本,则应使用聚类稳健的标准误。
在多项Logit与混合Logit模型中,对参数估计值j的解释以参照方案为转移。
以多项Logit为例,假设“方案1”或“方案j”(1j)必然发生(二者必居其一),则在此条件下,“方案j”发生的条件概率为P()P(|1or)P
(1)Pexp()1e()xp()ijijyjyjyjyyjxx上式与二值Logit具有完全相同的形式。
12“几率比”(oddsratio)或“相对风险”(relativerisk)为P()P
(1)exp()ijyjyx对数几率比(log-oddsratio)为P()lnP
(1)ijyjyx该条件概率不依赖于任何其他方案。
如果将多值选择模型中的任何两个方案单独挑出来,都是二值logit模型。
13此假定称为“无关方案的独立性”(IndependenceofIrrelevantAlternatives,简记IIA)。
类似地,条件logit模型也服从IIA假定。
在实践中,如果不同方案之间很类似,则IIA假设不一定满足。
这是多项Logit、条件logit与混合Logit模型的共同缺点。
比如,假设共有三个备选的交通方式,即自驾车、乘红色公共汽车(redbus)、乘蓝色公共汽车(bluebus)。
根据“无关选择的独立性”假定,在给定选择“自驾车”或“乘红色公共汽车”条件下,选择“自驾车”的条件概率与是否存在14“乘蓝色公共汽车”的选择无关。
由于“蓝色公共汽车”与“红色公共汽车”仅颜色不同,故加上“蓝色公共汽车”的选择之后,对“自驾车”概率没有影响,但将使“红色公共汽车”概率降低一半。
因此,引入“蓝色公共汽车”后,上述条件概率将增大,与“无关选择的独立性”假定相矛盾。
称为“红车蓝车问题”(redbus-bluebusproblem)。
15对于IIA假定,检验方法之一为豪斯曼检验。
如果IIA假定成立,则去掉某个方案不影响对其他方案参数的一致估计,只是降低效率。
故在IIA成立情况下,去掉某个方案后子样本的系数估计值(记为R)与全样本的系数估计值(记为F)没有系统差别。
HausmanandMcFadden(1984)提出统计量:
12()Var()Var()()()dRFRFRFm16其中,m等于R的维度。
检验IIA假定的方法之二为SmallandHsiao(1985)所提出。
ChengandLong(2007)通过蒙特卡罗方法发现,这两个检验的小样本性质都不好,结论只有参考价值)。
12.4嵌套嵌套Logit多项Logit、条件Logit与混合Logit都须满足IIA假定。
在实践中,如果方案比较类似,则IIA假设可能不满足。
17解决方法之一是,把相似的方案归入一组,允许同组内的方案相关,但不同组的方案相互独立。
比如,在交通工具的选择上,可把“公交车、地铁”归入“公共交通组”,而把“自驾车、出租车”归入“私人交通组”,形成嵌套式(nested)的树形结构。
图12.1嵌套Logit的树形结构交通工具公共交通私人交通公交地铁自驾车出租车18图12.1中的“交通工具”可视为此树形结构的“根部”(root),第一层(level1)的“公共交通、私人交通”为“树干”(limb),而第二层(level2)的“公交、地铁、自驾车、出租车”为“树枝”(branch)。
可将此树形结构视为“决策树”(decisiontree),但关键在于它的统计性质,即在第二层的每组内部允许扰动项相关,比如,(,)ibusisubway相关,,(,)icaritaxi相关;
但这两组之间不相关,即,(,)ibusisubway与,(,)icaritaxi不相关。
如果所有方案的扰动项都互不相关,则回到多项logit或条件logit的情形。
19更一般地,假设在第一层共有J个树干备选,而树干j包含jK个树枝(不同树干包含的树枝数可以不同),分别以1,jjjK来指代。
个体i选择树干j树枝k方案的效用为(略去个体i下标)(1,;
1,)jkjkjjjkUjJkKxz其中,解释变量jz只随树干而不随树枝方案而变(故其系数j可随j而变),而jkx同时随树干与树枝方案而变(故其系数没有下标,不随j,k而变)。
20McFadden(1978)假定扰动项jk服从“广义极值分布”(GeneralizedExtremeValuedistribution,简记GEV),其cdf为11111()exp(,;
)JKKJJFGeeee其中,函数()G的形式为11/111111()(,;
)jjjJJKKJJKjkjkGGwwwwww上式右边的1/1jjjKjkkw,在形式上为不变替代弹性函数21(ConstantElasticityofSubstitution,CES)。
参数1Corr(,)jjkjl,与(,)jkjl的相关系数呈反向变动的关系,称为“不相似参数”(dissimilarityparameter),在Stata中记为tau。
01j。
如果1(1,)jjJ,则所有方案的扰动项均不相关,满足IIA假定,回到多项logit、条件logit或混合logit的情形。
22选择树干j树枝k方案的概率为:
|11exp()exp()exp()exp(/)jjkjkjJKmjjjjkjjmmmjljjlIppIpzxzx其中,jp为选择树干j的概率,|kjp为在选择树干j的情况下,选择树枝k的条件概率;
而jI的定义为1lnexp(/)jjljjKjlIx其中,jI称为“包含价值”(inclusivevalue)或“对数和”(log-sum)。
23根据此式写出整个样本的对数似然函数,称为“全信息最大似然估计”(FullInformationMaximumLikelihood,简记FIML)。
另一方法为分步对jp与|kjp进行MLE估计,称为“有限信息最大似然估计”(LimitedInformationMaximumLikelihood,简记LIML),但不如FIML有效率。
进行FIML估计后,可对联合假设“01:
1JH”进行似然比检验。
如果接受原假设,则IIA假定成立,不需要使用嵌套logit,可直接使用多项logit、条件logit或混合logit模型。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 12 选择 模型