学海无涯,回头是岸

离散选择模型(Discrete Choice Model, DCM)简介——之一

18 12月
作者:Ayan|分类:计量模型

前言:打算写一个关于离散选择模型(Discrete Choice Model, DCM)的系列文章,包括DCM的主要理论模型和常用软件。常见的DCM模型很多,包括二项Logit(Binary Logit)、多项Logit(Multi-nominal Logit)、层式Logit(Nested Logit)、有序Logit/Probit(Ordered Logit/Probit)、混合Logit(Mixed Logit),等等。可用于拟合DCM的软件也很多,包括SAS、NLOGIT、Stata、Python、R、Matlab等等——我会以SAS/Python 为主介绍相应DCM的模型拟合方法,同时也会尝试给出相应模型的R、Matlab代码。总之,对我自己而言,希望通过这个过程把DCM相关的理论知识和软件应用方法做一个系统性的整理。

本文为系列文章的第一篇。




1. 简介

离散选择模型(Discrete Choice Model, DCM)在经济学领域和社会学领域都有广泛的应用。例如,消费者在购买汽车的时候通常会比较几个不同的品牌,如福特、本田、大众,等等。如果将消费者选择福特汽车记为Y=1,选择本田汽车记为Y=2,选择大众汽车记为Y=3;那么在研究消费者选择何种汽车品牌的时候,由于因变量不是一个连续的变量(Y=1, 2, 3),传统的线性回归模型就有一定的局限(见DCM系列文章第2篇)。再比如,在交通安全研究领域,通常将交通事故的严重程度划分为3大类:(1)仅财产损失(Property Damage Only, PDO),(2)受伤(Injury),(3)死亡(Fatality);在研究各类因素(如道路坡度、弯道曲率等、车龄、光照、天气条件等)对事故严重程度的影响的时候,由于因变量(事故严重程度)是一个离散变量(仅3个选项),使用离散选择模型可以提供一个有效的建模途径。

其它的一些常见的离散选择行为的案例还包括:

  • 化妆品牌的选择:化妆品牌1、化妆品牌2、化妆品牌3...

  • 就餐地点的选择:餐厅甲、餐厅乙、餐厅丙...

  • 旅游风格的选择:自由游、跟团游、自助游...

  • 居住地点的选择:小区A、小区B、小区C...

  • 出行方式的选择:公交、地铁、打车、合乘、自驾、自行车...

  • 垃圾邮件检测:是、否


图1. DCM的应用场景举例:商品的选择



可以说,日常生活中充满了各种各样的选择行为。Daniel McFadden 因其在离散选择模型研究方面的贡献而被授予2000年的诺贝尔经济学奖[1]。


图2. Daniel L. McFadden



2. 选择行为要素

本文主要介绍离散选择模型的基本概念。一次选择行为通常会包含以下几种要素:

(1)决策者(Decision Maker),即做出选择行为的主体;

(2)备选方案集(Alternatives),通常会有多个方案供决策者选择(如人们在考虑去哪里吃饭时,可能会考虑餐厅甲、餐厅乙、餐厅丙3个选项);

(3)各个方案的属性(Attributes of Alternatives)。继续上面的例子:在选择餐厅时,我们可能会考虑到餐厅的服务质量、价格高低、距离远近、环境是否优雅等多重因素。这里,每一种因素称之为一个属性(Attributes);

(4)决策准则(Decision Rules)。不同的决策者在做出方案选择时的行为准则不尽然相同。仍然以上面“选择餐厅”的例子予以说明:有人在选择餐厅时可能会比较的“随意”——随便挑一家即可;而有的人可能会综合利用各种信息资源(如“大众点评”App)做出一个对自己最为有利的选择。不一样的决策准则会导致不同的选择结果。


图3. 离散选择模型的要素



以上4种要素构成了一个基本的选择过程(Choice Process)。下面对这4种选择要素做进一步的讨论。


2.1 决策者(Decision Maker)

选择行为的主体(决策者)可以是个体、家庭、企业、政府机构等等。本文主要以“个体”为例介绍离散选择模型的相关理论;相应的方法同样适用于家庭、企业、政府机构等其它决策主体。

需要说明的是,决策者自身的属性也会对选择的结果产生影响。换句话说,即使面对相同的备选方案集,不同的决策者也会做出不一样的选择。以上班时选择何种交通出行方式为例:收入较低的个体可能倾向于选择公交、地铁等出行费用较低的交通工具;而收入较高的群体选择小汽车的可能性更高。在这里,出行者的收入水平(经济属性)影响着出行方式的选择。另外一个例子:在选择饮料品牌的时候,男生选择碳酸饮料的可能性更大一些;相比较之下,女生可能更倾向于选择过果汁类的饮料。这也是为什么在调查、研究用户/消费者的选择行为时需要收集受访者的个人社会经济状况的资料的原因。

常见的个体经济属性包括受访者的年龄、性别、收入、工作类型等等。很多销售公司利用他们所收集到的客户的资料,结合自身产品的特性,就可以制定出更加个性化的销售策略。


2.2 备选方案(Alternatives)

所谓的备选方案就是供决策者选择的一个选择集。以交通出行方式的选择为例,可供人们选择出行方式一般有:常规公交、快速公交(BRT)、地铁、小汽车、出租车、合乘、自行车、电动自行车、以及步行等等。但是在实际情况中,针对不同的个体,其实际所面临的选择域可能并不一致:比如,对于一些行动不便的残疾人士而言,在出行的时候,自行车、步行这两种出行方式并不在其考虑范围之内。又如,对于没有小汽车的家庭而言,小汽车这种出行方式也不在其考虑范围之内。另外,在分析实际问题的时候,有时候仅需考虑一部分出行方式。考虑以下情形:某市计划兴建一条地铁线路;相关政府部门需要分析新建的地铁线路对常规公交、快速公交(BRT,一种大容量的快速公交系统)和小汽车出行方式的影响。在本案例中,研究者所感兴趣的出行方式包括:(1)在地铁建设之前,需考虑常规公交、快速公交、小汽车3种出行方式;(2)在地铁建设之后,需考虑常规公交、快速公交、地铁、小汽车4种出行方式。因此,这里实际上涉及到3个不同的选择集的概念:

  • 通用方案集(Universal Choice Set)

  • 可行方案集(Feasible Choice Set)

  • 实际考虑的方案集(Consideration Choice Set)


图4. 常见的交通出行方式



2.3 方案属性(Attributes of Alternatives)

选择结果的除了受到决策者的个人属性的影响以外,每一个选择项(即“方案”)的自身属性也会影响到选择的结果。这一点很容易理解。在出行方式选择的案例中,选择的结果除了受到出行者的个人属性(收入、工作类型等)的因素影响以外,人们在选择的时候还会考虑每一种出行方式的不同方面的属性特征,包括每一种出行方式的费用(Cost)、时间(Travel Time)、舒适性(Comfort)、安全性(Safety)、可靠性(Reliability)等等。

可以说,正是各种方案在不同属性上的差异,才给决策者提供了一个选择的空间——若所有方案的所有属性都是一致的,也就没有必要进行选择了。

不同的方案属性描述了各个方案在不同的维度上可以提供给人们的效用(Utility)。“效用”是经济学中最常用的概念之一。

百度百科中对“效用”的解释是:“它(效用)描述了消费者通过消费或者享受闲暇等使自己的需求、欲望等得到的满足的一个度量”[2]。通俗一些讲,我们可以将“效用”理解为“人们在某个维度上所获得的满意程度”。出行费用越低,效用越高(满意度越高);出行的舒适性越高,效用也越高(满意度越高)。在上面的例子中,仅考虑地铁和常规公交这两种出行方式:出行者在选择地铁时可以在时间舒适性安全性 可靠性 这几个维度上获得更高的效用(一般来说,地铁要比常规公交更快捷、更舒适、更加的安全可靠);但是,常规的公交可能在价格 上更便宜一些,因此,我们可以说“常规公交在经济性这一维度上的效用比地铁更高”。从这里也可以看出,人们在进行选择的时候考虑的是各个方案在所有的属性维度上的总和——“效用最大化”也是最为常见的决策准则

在离散选择模型中,如果令等号的左边表示“决策者 [公式] 选择某个方案 [公式] 的概率 [公式] ”,等号的右边为“决策者的个人属性”和“方案属性”的函数。基于此,离散选择模型可以抽象的表示为下面的函数:

[公式](个体[公式]选择方案[公式]) = [公式](决策者[公式]的个人属性,方案[公式]的属性)


方案属性会受到不同的政策措施的影响。例如,为缓解交通拥挤、鼓励公交出行,政府出台了“增加燃油税”的措施。该措施意味着:对于小汽车这一出行方案而言,其出行成本增加。因此,借助于离散选择模型,研究者就可以分析“增加燃油税”这一政策措施对人们的出行方式的影响。


2.4 决策准则(Decision Rules)

不同的决策者其决策方式可能不同——有人比较随性(或者说“随机”),有人比较理性。从研究/建模的角度来说,随机型决策方式的问题在于,每次决策的结果可能不一致——这样无法解释哪些因素会影响选择的结果,也不能预测下一次面对同样的情形时决策者会做出什么样的选择。常见的理性的决策方式(Rational Choice Behavior)有:


(1)优势准则(Dominance Rule)

对于方案 [公式] 和方案 [公式] 两个选项,若方案 [公式] 的每一个属性都优于方案 [公式] 中的相应的属性,则选取方案 [公式] 。数学描述为:

若 [公式]都有 [公式] ,则选取方案 [公式]

其中,[公式][公式]分别表示方案[公式]和方案[公式]的第[公式]个属性值。继续上面的选择出行方式的例子:令方案[公式]={地铁},方案[公式]={常规公交}。每一种出行方式所考虑的属性[公式]={费用,时间,舒适性,安全性,可靠性}。按照“优势准则”,若{地铁}的每一项考虑指标都优于{常规公交},那我们就选择{地铁}。很显然,这种决策准则的缺陷在于:多数情况下,方案[公式]部分属性会优于方案[公式](比如地铁一般在时间、舒适性、安全性、可靠性上会优于常规公交),而方案[公式]的一些属性则会胜过方案[公式](如常规公交的票价一般比地铁要便宜)。因此单纯依靠“优势准则”有时会无法做出决策。


(2)下限准则(Satisfactory Rule)

所谓的“下限准则”是指在比较多个选择方案时,为每一个属性值设立一个下限。比如外出旅游选择酒店的时候,在“星级标准”这一属性上,可以将最低要求设置为“三星级以上”。利用“下限准则”进行决策时可能最终会产生多个选择结果。


(3)多重排序准则(Lexicographic Rule)

在确定最佳方案时,我们可以先把每一个待选方案按照最重要的属性从高到低进行排列。比如在选择酒店的时候,可以将待选酒店首先按照星级标准从高到低进行排列,然后挑选出所有的满足“三星级以上”这一标准的酒店。若第一轮结束以后,选择出来的方案不止一个,则再次对筛选出来的结果按照第二重要的属性从高到低进行排列(如价格属性)。以此类推,直到确定出最佳的方案为止。


(4)效用最大化准则(Utility Maximization Rule)

效用最大化,即满意程度最大化。对于某种出行方式而言,费用越低、出行时间越短、安全性越好、可靠性越高,该方式的的效用就越高。效用可以表示为不同属性的函数。考虑常规公交[公式]和地铁[公式]这两种出行方式的选择,假设所考虑的属性包括3个维度:[公式]= {[公式]} = {费用,时间,可靠性}。

选择常规公交所获得的效用可以表示为:

[公式]

相应地,选择地铁所获得的效用可以表示为:

[公式]

系数[公式] 分别描述了各属性[公式]的权重。“效用最大化准则”即选取各方案中效用最大的方案:若[公式],则选择地铁出行;反之则选择常规公交。效用最大化理论是离散选择模型的基础,这一点我们在后续文章中会进一步讨论。


3. 离散选择模型的类型

离散选择模型的划分有多种方法。根据备选方案集中备选方案的数量可以将离散选择模型分为二项选择模型(Binomial choice models)多项选择模型(Multinomial choice models)。顾名思义,二项选择模型是指备选方案集中仅有两个选项,如{“是”,“否”},{“买”,“不买”},{“受伤”,“未受伤”},{“感染”,“未感染”} 等等。二项选择模型是学习其它离散选择模型的基础,后文会予以详细介绍。多项选择模型中的方案数量为3个或3个以上,如购买车辆时选择 {“品牌1”、“品牌2”、“品牌3”};交通事故的严重等级{“仅财产损失”、“受伤”、“死亡”} 等等。

另外,按照备选方案的特征也可以将离散选择模型划分为“无序离散选择模型(Unordered DCM)”“有序离散选择模型(Ordered DCM)”两大类。对于交通事故的严重等级来说,“死亡”比“受伤”更严重,“受伤”比“仅财产损失”更严重——因变量是一种有序的数据结构。而对于购买汽车品牌而言,“品牌1”、“品牌2”、“品牌3”之间并无等级差别,使用无序离散选择模型对其进行建模即可。

离散选择模型还有其它的划分方法,后面会逐渐讨论到。


4. 离散选择模型常用的软件

常用的离散选择模型软件有NLOGIT、SAS、Stata、SPSS、MATLAB、Python、R等。NLOGIT是专门针对离散选择模型所设计的软件,专业性较强,可拟合的离散选择模型的种类较多。SAS中也有专门针对离散选择模型的Procedure,如 PROC LOGISTIC 等。以后会以SAS为主,介绍相应的离散选择模型的参数拟合方法以及模型拟合结果的解读。


5. 参考文献:

[1] Daniel McFadden. Wikipedia. Daniel McFadden - Wikipedia. Accessed Nov. 29, 2016.

[2] 效用. 维基百科. zh.wikipedia.org/wiki/%. Accessed Nov. 29, 2016.


欢迎批评指正。


浏览30 评论0
返回
目录
返回
首页
我们生活在“Python时代” 线性模型 vs. Logistic模型——离散选择模型之二

发表评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。