多语言展示
当前在线:1671今日阅读:75今日分享:44

如何理解PSM(倾向评分匹配)方法?

今天,我给大家介绍一种十分常用的计量方法,PSM(倾向匹配得分)。这种方法已经被广泛地使用在各个研究领域。随着,大家对内生性问题越来越重视,PSM也是难以被绕开的方法,无论是配合DID,还是单独做稳健性检验,都有特别多的应用,今天我就带大家来学习一下PSM。
工具/原料
1

stata

2

电脑

PSM的理解与具体步骤
1

第一个问题时PSM是解决什么问题的?PSM要解决的首要问题就是选择偏差的问题。最早PSM是应用在医学领域的,所以我也以医学举例子,我们想要考察某种药品的有效性,但是我们不能做实验,所以,我们把来医院就医的人的数据记录下来,然后看看吃种药的效果,问题是医生给这些人开药并不是随机的,而是与病人状况有关的这也就是所谓的选择偏差。

2

看到这里你可能会问,什么是选择偏差?我们为什么要解决选择偏差?以上面的例子为例,我们想要得到的是,药效。如果我们直接把吃了药的人和不吃药的人之间的药效(如几天康复),相减,就不能得到我们想要的(ACE,也就是平均因果效应。)因为他们之间的差值,包括了选择偏差。

3

所以此时,我们需要来分离出,我们需要的ACM。我们可以想到的方法是,直接比较条件完全相同的人,一个人吃了药,一个人没吃药。不过这显然是不现实的,这种情况只能在实验中进行操作,现实中难以实现。这时候,我们需要的就是PSM的方法了。

4

PSM的方法认为,在倾向匹配得分相同的情况下,处理组和对照组的结果与是否处理条件独立。如果我们使用倾向得分,可以不让每一个变量都相同,只需要被处理的概率相同即可。

5

现在正式开始讨论PSM的具体操作流程,我们的第一步是对propensity score进行估计,然后,我们使用不同的匹配方法,得分类似的处理组的值与非处理组的数值进行匹配(使用不同的算法,很多种类)。然后是关键的第三步,很多同学也是这里比较模糊,我们在匹配之后,有一部分对照组的数据,没有可以对应的处理组的数据,这时候,我们就要把它们扔掉。然后对我们保留下来的进行分层对照(见图示)。然后最后一步,我们按照不同的组减,然后得到不同组的ACE,在加权重即可得出处理组整体的ACE,我们的目的也就达成了。

6

下图是,PSM的具体操作流程图,忘记原理时,可以对照图示进行回忆。

注意事项
1

对于原理上有什么不懂的可以留言

2

PSM除了在医学中有很多应用,在经济学和社会学中也变得越来越重要

推荐信息