时间:2021年12月20日 分类:经济论文 次数:
摘要:健康作为重要的人力资本,不仅是人们拥有美好生活的基础,更是一项基本的生活需求,对个人、家庭和社会的发展都具有十分重要的意义。因果推断方法作为研究个体健康影响机制的重要手段,有助于促进健康相关政策制定的科学化、合理化,为个体健康提供更为可靠的社会保障,对提高居民健康水平具有十分重要的社会意义。从个体健康研究中的常见问题、因果推断理论框架、实证研究中的因果推断三个方面对现有文献进行分析和评价。作为涵盖范围最广泛的研究领域,个体健康水平受到社会资本、收入、教育、保险、迁移、退休、工作等多类因素的影响,同时,实证研究中主要存在测量偏误、遗漏变量、互为因果、共同原因和选择偏差五类问题,解决这些问题常用的因果推断方法主要包括随机控制实验、倾向得分匹配、工具变量法、双重差分法、断点回归设计以及个体固定效应模型。研究阐述了这些因果推断模型的适用条件及优缺点,并对各类模型在个体健康实证研究中的应用作了简要的总结和分析。研究还有助于学者在个体健康研究领域中选择合适的因果推断方法,或进一步综合应用已有的方法。随着大数据技术的发展和对因果推断方法的深入了解,未来应加强机器学习和因果推断方法的结合,丰富已有的因果推断工具,保障研究结果的稳健性。
关键词:个体健康;内生性;混杂因素;因果推断
一、引言
健康不仅是人类的普遍愿望和基本需求,而且作为人力资本的重要组成部分,对个体、家庭和社会都会产生重要的影响。从个体角度来看,健康可以促进教育水平的提高和社会资本的形成,从而影响就业状态、就业类型,进而影响就业收入和社会阶层地位[1];从家庭角度来看,健康可以增加家庭的收入,减少医疗费用的支出,促进家庭幸福[2];从社会经济角度来看,健康有利于促进劳动力供给,延长就业者的工作年限,促进劳动生产率,从而促进经济增长[3]。
正是由于健康的重要性,对健康的研究一直是学术界研究的热点,以“allintitle:health”作为搜索条件用谷歌学术进行搜索,搜索结果达到142万余条,再加上以各种疾病研究为论文标题的文献就更多。我们在WebofScience数据库中在标题、摘要、关键词中搜索“causal&health”,然后再分别检索各个因果推断方法和健康(例如:“PropensityScore&health”),共得到了七万余条检索记录,尽管其中可能有重复文献,但即使剔除这些文献仍有大量检索记录,不难看出,因果推断方法在健康领域得到了广泛的应用。
该领域的研究早在20世纪90年代就进入了大众视野,2010年前后得到了更多的关注,如今更是蓬勃发展,研究范围也逐步从公共环境卫生、临床医学、生物学等领域,开始扩大至经济学、社会学的范畴,而影响个体健康的相关因素除了作为控制异质性的个人人口学特征以外,还包括了教育、工作、收入和社会资本等个人因素,以及诸如迁移、退休和保险等政策性因素。本文的研究就是从经济学、社会学、人口学等领域入手,以期从多角度考虑各领域因素对个体健康的影响研究。尽管健康很重要,研究的成果又非常丰富,但是由于其内在复杂性,健康研究仍然存在很多问题,主要表现在以下几个方面:
一是被解释变量—健康的测量误差,很多研究采用自评健康作为研究对象,对健康状态的回答主要根据个体主观判断,而个体由于认知能力的差别,往往做不到完全理性,因此回答的结果和自己真实的健康状况通常有一定的差别;二是遗漏变量的存在会对结果造成干扰,使得解释变量的估计结果不准确,例如在研究教育对健康的影响时,由于无法准确衡量身体禀赋这一不可观测变量,回归时往往遗漏该变量,从而过高估计了教育对健康的影响。
三是解释变量和被解释变量之间可能互为因果,比如工作时间过长会可能会导致健康状况下降,反之良好的健康状况又会让劳动者有更多的精力投身于工作[4];四是存在同时影响解释变量和结果的第三方变量,比如教育水平越高相应的收入水平也越高,健康状况可能也越好,而收入对健康也有直接的影响,所以教育就是影响收入和健康的共同原因;五是样本自选择偏差,以迁移对健康的影响为例,迁移的个体往往比不迁移个体更健康,但是这个结果并不一定是迁移政策造成的,可能是迁移的个体的健康状况往往更好,因为个人健康状况的好坏决定着其流动机会和流动决策。
为了解决上述健康研究中存在的问题,学者们采用了相应的因果推断方法作为分析工具。例如在研究退休对健康的因果效应时,可以工具变量的方法最大限度地减少对测量误差的担忧[5];与之类似,库鲁克利斯(Kourouklis)等人在研究收入对健康的影响时,使用工具变量方法更好地处理了因为遗漏变量所带来的潜在偏差[6];阿塔莱(Atalay)和朱(Zhu)为解决双向因果关系和测量误差,使用固定效应模型研究了妻子退休对丈夫心理健康的影响[7];龙(Long)等人利用倾向得分匹配与双重差分相结合的方法对迁移和健康之间的因果关系展开了深入研究,解决了选择偏差和互为因果带来的问题[8]。这些方法已经被广泛应用于个体健康研究,用来解决研究过程中产生的一系列问题。
当然对同一类问题的研究根据数据特征和研究背景的不同,可以采用多种因果推断的方法。个体健康研究文献中,由于采用的研究方法存在缺陷,许多文献所指出的影响因素与健康之间的关系是相关而非因果关系,而影响因素与健康之间的因果关系对政策的制定和实施至关重要,因此如何确定影响因素与健康之间的因果关系就显得尤为重要。尽管现在有很多学者采用了因果推断的方法来研究影响因素和健康之间的因果关系,也有一些学者从公共健康的角度对相关研究进行归纳[9],但是鲜有从健康的社会经济决定方面对个体健康研究中的因果推断问题进行归纳、总结。
本文的目的在于通过识别个体健康研究中的常见问题,评价常用的因果推断方法及其在个体健康研究中的应用。由于现有个体健康研究的文献过多,因此我们尽量选择最新的文献进行分析,尽可能涵盖多个方面,但研究文献中未包括临床医学方面的研究。研究结果表明,个体健康研究中存在诸如测量偏误、遗漏变量、互为因果、共同原因和选择偏差等问题,为解决这些问题学者们采用了随机控制实验、倾向得分匹配、工具变量、双重差分、断点回归设计、固定效应模型等方法,对包括社会资本、收入、教育、保险、迁移、退休和工作等多类健康影响因素对健康的因果效应进行了深入研究。
二、个体健康研究的常见问题
个体健康研究中常见的问题主要来源于被解释变量、解释变量、解释变量和被解释变量关系、混杂因素以及研究样本的选择五个方面。在进行健康研究时,作为被解释变量的健康除了可以采用发病率指数[10,11]、身体质量指数BMI[12]和特定疾病诊断[13]等客观指标外,还会采用自评健康(Self-ReportedHealth,简写为SRH)[14]和心理健康[15]等主观指标。当使用像SRH这样有序的主观测量作为客观健康的代理时,研究者必须假设SRH是对个体健康状态的真实反映。无论我们是根据性别、种族、年龄还是社会经济地位来定义群体,当不同的群体以不同的方式自我报告他们的健康状况时,都有可能会造成较大的测度误差[16]。
SRH的测度误差可能会对研究结果产生不利的影响,一方面是影响结果的可靠性,另一方面对自评健康的过高评价可能导致风险健康行为[17]。尽管对报告偏差和解释存在担忧,但是由于其易于收集的特点,SRH仍然是研究人员最常用的健康衡量标准,一些研究结果也表明SRH不仅与客观健康指标具有较强的相关性,而且确实可以预测未来的客观健康状况[16]。
虽然学术界对SRH是不是可靠的健康指标并没有达成一致,我们还是希望SRH越可靠越好,一个可选择的方案是对自我健康状况进行多次评估。以中国健康与养老追踪调查(CHARLS)数据为例,CHARLS问卷有两次关于自评健康状况的调查,第一次受访者未经任何准备直接被询问健康状况,回答可能过于主观,第二次则是在被询问有关慢性病等客观指标的相关问题之后,一部分受访者的自评健康水平发生了变化,所以受访者第二次的自评答案更加真实可靠。
个体健康研究中解释变量方面存在的问题主要是由遗漏变量所造成的。由于遗漏变量使得残差项与解释变量相关,导致解释变量的回归系数是有偏的。但是在进行计量分析时,我们很难做到不遗漏变量,一方面我们很难判断哪些变量要加入控制变量集,即使我们知道某个变量应该加入控制变量中,实际上也可能无法测度(如天赋和能力),另一方面是可能存在未知的控制变量。以保险和健康的关系为例,董(Dong)指出,保险与健康之间存在一些不可观察的变量,主要包括:①个人的健康意识。
个人的健康意识越强,越可能拥有健康的生活方式,也越可能参加医疗保险以预防和治疗疾病;②个人的风险偏好。风险规避者往往倾向于参加医疗保险,同时更注重采取预防保健措施和避免危害健康的行为,这些无法度量的变量使得研究者很难建立起医疗保险与健康状况之间真正的因果关系[18]。被解释变量与解释变量之间可能会存在双向因果关系。如果两个变量互为因果,任何一方都可以作为对方的解释变量,那么任何一个单方面的回归都可能带来内生性问题。
许多健康的影响因素和健康之间存在双向因果关系,例如收入与健康之间的关系、工作时长与健康之间的关系等。以收入与健康之间的关系为例加以说明,很多学者认为较高的收入会带来较高的健康水平,较好的健康也会使得收入增加,但这并不能说明二者之间的因果关系,要分析收入对健康的因果影响,一定要保证收入变量是外生的,但在实证研究中却很难做到,一方面,可以有力预测收入的因素往往也直接影响健康,如教育水平、失业和工作经验;另一方面,存在不可观测的因素,如遗传、风险偏好和社会背景等,可能与收入和健康有关[19]。
为此诸多文献已经转向使用各种类型的收入冲击来估计收入对健康变动的影响,例如有学者通过利用彩票中奖金额的随机变化来估计家庭收入对自我报告的健康状况的因果影响,确实发现了收入和健康之间的因果关系[20]。与收入对健康的影响类似,健康对收入的影响也可能由于存在诸如教育、能力、工作经验等混杂因素而严重偏离,那么什么样的变量既与健康密切相关,又是外生的呢?有些学者尝试用和遗传有关的变量作为工具变量来分析健康对收入的影响,采用孟德尔随机化研究分析表明健康和收入之间确实存在因果关系[1]。
个体健康研究中还有一个常见问题是存在混杂因素同时影响解释变量(也叫处理或暴露)和结果,因此也被称为处理和结果的共同原因,混杂因素可能会导致解释变量对健康的有偏估计。例如前面分析收入对健康的因果关系时,教育往往就是一个混杂因素,人力资本理论认为教育会对收入产生显著的正向影响,受教育水平越高的个体相应的收入水平也越高;很多实证分析也表明教育和健康之间有显著的因果关系[21,22],所以教育水平会同时影响收入和健康的变动。而减少混杂的策略则是侧重于打破混杂因素与结果的关联(如回归调整);打破混杂因素与处理的关联(例如,基于倾向分数的匹配、调整或加权);或者同时打破与处理和结果的关联(例如,双重稳健方法)[9]。样本的自选择偏差在个体健康研究中也颇为常见。
在自选择问题中,被解释变量在每个子样本中都可观测,但此时个体的选择行为存在非随机性。例如是否选择迁移,是否选择购买医疗保险,或者决定是否继续接受高等教育等行为都是内生的,因为不可观测的因素(如个人意识偏好,天赋智力等)会影响人们的决定,这是自我选择的结果。格拉夫娃(Grafova)等人重点关注了邻里环境的自我选择对健康影响的估计产生向下偏差的问题,具体来说,健康每况愈下的老人更有可能会选择改变他们的生活方式,改善生活环境,以便为自己的健康投资,这就可能会导致邻里环境对健康影响的结果偏差[23]。
学者们采用了很多方法来解决个体健康研究中存在的上述问题,这些方法有些是因果推断的方法,有些是常用的计量经济学方法[24,25]。我们归纳了个体健康研究中的诸多文献,包括准自然实验[26]以及混杂控制[9]等方面,还有一些虽然研究对象不是个体健康,但是有关内生性的文献[27],得到个体健康研究中常见问题及解决办法的综合图。
上述分析表明,个体健康研究中存在的问题往往并不是单一的,可能涉及上述问题中的多个,各类问题综合作用的结果使得探究个体健康研究中的因果关系变得尤为困难。对个体健康研究中出现的同一问题,可以采用不同的因果推断方法,那么如何根据研究主题、背景和数据等条件选择合适的因果推断方法,也是研究者亟待解决的问题。因此有必要对个体健康研究中常用的因果推断方法进行归纳、总结,对未来研究提供有益的帮助。
三、因果推断方法
因果推断方法在经济学、社会科学、统计学、流行病学和计算机科学中均得到了广泛应用,很多学者致力于探讨变量之间的因果关系并估计因果效应,以期根据因果关系给出合理的政策建议。在本节中,作者主要介绍了潜在结果模型和因果效应,以便为后续分析个体健康研究中的因果推断建立更好的理论基础。
四、个体健康研究中的准自然实验评估方法与应用
近年来,准自然实验在社会科学研究中具有越来越重要的地位[26]。相较于随机实验而言,其在实验伦理上具有极为重要的优势,如在研究吸烟对健康影响的过程中,实验者在明知吸烟行为的成瘾性与危害性的条件下,强行从样本中选取个体要求其接受处理(即吸烟)是不道德的;但可以选取准自然实验的方式,从社会中选取吸烟者群体与不吸烟者群体,研究其健康差异,但要考虑到两个群体间是否具有样本自选择问题,如是否较低健康水平的群体更倾向于不吸烟以维护自身健康。准自然实验的常用评估方法及其在健康领域的经典研究总结如下。
1.倾向得分匹配早在1983年罗森鲍姆(Rosenbaum)和鲁宾(Rubin)就提出了倾向得分匹配(PropensityScoreMethods,PSM)方法,作为一种近似实验的方法,PSM常被用于克服横截面人群研究中样本的非随机性质[44],尤其是在临床生物医学领域应用更为广泛[45]。
它的基本原理是,对于接受处理的个体,找到可观测相同特征的未被处理的个体,通过逆概率加权[46–49]、偏差矫正匹配[50]等方法,比较他们的观测结果差异,达到估计处理效应的目的。使用PSM有一个前提的关键限制,即“强可忽略性处理分配”,该方法假定,控制协变量之后,具有相同特征的个体对政策具有相同的反应。换句话说,不可观测因素不影响个体是否接受政策干预的决策,只有在估计倾向得分的回归方程中包含的可观测变量才能影响被暴露于政策的概率。如果存在样本选择偏差,一般可以采用PSM方法来估计因果效应,该方法广泛应用于研究迁移[51]、退休[52]、收入[53]、低保参与[25]、工作场所的健康促进措施[54]等多方面因素对健康的影响。
PSM估计因果效应分为三个步骤:首先用所有匹配的协变量估计处理变量的倾向得分,估计方法为二元或多元Logit回归;然后根据得分进行匹配;最后根据研究目的计算平均处理效应,或者对剔除未匹配样本后的新数据集进行回归分析。我们以迁移和低保参与对健康的影响为例加以说明。王(Wang)和胡(Hu)以迁移作为处理变量,采用二元Logit回归计算倾向得分,然后利用局部线性回归匹配方法进行倾向得分匹配,同时使用近邻匹配和半径匹配作为稳健性检验,最终的平均处理效应表明迁移者的健康状况要优于未迁移者[51]。
霍(Huo)等人采用PSM方法,研究了低保参与和青少年心理健康之间的因果关系,处理变量是享受低保的状态:进入、离开和保持,研究分为三个阶段,首先,使用青少年的个人和家庭等特征以及心理健康得分,采用多元Logit模型来预测获得相应福利状态的概率,即倾向得分;然后使用半径匹配方法将每一个在特定处理组的青少年与未接受低保但有相同倾向分数的人进行匹配;最后是使用PSM过程中产生的权重回归调整模型来估计各种低保参与状态对心理健康的可能影响,这样的处理过程很好地解决了选择偏差问题[25]。但是由于PSM没有处理未观察到的混杂因素,该方法有可能导致有偏差的效果估计。与此同时,如果在使用匹配方法时把样本局限在共同支撑域范围,匹配方法得到的结论仅适用于共同支撑域范围里的样本,而不适用于所有样本。如果共同支撑域样本比较小,那么我们得到的结论普遍性就相对较差。
五、未来研究的方向
21世纪以来,以“实验”思想为基础的定量实证分析方法已经成为健康领域定量研究的前沿热点。不管是建立有针对性设计的“随机控制实验”,还是对基于政策变动或外生事件所产生的“准自然实验”进行的研究,其共同目标都是对健康相关政策的有效性和科学性做出准确的评估,这一类典型的因果推断研究方法也进一步证实了诸多影响因素与个体健康之间的因果关系而非简单的相关关系。
从WebofScience的检索结果和我们的研究分析中可以看出,因果推断方法在现今及未来较长的时间内,仍然是主流的健康政策评估方法,这一点也得到了众多学者的肯定。尽管因果推断方法在个体健康研究中得到了广泛的应用,但是该方法在实际应用阶段仍然存在一定的局限性,主要表现在两个方面:
一方面是由样本数据的质量和数量带来的可靠性和外部有效性问题,无论是随机控制实验,还是准自然实验,都需要满足一定的前提条件,例如样本的随机分配、平行趋势假设、共同支撑假设等,但是现有的数据未必能满足这些条件,即使变量之间存在因果关系,也未必能得到验证,或者尽管我们可以在样本范围内得到明确的因果关系,也通过了异质性和稳健性检验,由于样本数量较小,估计结果的外部有效性也会令人质疑;另一方面是分析过程中存在的问题,在实证研究中,我们通常是假设某一因素和健康之间存在因果关系,然后使用因果推断的方法进行验证,这些因果关系可能来源于学者们已有的研究经验,然而可能还存在一些我们经验之外的因果关系,也就是说,因果推断方法更侧重于验证因果关系。
因此,未来研究中我们首先要着重关注数据的质量和数量,为将来的研究奠定坚实的数据基础,然后采用机器学习与因果推断相结合的方法,解决传统因果推断中存在的问题。现有的研究一般基于调查数据,样本量往往只有几千或者几万,十几万的数据集都比较少见,但是一个政策可能会涉及几千万,甚至上亿人,通过少量样本推断出的因果效应在整个受众群体上未必是成立的,也就是说很难满足外部有效性。
随着信息技术和大数据技术的发展,居民健康相关的信息正以前所未有的速度产生和储存,这些信息可能来自医疗、社会保险、就业和收入、税收、社交数据等,还有政府和机构组织的各种调查和普查数据,每类数据只包含健康及健康影响因素的某一局部方面,例如税务局掌控着每个纳税人的纳税记录,是研究个人所得税改革对健康影响的理想的解释变量来源,但是纳税人的健康数据由医疗部门管理,这两者没有交集,因此不能合并为一个可供研究的数据集,只能通过问卷调查进行分析,使研究的可靠性大大降低。由于这些数据分别被不同的机构储存,各机构之间的信息相互独立,没有形成有效的数据共享机制,使得不同的人只能看到健康及其影响因素的某个侧面,难以对健康及健康相关因素进行全局把握。
为此,政府应该在保障居民个人信息安全性、私密性的前提下,合理整合居民健康及影响因素的相关数据,形成健康大数据,为科学研究提供数据支持,通过研究影响健康的诸多因素和健康之间的因果效应,为政府出台科学的健康政策提供依据。如果有健康大数据作为数据支持,那么很多机器学习的分析方法就可以应用于个体健康研究中的因果推断。不同于传统因果推断方法需要基于反事实的潜在结果来定义因果关系,机器学习以数据为基础,通过精准的预测或干预,将“非随机化”的观测样本尽可能向“随机化”实验靠拢,由此可以从传统数据中发现不易察觉的因果关系[106]。
其次,机器学习还具有优秀的样本和变量选择能力,例如:①在处理组和对照组之间建立平衡,包括三种方法,倾向得分匹配方法平衡处理组和对照组之间的分布混杂;逆概率加权,即直接优化观察值的权重,从而导致处理组和对照组的协变量的平均值相同[107];直接生成处理组和对照组,并使其协变量自动平衡,算法包括“遗传匹配”算法[108]、和整数规划优化算法[109,110];②评估所谓的干扰模型(如倾向得分,或结果的条件期望),用机器学习方法可以分别估计倾向得分[111]或潜在结果[112],还可以采用双稳健方法把条件结果期望的估计与倾向得分的估计相结合[113],以及将条件结果期望的估计与协变量平衡相结合的方法[114];③在具有大量协变量的情况下使用机器学习进行变量选择,贝洛尼(Belloni)等人提出了一种提供原则性变量选择的解决方案—“双重套索”,同时考虑了协变量结果和协变量处理分配关联[115]。除此之外,还可以利用机器学习交叉验证的思想,将数据集分为训练集和测试集,在训练集中使用传统因果推断方法识别因果效应,然后在测试集中进行多次重复测试,进一步验证识别结果的外部有效应。
六、结论
本文以个体健康研究为主题,通过对已有文献的分析和总结,发现个体健康研究中存在着测量偏误、遗漏变量、互为因果、共同原因和选择偏差等诸多问题,随机控制实验、倾向得分匹配、工具变量、双重差分、断点回归设计、固定效应模型等因果推断方法,在社会资本、收入、教育、保险、迁移、退休、工作等因素对个体健康的因果效应研究中均得到了广泛的应用,每一种方法都有其优缺点,在实证研究中应根据研究主题和应用条件进行合理选择,有时需要综合应用多种因果推断方法。
我们的研究为健康政策制定者提供了更加科学合理的决策依据,对于提高居民健康水平具有十分重要的社会意义,还有助于研究者在个体健康研究领域中选择合适的因果推断方法,或综合应用已有的方法。随着大数据技术的发展,在未来的研究中,应加强机器学习和因果推断方法的结合,丰富已有的因果推断工具,保障研究结果的稳健性。
参考文献:
[1]HARRISONS,DAVIESAR,DICKSONM.Thecausaleffectsofhealthconditionsandriskfactorsonsocialandsocioeconomicoutcomes:MendelianrandomizationinUKBiobank[J].InternationalJournalofEpidemiology,OxfordUniversityPress,2020,49(5):1661–1681.
[2]LAMUAN,OLSENJA.Yes,healthisimportant,butasmuchforitsimportanceviasociallife:Thedirectandindirecteffectsofhealthonsubjectivewell-beinginchronicallyillindividuals[J].HealthEconomics(UnitedKingdom),JohnWileyandSonsLtd,2018,27(1):209–222
作者:任国强1,王于丹1,周云波2