他们的目标从教育项目到交通事故的预防不一而足,而其偏好的方法是随机试验。
在由印度哈里亚纳邦管理的70家当地卫生诊所中,开始接受一系列标准疫苗接种的孩子的父母可以从诊所顺手带走1公斤的免费糖。如果父母保证孩子能完成注射,他们还能免费带回家1升食用油。
这些简单的礼物是一项测试奖励能否提升该地区贫困儿童持续低迷免疫率的大规模试验的一部分。遵循着通常被用于测试药效的随机对照试验(RCT)模型,科学家在免疫率最低的7个地区随机指定了诊所是否给予礼物。初步结果有望在明年出炉。不过,更小规模的试验表明,这些奖励很有可能起到作用。
“我们已经了解到一些关于免疫率为何如此低的事情。”美国麻省理工学院经济学家Esther Duflo表示。“问题不一定在于人们反对接种疫苗。”她说,是诸如缺少时间或金钱等特定障碍,使他们很难陪孩子去诊所。“你可以用一些小奖励平衡这种困难。”
这正是那些用严格测试社会项目功效的试验变革经济领域的研究人员的诸多见解之一。他们的目标从教育项目到交通事故的预防不一而足,而其偏好的方法是随机试验。因此,他们逐渐被人所熟知为“随机主义者”。
随机主义者在全球发展领域尤其受欢迎。尽管自第二次世界大战以来,援助中有约16万亿美元流向发展中国家,但关于这些资金是否改善了受助者生活的实证数据非常少。随机主义者将他们的试验视作一种产生此类数据并为政府提供促进发展、减缓贫困和聚集钱财工具的方法。
至少从上世纪60年代起,RCT被用于测试社会项目的效果。不过,现代研究始于1997年。那时,公共政策领域最著名和最有影响力的RCT之一在墨西哥启动。
此项试验起源于更早的3年前。当时,墨西哥总统埃内斯托柴迪洛在一场经济危机中就职并且指派经济学家Santiago Levy设计一个旨在帮助贫困人群的项目。出于对传统方法诸如为玉米粉圆饼和能源等产品提供补贴的怀疑,Levy设计了一个如果贫困家庭符合特定要求,比如到访卫生诊所并让他们的孩子在学校就读,便可向其提供现金支付的系统。“由于人们对我当时正在做的事情持批判态度,因此我想确保掌握一些数据,以便我们能进行一场有依据的辩论。”如今在总部位于华盛顿的泛美开发银行负责战略发展规划的Levy说。
巧合的是,Levy的试验拥有一个天然的对照组。当时,政府正在按阶段铺开其支付项目,因此他能收集到被纳入最初铺开项目的村庄以及未被纳入的对比村庄中的家庭的数据。在几年时间里,Levy团队收集的数据表明,这个名为PROGRESA的项目进展得非常好。在参与项目的社区中,卫生诊所的到访率要比对照组高60%。同时,这些社区中的儿童患病率下降了23%,贫血症则减少了18%。
这些数据有助于巩固对该项目的支持。这个如今被称为Prospera的项目覆盖了墨西哥几乎所有的最贫困人群,并且为拉丁美洲和非洲类似项目提供了灵感。
“PROGRESA是首个得到严格评价的此类大型全国性项目之一。”在总部位于华盛顿的智库全球发展中心致力于援助效果和卫生政策研究的William Savedoff表示,“如今,有条件的现金转移项目在全球获得高度评价。我认为,这是墨西哥经验的直接结果。”
随机主义哲学的一个狂热信仰者是盖茨基金会工作人员、在2010年成为美国国际开发署(USAID)署长的Rajiv Shah。他曾创建了一个名为发展创新投资企业(DIV)、旨在测试并放大针对发展问题的解决方案的基金,并且任命哈佛大学经济学家Michael Kremer为科学顾问。Shah说,目标是通过证据的使用“使发展进入一个新的领域”。
从那以后,DIV投资了100多个发展项目,并且近一半涉及RCT。一个由两名来自华盛顿乔治城大学的研究人员在肯尼亚开展的项目,测试了一种减少和小型公共汽车相关的交通事故的简单方法。在Kremer看来,这种碰撞事故是威力不断增加的主要“杀手”。“曾经有两辆小型公共汽车相撞,导致40人死亡。”
2008年,研究人员和1000余名司机共同在公共汽车上贴上督促乘客举报鲁莽驾驶的标签。随后,他们收集了来自4家大型保险公司的信息,并且发现,对严重事故的索赔在粘有标签的公共汽车中减少了50%。DIV为开展一项更大型试验发现索赔减少了25%~33%提供了资金,并且再次资助近300万美元帮助在肯尼亚扩展该项目。
“真正巨大的胜利是在发展中国家或者公司、非政府组织改变它们的政策时。”Kremer说。不过,DIV目前面临的一个问题在于这类策略,或者说在一种场景中被证实有效的任何项目,能否被重新包装和部署用于不同文化因素在起作用的其他国家。
影响政策变化是全球创新基金的明确目标。该基金于2014年9月启动,在5年间将收到来自英国国际发展部、USAID和其他机构2亿美元的资助,并且遵循严格测试的DIV模型。从USAID借调过来的临时负责人Jeffrey Brown表示,该基金已收到针对110个不同国家的项目发起的1800余份申请,并且将在今年晚些时候宣布第一批资助者。
不过,此类机构依然仅提供了每年花在发展援助上的数十亿美元的一小部分,更不用说政府在国内社会项目上所花费的上万亿美元。即使在将这种基于证据的架构纳入考虑范围的借贷机构,严格评价所覆盖的投资比例也很小。
在于2005年开始设置发展影响评价部门的世界银行,接受正式影响评价通过RCT或其他方式的项目数从2003年的不到20个增至2014年的193个。其中,大多数覆盖的是诸如农业、卫生和教育等领域。不过,评价部门负责人Arianna Legovini说,这仍然只代表了世界银行全部项目的15%。Legovini领导了一个由23位专职人员组成的团队,并且拥有约1800万美元的年度预算。尽管这些评价中有很多从长远来看能收回成本,但一个限制在于先期投入:一项影响评价的平均花费在50万美元左右。“如果没有捐助者提供资金,这些研究就不会发生。”Legovini说。
世界银行正试图通过直接和开展项目的发展中国家合作,最大限度地利用其资源。自2005年起,3000多人参加了其举办的研讨会和培训课程,其中大多数人是从世界银行接受资助的发展中国家政府官员。
与此同时,世界银行正不遗余力地评估影响评价项目本身。由Legovini及其团队两名成员开展的分析表明,相较于没有进行过评价的项目,经过正式影响评价的发展项目更有可能被及时地推行。这或许是因为起初的设立、铺开和监控都被给予了额外关注。
此项发现对于单个项目来说是好消息,但对于很多RCT来说则是一个潜在的麻烦。在一种试验场景中出现的正面效果可能会在项目被放大、由政府接管或所有额外关注消失时没了踪影。
“现在一时流行的狂热是让我们进行试验,如果它起到作用,我们将把它放大。”为影响评价和现有研究荟萃分析提供资助的国际影响评价行动华盛顿办公室负责人Annette Brown表示。他认为,研究人员和政府或许应当在任何项目被放大时开展严格测试,以保证结果继续适用,正如哈里亚纳邦政府目前正在做的。(宗华)