【原】AER未监测的污染, DID和事件研究法运用的典范(附代码)

计量经济圈 2022-04-16

展开全文

邮箱：econometrics666@126.com

所有计量经济圈方法论丛的code文件, 微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.

正文

关于下方文字内容，作者：谢立成, 中南财经政法大学财政税务学院，通信邮箱：xielicheng666@126.com

Zou, Eric Yongchen. 2021. "Unwatched Pollution: The Effect of Intermittent Monitoring on Air Quality." American Economic Review, 111 (7): 2101-26.
Intermittent monitoring of environmental standards may induce strategic changes in polluting activities. This paper documents local strategic responses to a cyclical, once-every-six-day air quality monitoring schedule under the federal Clean Air Act. Using satellite data of monitored areas, I show that air quality is significantly worse on unmonitored days. This effect is explained by short-term suppression of pollution on monitored days, especially during high-pollution periods when the city's noncompliance risk is high. Cities' use of air quality warnings increases on monitored days, which suggests local governments' role in coordinating emission reductions.

摘要：对环境标准的间歇性监测可能会引起污染活动的策略性变化。本文记录了当地对联邦《清洁空气法》中规定的每六天一次周期性的空气质量监测时间表的策略性反应。利用监测地区的卫星数据，结果表明在没有监测计划的日子里，空气质量明显恶化。这种效应可以通过在监测日短期内对污染进行抑制来解释。尤其是在城市违规风险较高的高污染期。地方政府在协调减排方面的作用可以通过城市在监测日使用空气质量警告的次数增加来证明。

环境法规的执行有赖于对地方遵守行为的准确监测。在实践中，有限的预算往往迫使监测工作断断续续地进行，这就为污染者创造了机会，使他们仅在空气监测日遵守规定，而在非监测日增加污染行为。当污染者能够预测监管机构的监测时间表时，产生策略性反应的可能性就会增加，大众汽车排放丑闻就证明了这一点（Gates, Ewing, Russell, and Watkins, 2016）。尽管如此，对间歇性监测的策略性反应通常很难被发现。有两个主要挑战。首先，通常无法对未监测期间的污染行为进行独立测量。第二，监测的时间往往是非随机的。因此，对受监测和不受监测的污染活动进行简单的比较，很可能将策略性反应与可能首先导致监测或检查的潜在因素（如污染泄漏）混为一谈。

本文记录了对大规模的联邦空气污染法规的策略性反应。利用了一个独特的实证背景，在这种背景下，空气监测是基于一个公开的准随机时间表。根据《清洁空气法》，美国环境保护署（EPA）负责强制执行一个全国性的户外颗粒物空气污染(以下简称PM)安全水平，所有县都必须达到这个水平。一个由监测点组成的监测网追踪该标准的遵守情况。由于运营成本高，环保局允许许多站点间歇性地监测污染水平。为了在获得有代表性的监测结果和随机监测计划所产生的行政费用之间取得平衡，环保局宣布了一个周期性的、每六天一次（"1-6天"）的监测计划，该计划每年都会执行。我们利用这个监测规则作为一个政策实验，研究在没有安排监测的日子里是否会出现更高的污染浓度。

首先，本文用13年的卫星观测数据建立了一个颗粒物污染的间接测量方法。这种测量方法能够分别观察到“监测日”和“非监测日”的空气质量。因为避免监测的动机可能是唯一一个在6天内发生变化的因素，所以在监测日和非监测日期间污染水平的差异提供了对监测计划策略性反应的证据。在基准回归分析中，本文使用卫星测量法来比较遵循六天一次计划的监测点周围的监测日和非监测日污染水平。结果表明，监测日和非监测日之间的污染差距很大。卫星探测到的颗粒物污染在监测日比在非监测日少1.6%，而在非监测日的污染水平之间没有显著差异。效应大小与监测日和周末之间观察到的空气质量平均差异相当。同时，安慰剂测试显示，在没有激励措施避免监测的情况下，没有可监测感知的污染差距。例如，当一个监测器关闭时，这种效应就会消失；此外，在每天监测污染的地点周围也没有发现污染差距。

然后，本文从三个方面探讨了潜在的机制。首先，本文检验监管机构与污染者之间的博弈何时发生。结果发现，博弈很可能反映了在“关键”时期污染活动的短期削减，例如，当某县的违规风险很高时。我们发现，平均污染差距掩盖了实质性的异质性，当一个县最近的PM水平接近监管标准时，污染差距很大（超过7%），而当同一个县最近的空气质量良好时，污染差距几乎为零。此外，我们还利用了六天一次监测器才开启的特点，发现造成污染差距的原因是监测日污染的减少，而不是监测日与非监测日之间的替代关系。在某种程度上，这种模式类似于汽车排放丑闻的关键特征，在没有监测的情况下，监测的污染水平低于“正常”污染水平。这种模式表明，污染活动偶尔会短期内受到抑制，而不是全天按计划、常规地污染替代。第二，本文研究了谁在玩博弈的问题。EPA使用监测结果来确定各县（而不是任何特定工厂）是否符合空气质量标准。因此，州和地方政府会受到监管处罚，而且他们往往对违规风险表现出强烈的厌恶。为了研究地方政府对间歇性监测做出策略性反应的可能性，我们分析了地方政府发布公共空气质量咨询（“行动日”）的情况。呼吁公民减少污染活动的建议通常在高污染时期发布。通过分析346个城市和大都市地区行动日公告的历史，我们发现在PM监测日发布公告的可能性明显高出10%。行动日公告的策略性使用提供了另一个在关键时刻玩博弈的例子。更重要的是，这一分析指出了协调的作用：尽管空气质量监测的博弈不太可能仅仅来自联合的污染活动，但地方政府的协调可能会发挥作用。

第三，我们使用横截面数据分析来描述污染差距较大（前10%）的县的监管和产业性质。数据表明，激励措施很重要：污染差距较大的地区污染水平较高，有因违规行为而受到处罚的历史，并且存在间歇性监测点。此外，污染差距较大的地区往往也是当地产业构成允许采取策略性反应的地区。例如，木制品制造商的高集中度是巨大污染差距的强有力预测指标（这是一个高污染行业，通常以部分产能运营）。总之，证据表明，避免监测的监测激励是策略性反应的基础，而应对能力也很重要。

本文首次将 "空间真相 "的概念引入间歇性监测的范畴。虽然原地监测数据通常被认为是遥感科学中的 "地面真相"（例如，Liu, Franklin, Kahn, and Koutrakis, 2007），但卫星数据可以反过来验证地面监测数据的完整性，特别是当人们担心地面监测方式存在偏差时。一些经济学论文发现，在各种监管背景下，卫星和地面监测结果之间存在差异（Karplus, Zhang, and Almond, 2018; Fowlie, Rubin, and Walker, 2019; Sullivan and Krupnick, 2019）。本文强调了卫星直接检测策略性反应的独特能力，这些反应在其他方面很难观察到。

本文是最早报告地方政府应对联邦环境法规的策略性反应证据的论文。监管目标的错位可能会促使地方政府在不合规的管辖范围内实现超本地化的污染减排（Auffhammer, Bento, and Lowe, 2009; Bento, Freedman, and Lang, 2015），甚至向联邦监管机构掩盖真实的污染水平（Greenstone, He, Jia, and Liu, 2020）。本文与Grainger、Schreiber和Chang（2017）最为相关，他们使用卫星数据来研究州政府在放置空气质量监测器时的策略位置选择。本文聚焦于时间上的博弈，并提出了具体的机制--如策略性行动日公告--地方政府可以通过这些机制来进行间歇性监测博弈。本文突出的执法困难之处与之前关于在法规不完善的情况下污染活动的中长期区域或部门替代的文献一致（例如，Becker and Henderson，2000；Hanna，2010；Fowlie、Reguant and Ryan，2016）。通过引入短期反应，本文有助于促进人们对在不断发展的环境法规监测和执法的理解（Gray和Shimshack，2011；Shimshack，2014）。

在政策方面，本文对长期以来间歇性空气质量监测的惯例进行了首次可追溯性评估（Akland，1972；Gilbert，1987）。虽然监测网络正在向先进的、连续的技术转变，但转变的速度出乎意料地落后。虽然我们的分析没有涉及监管机构在设计监测制度时可能面临的政治复杂性，但我们的结果表明，一个持续监测的制度可以改善国家空气质量标准的执行情况，这一点是可以观察到的，而且意义重大。

本文的其余部分组织如下。第一节简要介绍了美国颗粒物污染监管和监测的背景。第二节介绍了监测日和非监测日之间污染差距的识别。第三节探讨了污染差距的特点，阐明了其机制。第四节是结论。

I 制度背景

A.颗粒物监管

美国对颗粒物污染的监管是根据《清洁空气法》实施的，该法律对各行业的PM污染进行监督。对环境可吸入颗粒物的监管可被视为实现该法案最终目标的政策工具：将室外污染浓度维持在既定的安全水平之下，即所谓的国家环境空气质量标准（NAAQS）。在我们的研究期间，有三个有效的PM 标准：三年平均的日 "细 "颗粒物（PM2.5）水平必须低于15微克/立方米；三年平均的年98%分位的PM2.5水平必须低于35微克/立方米；最大 "粗 "颗粒物（PM10）水平必须低于150微克/立方米。每年，环保局根据监测结果将各县分为 "达标 "和 "未达标 "两组。

未达标会给州和地方政府以及工厂带来巨大的监管成本。作为NAAQS规定的一部分，州和地方政府被要求制定州实施计划（SIP），以维持或改善其管辖范围内的空气质量。SIP规定了各州如何设计和执行排放许可计划，以监管现有和新的污染源。根据NAAQS，未达标管辖区的工厂计划必须更加严格，包括更频繁的检查和更高的罚款等措施（例如，Blundell, Gowrisankaran, and Langer, 2018）。在未达标地区规划新产能的工厂必须采用能达到最低排放率的技术，而不考虑这样做的成本。事实证明，未达标的惩罚会造成企业生产力的重大损失。Greenstone、List和Syverson（2012）发现，一个县的非达标状态与制造业生产力的大幅下降有关，每年约有200亿美元的收入。沃克（2013年）显示，在新认定的非达标县，企业的劳动力迁移成本约为80亿美元。州和地方政府的风险也很高。除了公司生产力下降带来的财政损失外，持续的不达标会引起环保局的直接处罚。这些惩罚包括财政制裁，禁止在非达标地区批准几乎所有的公路项目或拨款。另一部分文献发现有证据表明，地方政府将监管资源导向违规地区，并能够在违规监测点附近实现局部空气质量的改善（例如，Auffhammer、Bento和Lowe，2009；Bento、Freedman和Lang，2015）。

B.颗粒物监测

一个由全国1200多个站点组成的环境PM浓度的监测网络。这些监测点通常被放置在人口密度高的地区，以确保对人口数量暴露的合理代表性测度。在我们的研究期间，PM监测网络横跨600多个县，包括美国70%以上的人口。

与许多气态空气污染物（如臭氧）的监测不同，PM监测使用自动化的、基于激光的方法，大部分是基于过滤器的方法，涉及大量的手工操作和维护任务，如现场样品采集和实验室分析。EPA的数据显示，与每个站点监测的采购、运营和维护相关的的年度成本大约为21,000美元，在6天中有1次监测的情况下为41,000美元（美国EPA，1993）。大约有600个站点按6天1次的时间表运行，相对于整个PM监测网络每年4800万美元的维护支出，间歇性监测的成本节约总计约为1200万美元。

周期性的1-6天监测方法是由Akland（1972）提出的。在20世纪80年代，环保局引入了更频繁的3天1次和每天一次的采样计划。这些更频繁的时间表通常在污染程度较高的地区实行（美国环保局，1985年）。随着时间的推移，环保局一直倾向于更频繁的监测。随着20世纪90年代PM2.5监测的开始，EPA开始规定所有的PM2.5监测器至少在3天内开启一次（40 CFR 58.13，1997；U.S. EPA, 1998a）。然而，为了回应各州对成本负担的担忧，环保局允许在个别州免除较低的监测频率（美国环保局，1997a；美国环保局，1998b）。从2001年到2013年，绝大多数可吸入颗粒物监测器遵循6天1次（42%的监测器）、3天1次（33%）或每天一次（22%）的时间计划。虽然本文的分析主要集中在最有可能发生博弈的6天1次的时间表上，但我们在所有监测点（包括3天1次和每天的监测点）测试潜在的污染差距。每天被监测的站点作为一个 “安慰剂”测试，发现没有预期的策略性反应。

监测时间表是公开的。环保局在每个日历年年底在其网站上公布监测日历，通知各州下一个日历年所有间歇性监测点的监测日期。图1列出了2001年的日历。

II 六天一次的污染差距

A.数据和汇总统计

监测数据。我们从EPA的空气质量系统（AQS）获得了2001年至2013年的PM监测特征。AQS的年度汇总数据文件是计划监测‍天数、实际监测天数、纬度和经度位置以及年度PM浓度统计数据（如平均值和最大值）的监测级信息来源。我们通过寻找EPA要求每年60天或61天（121天或122天、365天或366天）采样的监测器，来确定六天一次（三天一次、一天一次）监测器。

卫星数据。我们利用美国国家航空航天局（NASA）中分辨率成像光谱仪（MODIS）算法的卫星数据（Kaufman等人，1997年；Remer等人，2005年）构建了一个大气颗粒污染（"气溶胶"）的衡量标准。MODIS配备了一套灵活的光谱辐射仪，通过测量太阳光的消光量来检索大气中的气溶胶浓度，这是基于对气溶胶在不同光谱波长上散射和吸收光线能力的了解。MODIS将气溶胶总结为一个无尺寸的指数，称为气溶胶光学深度，其理论范围为-0.05至5，较小的数值对应较低的气溶胶浓度水平。在美国，该指数的值大多在0到1的范围内，平均值大约为0.12[1]。为了简化描述，在随后的章节中，我们把这个测度称为 "气溶胶 "或 "气溶胶浓度"。

尽管测量方法不同，这些地面和卫星检查的测量目标相似。可吸入颗粒物监测仪通过测量空气通过大小区分的过滤介质时沉积的颗粒物数量来检索空气中的小颗粒物（如硝酸盐、硫酸盐和黑碳）的浓度；当颗粒物在大气中时，会与阳光相互作用，因此，它们会被卫星测量仪侦测到。测量目标的这种重叠一直是大量大气科学文献的基础，这些文献记录了卫星和地面监测数据之间的强烈关联（例如，Liu, Franklin, Kahn, and Koutrakis, 2007）。

我们构建的关键数据集是2001年至2013年连接每个10km×10km网格单元的气溶胶浓度的日度面板数据。我们分析的地理单位是单个监测站点，一个监测站点周围的气溶胶水平被定义为与该监测点位置相对应的10km×10km网格单元内的气溶胶水平。分析是在单个监测站点层面上进行的（而不是在监测器层面上），因为站点内不同监测点的位置没有明显差异。为了保守起见，在将监测器层面的时间表汇总到站点层面时，我们将一个站点定义为六天一次的站点，如果该站点的任何监测器都遵循六天一次的时间表。以这种方式定义样本，预计是不利于我们找到策略性反应的证据。例如，一些监测点可能有每天一次的监测和六天一次的监测，其中频率较低的监测器用于提供质量保证数据。

描述性统计。表1按日历年和监测频率列出了汇总统计数据。第1至3栏显示了监测点周围的平均气溶胶水平。在研究期间，气溶胶水平保持相对稳定，平均每年下降1.5%。第4至第6栏显示一年中超过任何一个NAAQS标准的平均天数。第7至第9栏报告监测点的数量。由于1997年对NAAQS进行了修订，开始监测PM2.5，并将监测源从PM10的监测中转移出来，而PM10通常是在6天内运行的，因此1-6天的监测点数量随时间推移而减少（美国环保局，1997b）。在分析中，我们利用监测器关闭的特点来表明，随着监测器的关闭，非监测日和监测日之间的污染差距会缩小。第10至12栏计算了有1-6天、1-3天和每天监测的县的人口。平均来说，约有2亿人生活在有PM监测的县，在这些人口中，67%的人生活在至少有一个六天一次监测点的县。

[1] 我们使用的是“MOD04_L2”产品，它提供了最简单的云层屏蔽，质量控制产品，由原始图像开发而来。MODIS提供了更多经过处理的气溶胶数据，包括时间和/或空间上的插值和平滑处理，例如“L3”网格文件。因为我们的研究设计利用了监测时间和/或空间上的频率变化，所以我们使用处理最少的数据来最小化事后建模对研究结果的影响。

注：每行代表一个日历年的统计数据。第1列至第3列显示了网格级别的平均气溶胶水平，约为1天1分、3天1分和6天1分。第4列至第6列显示了一年中超过任何PM NAAQS标准的监测级别总天数。第6列至第9列统计属于每一类别的监测点的数量。第10列至第12列报告了每种监测类型县的人口（百万）。

B.实证设计

估计模型：监测时间表六天一次的严格设计激发了一种直接的识别策略，通过简单地比较六天一次监测周期内的空气污染水平，来估计监测计划对空气污染水平的因果效应。主要的估算公式是：

其中，Aerosolst是监测点s在时间t时记录的卫星气溶胶浓度。1(Off-dayst)是一个虚拟变量，表示监测器被关闭的日子（监测周期六天中的五天）。值得关注的关键系数是β，它代表了监测器在监测日和非监测日的平均污染水平差距。1(Off-dayst)变量的六天一次的严格周期性意味着很少有混杂因素可能会让估计值β是有偏的。为了证实这一点，我们报告了两类情况的结果。在第一种情况下，我们报告了无协变量条件下的回归，因此，β̂仅代表了非监测日和监测日之间的原始差异水平。第二，我们报告了包含一系列协变量的回归，包括时间固定效应Timet（年、月、周的固定效应）、监测点固定效应（αs），以及天气控制因素（Xst），这包括分为10个分位的日温度、四分位数的日风速和日降水量。由于在某一地点观察到的污染很可能是由其他地方的排放物驱动的，这些排放物也会影响到附近的地点，因此所有推论都要考虑到同一县内不同监测点之间的误差相关性，在县一级对标准误差进行聚类。结果对一系列的模型设定变化仍然是稳健的（在第IID节详细讨论）。

要使β̂成为监测制度影响的因果估计值，关于在没有监测制度的情况下，不会出现污染差距的识别假设必须成立。虽然这个假设不能直接检验，但在第IID节中，我们实施安慰剂检验的依据是：在缺乏减少监测日污染激励的地区，如监测器每天工作的地区，预计不会出现策略性反应。

“策略性反应”的解释：当执法力度加大时，污染活动的减少并不一定表示策略性反应。例如，在开始监测后，污染水平的永久性减少可能来自于遵守行为。然而，事实是在有监测制度的地方，污染水平在监测日和非监测日有所不同，这表明反应是策略性的。在本文中，我们将β̂解释为对策略性行为的估计值，或这是对监测计划的“博弈”。

一个相关的观点是，β代表间歇性监测中非监测日相对于监测日的污染水平差异的因果效应。然而，实证设计框架并没有确定间歇性监测对污染水平的影响。第 IIIA 节分析了污染水平的变化，这在思考政策反事实和机制时可能很重要。

C.主要结果

我们首先估计了方程（1）的事件研究版本，将1（Off-dayst）指标变量替换为5个事件日指标变量，从监测日的前3天到后2天。标记为0的监测日是回归中被省略的类别（作为基期）。因此，系数被解释为非监测日相对于监测日期间空气污染的百分比变化。我们使用一年中至少有一个六天一次的PM监测器的所有监测点来进行事件研究估计。该样本包括2001年至2013年48个州的563个县的1193个监测点。图2报告了结果。我们在回归中没有加入任何协变量；因此，实线只是代表1-6天监测周期内空气污染的时间路径，是所有周期的平均数。结果揭示了空气质量差异的一个显著模式。在一个监测周期内，平均空气污染水平差距表现为一个平缓的路径，除了在监测日的急剧下降。表2使用公式（1）报告了平均1/6天的非监测日/监测日污染差距。第1列的结果与图2相对应，显示空气污染在非监测日相对于监测日平均高出1.6%。在第2栏的回归中即使增加了全部协变量也并没有改变估计结果。

表2的第3至4列对3天中的1天进行了同样的分析。注意在这种情况下，1(Off-dayst)表示在3天的监测周期中监测器未开启的天数。我们发现，对于3天1次的PM站点，污染差距小于0.3%，而且没有统计学意义。估计值有足够的精度来拒绝一个效应大小，这个效应大小为在1-6天站点周围观察到的一半。三天一次的零效应具有潜在的重要政策含义：将监测频率增加一倍可能是一个可行的政策选择，可以大幅减少策略性反应。对这一结论的一个警告是，虽然在3天1次的站点附近的策略性反应在规模上似乎较小，但有证据表明3天1次的监测频率仍然是 "可博弈的"。例如，在本文未报告的分析中，我们发现在远离日常监测的站点周围仍然可以检测到显著的策略性反应。

注：每一列报告一个单独的回归。估计样本是有任何1-6天监测器的地点（第1至2列），有任何1-3天监测器的地点（第3至4列），以及有任何1-1天监测器和没有同地间歇监测器的地点（第5至6列）。"1（非监测‍日）"表示没有安排PM监测的日子。"控制因素 "包括场地、年份、年月和周日的固定效应以及天气控制变量（第二部分）。标准误差以县级为单位进行分组聚类。*：p<0.10；**：p<0.05；***：p<0.01。

D.安慰剂检验和稳健性检验

识别假设表明，如果没有六天一次的监测计划，就不会出现污染差距。为了评估这个假设，在没有预期博弈的情况下我们考虑两种类型的安慰剂测试。

在第一个安慰剂测试中，我们估计了每天监测站点附近的污染差距（这是在六天一次的监测‍计划下，因为每天监测一次的站点没有间歇性监测器的联合定位）。表2的第5栏和第6栏记录了这些地点的 "污染差距"。令人欣慰的是，我们没有发现非监测‍日和监测‍日污染水平不同的证据。

第二个安慰剂测试探讨了1-6天内监测点的关闭情况。如果博弈的目标确实是6天1次的时间表，那么人们应该期望在监测器被关闭后污染差距会 "缩小"。我们首先确定了490个6天一次的监测点关闭活动的案例。使用卫星测量法来跟踪这些监测点所在地区的空气质量，我们比较了监测点关闭前后的 "非监测日 "和 "监测日 "的污染差距。请注意，即使在一个监测点关闭后，我们也可以估计污染差距，因为监测日历是普遍适用的；因此，即使没有进行监测计划的监测点，我们也知道监测日期是何时。图3报告了结果，显示了污染差距与监测点关闭时间的关系。在监测站点运营的时间周期内，差距约为2.1%。对于完全相同的地区，监测器关闭后，差距就会缩小。

此外，附录表报告了额外的稳健性检验（见官网）。在包括更多的固定效应后，我们展示了稳健的结果，如监测站点的地点—时间固定效应以及使用每天的站点作为控制组的双重差分设计。

III 污染差距的特征

A.污染水平的变化

第二节重点介绍了非监测日与监测日污染的区别。了解间歇监测对污染水平的影响也很有意义。这种污染差距可以解释为：监测日污染的净减少量，为非监日和监测日之间或介于两者之间的某个时间段的污染活动完全替代。这种差距之所以重要，有两个原因。首先，在缺乏间歇监测测的情况下，监管机构了解反事实的污染水平是相关的。第二，关于污染水平变化的信息可能会揭示策略性反应的潜在性质，这一点将在下文进一步讨论。

估计污染水平变化的实证关键困难是，我们不能在反事实的监测频率下观察相同的监测者。相反，我们再次利用了监测器关闭的事件（第IID节）。我们研究了当地污染水平的整体变化以及在监测日及其前后1天的污染水平差距。为了考虑到可能与监测器关闭相关的污染趋势（例如，可能首先推动监测器关闭的未观察到的因素），我们将同一州内未关闭的1-6天站点的污染水平作为对照组。对于每一个在t年关闭的六天一次的站点，我们将该站点与t年未关闭的同一状态下的所有六天一次的监测测点进行匹配。一个平均关闭站点与31个在同一状态下未关闭的站点进行匹配。

图4提供了对原始趋势的初步观察。在A组中，带标记的实线（虚线）显示了在监器关闭时按照六天一次监测时间表运行的非监测时段（监测日）的年度污染水平。在B组中，没有标记的实线（虚线）显示了非关闭的1-6天周围的非监测日（监测日）的年度污染水平。由此出现三组不同的双重差分的证据。首先，监测器关闭地点周围的污染水平在处理前时期（事件年-4至-1）上升，这表明关闭的时间不是外生的。然而，非关闭的监测站点在污染方面表现出相似的趋势，并且在非监测日和监测日的污染方面有类似的差距。无论是监测日还是非监测日的平行趋势，都使非关闭地点成为合理的控制组。第二，从关闭的年份开始，在整个后处理期（事件年0至4），关闭站点周围的污染水平差距在缩小，而非关闭地点的差距仍然存在。这一证据进一步证明，监测器的关闭只会消除监测站点的策略性反应（第IID节）。第三，在整个研究窗口期（事件年-4至4），四条线--表示关闭和非关闭监测站点的监测日和非监测日的污染水平--都以相当平行的方式移动；唯一的例外是发生在监测器关闭事件当年的永久性跳跃，这表明在之前的监测日，监测器关闭站点附近的污染水平激增。总的来说，有证据表明，间歇性监测器的关闭与以前监测日的污染增加有关，而对以前非监测日的污染水平几乎没有影响。

注：该图显示了监测日（监测日）和非监测日（非监测日）的污染水平。A组中绘制了经过处理的站点（关闭的六分之一天的站点）的趋势，B组中绘制了对照站点（与关闭站点在同一州的非关闭的六分之一天的站点）的趋势。

图形分析促使采用双重差分法模型以确定间歇性监测对污染水平的影响。我们采用以下估计方程：

其中1(treats)表示关闭站点，1(aftery)表示关闭后的年份。注意一个非关闭站点可以作为多个关闭站点的对照，因此它可能在估计样本中多次出现。我们加入了组内固定效应（ηgroup）来进行关闭站点和其匹配的非关闭站点之间的比较。其余的变量描述与方程（1）相同。对于每个站点，我们采用合成控制方法得出权重，使得加权平均后得出的对照站点与处理站点监测器在关闭之前的空气污染水平具有平行趋势（Abadie, Diamond, and Hainmueller, 2010）。

表3列出了双重差分估计结果。从第1列开始，显著的系数表明，关闭站点周围的气溶胶污染水平从15.7单位的基线气溶胶增加了0.137单位（相对于合成控制），因此代表了0.87%的增长。该点估计在常规水平上没有统计学的显著性。也许并不奇怪，很难捕捉到由监测日污染增加所驱动的整体污染增加，而监测日污染只占样本的1/6。第2列将这种增加分解为监测日和非监测日，并发现监测日有显著增加。第3列和第4列重复了同样的分析，增加了之前描述的相关控制变量：县、年、年-月、日-周的固定效应和天气控制。在第4至第5列中，我们估计了一个 "趋势中断"模型，该模型包括了处理站点和对照站点在处理年前后的一组灵活的事件时间趋势。本着参数断点回归的理念，虽然趋势中断模型允许灵活的时间趋势，但可以准确捕获时间趋势在监测器关闭年份发生的变化。总的来说，用更简单控制的模型得出更精确的结果，但定性的结论仍然是稳健的。

注：每列报告一个单独的回归。“1（treat）”表示关闭监测站点。“1（after）”表示监测关闭后的年份。“1（off-day）”表示未安排PM监测的天数。“1（on-day）”表示计划进行PM监测的天数。“Group fixed effects”表示一个关闭站点及其所有匹配的非关闭站点。“控制”包括地点、年份、年-月、周-日固定效应和天气协变量（第IIB节）。"趋势中断模型 "包括线性事件时间趋势的附加项，分别与处理哑变量和时间哑变量相互交乘。所有的回归都控制了低阶交互项和主效应项。标准误聚类在县级层面。

证据表明，污染差距可能是由监测日的污染水平下降导致的。这一发现对策略性反应的特点有两个潜在的影响。首先，它表明，在没有策略性反应的情况下，反事实的污染水平可能与非监测日的污染水平接近。其次，如果没有什么证据表明在监测日和非监测日之间存在污染替代，那表明短期策略性反应只是偶尔发生--例如，抑制污染活动在缓解违规风险的时期发生，而不是通过经常发生的有计划的常规反应。在接下来的小节中，我们将举例说明可能发生策略性反应的 "关键" 时期。

B.高污染周期

一个 "关键 "时间的自然例子是当该县的未达标风险提高时。我们首先做了一个简单的异质性分析，研究当该县近期有高水平的PM2.5记录时，污染差距是否更大。我们通过将1(Off-dayst)虚拟变量与过去6个月的平均PM2.5（即该县每月PM2.5的6个滞后期）进行交互，来增加方程（1）。作为一个安慰性的检验，我们还加入与月度PM2.5的六个滞后期的交互项。估计方程为：

其中c表示包含监测点s的县。关键系数βm代表相对月份m的每单位PM2.5增长的污染差距的变化。更直观地说，βm捕捉今天的污染差距和相对于m月份的今天的实际PM2.5之间的相关性。

图5显示了β̂ m的估计值。该图的特点是污染差距和前一个月的实际PM2.5之间有很强的相关性。这种相关性在更早或更晚的时期都没有被发现（无论是仅仅提前一个月还是在未来任何月份）。我们发现，当前一个月的PM2.5超过15微克/立方米的年度监管标准值时，污染差距超过7%。相反，在污染水平远低于污染标准值的时候，没有发现污染差距。

异质性分析带来了一些预料之中和意外的启示。与之前的文献一致，证据表明，资源被分配用于实现局部空气质量改善--在我们的模型设定中，监测日的污染减少--这将有助于管辖区的NAAQS指标达标。然而，与此同时，策略性反应的短期性质表明，污染差距的大小取决于近期的污染记录，这本身就揭示了存在着与监测时间表博弈的可能性。这些证据对谁在博弈的问题提供了一些初步的线索。博弈不可能来自工厂的自我协调、合作的排放行为，尤其是在污染源集聚的地区。工厂通常也不能随时获得前一个月的空气监测结果。从可信度的角度来看，地方政府机构每天都会对空气质量进行监测、分析和预测，他们更了解当地的“关键”空气质量时段是何时出现在当地。在下一小节中，我们将研究地方政府在策略性反应中的潜在作用。

C空气污染“行动日”公告

我们评估了一个罕见的情况，它提供了一个直接观察地方政府协调行动的机会。我们研究了空气污染 "行动日 "通知的发布模式，许多地方空气污染控制机构在空气污染预计超标时，会用这种方式向公众发出警告。在行动日，政府敦促公民通过 "采取行动 "来改善空气质量，例如减少能源和汽车的使用。

两个特点使行动日计划成为研究地方政府协调的机会。首先，正如以前的研究显示的那样，"行动日"警告极大地影响了户外活动和交通决策（Cutter and Neidell, 2009; Graff Zivin and Neidell, 2009; Neidell, 2009）。例如，Cutter和Neidell（2009）发现，旧金山湾区的“空气安全”警告使每天的交通量减少了3-3.5%。警告是基于实时的空气质量预测。然而，在广泛的AQI内也观察到警告，这表明发布的决定不是程序化的，也不是通过事实计算得出的决定。我们研究了行动日警告是否更有可能在开启PM监测的日子里发布，并假定警告有助于污染下降。

我们获得了2004年至2013年346个报告地区的行动日记录的综合数据库。该数据库由美国环保署的AirNow项目（airnow.gov）提供。这些报告地区是城市、县、都市区和州的混合，共同覆盖了美国大约50%的人口。为了避免重复计算管辖区，我们将数据汇总到核心都市区（CBSA）一级。“行动日”警告往往持续多天（平均每期持续2.4天）。因此，为了更好地确定发布时间，我们把重点放在任何有连续警告时期的首日。最后的估计样本包括CBSA ×daily的6232个行动日。我们再次使用方程（1）来检验行动日警告是否更有可能发生在监测开启的日子里，但将结果变量改为在CBSA×day是否发布行动日警告的指标。

图 6 展示了主要结果。该图提供了在污染采样日发布明显过剩证据。平均而言， “行动日”警告在监测器监测日发布的概率比非监测日高0.108个百分点。考虑到平均每天发布的概率大约为1%，这种影响代表了发布概率的10%的差异。换句话说，在数据中的6232个警告中，避免监测影响了大约100个警告消息的发布。总的来说，有证据表明 "行政能力"在各州的策略行动日警告中的潜在作用，此外还有他们避免违反NAAQS的官僚主义激励。

行动日提供了另一个在关键的高污染时期进行博弈的例子。该分析还表明，博弈不一定产生于工厂的个人行为。行动日的分析提出了一种可能性，即地方政府的协调也可能发生在工业环境中。虽然很难通过工业活动直接衡量协调性，但在下一小节中，我们将利用观察到的影响大小的丰富地理差异来记录污染差距较大地区的产业特征。

县级污染差距的估计：首先，我们分别估算了每个县的监测日和非监测日污染差距。对于c县，拟合以下估算公式：

其中，Aerosolict表示c县内i网格在t日的对数气溶胶水平。季节性控制因素Timect包括年份、年-月和周-日的虚拟变量。县级回归平均包含35236个观测值（中位数=21086个观测值），在10km×10km的逐日水平上。为了考虑抽样变化，特别是包含较少网格单元观测值的小县，我们使用经验贝叶斯式程序调整β̂c的估计值（Chetty和Hendren，2018；Finkelstein、Gentzkow和Williams，2019）。该程序通过结合（无偏但高方差）的原始污染差距估计值β̂c和（有偏但低方差）的 "区域范围 "估计值，产生一个MSE最小化的真实βc预测值，该估计值使用来自相关县150英里内的所有网格单元的数据。

图7显示了贝叶斯调整后的县级污染差距估计数。其中，较暖的颜色表示污染差距较大的地区。该图显示了两个特点。首先，大的污染差距出现在几个地区集群中，如加利福尼亚的部分地区、蒙大拿州、德克萨斯州南部和中西部的一些州。在下面的分析中，我们把污染差距的 "热点"县定义为那些污染差距估计值在前十位的县。结论对"热点"县的其他定义并不敏感，例如，将"热点"县定义为污染差距在前五分之一的县。其次，一些县表现出负的污染差距，这表明气溶胶水平在非监测日比监测日低。在下面的分析中，我们主要关注"热点"县的特征，而把污染差距的大小变化放在一边，因为一个差距的大小更有可能反映当地策略性反应和邻近地区污染模式的复杂组合。

污染差距"热点"县地区的相关因素：我们估计了一个热点县的指标变量对一系列县级特征的横截面回归。一个自然的起始点是一个县的监管和监现状。我们引入一个指标，表示是否有六天一次的监测点，该县是否曾被认定为与PM相关的未达标地区以及该县的平均气溶胶水平的连续变量。然后，我们加入了一系列虚拟变量，用于衡量一个县在34个污染行业中是否有较高的（前10%）就业份额。然后，我们估计了将污染热点县与监管和工业特征联系起来的多元OLS和LASSO后回归。

图8汇总了系数的估计结果。图8显示，在气溶胶水平高、未达标、六天监测一次的县，往往会出现较大的污染差距。这些特征被证明是与巨大污染差距最强的相关因素--无论是在系数大小还是在精确度上都是如此。接下来，我们把污染行业分为几个部门，从排放PM比例最高的部门（公用事业）到最低的部门（行政服务、废物管理和修缮服务）进行排列。两个特定的污染行业--木制品制造业和采矿业--与巨大的污染差距形成了显著的正相关关系。LASSO后的估计结果与OLS的结果基本一致。排放比例低的行业往往不会被选为相关预测因素；另一方面，对于那些被OLS认定为一致且显著相关的行业，系数估计值基本没有变化。在未报告的分析中，我们发现木制品制造业的相关性在广泛的模型设定中是特别稳健的。

对这种异质性的一个潜在解释与反应能力有关。例如，虽然公用事业部门是一个主要的PM排放部门，但发电厂，特别是煤电厂，经常昼夜运行；对他们来说，为了应对短期监测计划而提高或降低产量的成本将是非常昂贵的。相比之下，木制品制造商也贡献了相当大的一部分（3%）PM总排放量，但他们通常以低产能运行。事实上，在本研究中考察的所有污染制造商中，以大约60%的产能运营的木厂的产能利用率最低。闲置的产能可能使这些工厂能够将生产活动转移，以避开污染监测时间表。

IV 结论

财政约束往往促使环境监管机构对污染行为进行间歇性的监测。一个广泛被忽视的问题是间歇性监测时间表容易受到污染者策略性反应的影响，最近关于汽车排放丑闻的证据证明了这一点。本文巩固了这些最新发现的成果，并将文献扩展到更广泛的环境空气质量法规中。我们提出的证据表明，广泛采用每六天一次的室外颗粒物污染监测计划会导致非监测日的空气质量明显低于监测日。这些综合证据是基于对空气质量的卫星测量以及对监日和非监测日之间污染差距较大的地区的各种特征的分析，结果表明对监测测计划的博弈能够而且确实发生了。我们的研究结果揭示了一种可能性，即策略性反应可能通过地方政府的协调而产生，根据联邦法规，地方政府与行业共同承担违规成本。作为这种机制的一个例子，我们表明一些地方政府发布空气质量公告，这些公告在策略上是按照监测时间表进行的；这种公告发布很可能是为了操纵公众行为，例如影响污染排放的交通决策，以降低监测日记录的污染水平。证据显示，策略性反应的强度在不同的地理区域有很大的不同，这在很大程度上取决于当地经济和工业结构的特点。结果与以下观点一致：策略性反应更有可能出现在有更大的激励或能力来避免空气监测的地区。因此，在存在违规处罚风险以及高排放量低产能行业的地区，出现博弈行为的可能性更大，这一特点使他们能够根据监测时间表适时调整。

研究结果提出了几个可能的政策解决方案。一个自然可行的解决方案是使用随机监测时间表。尽管随机监测表（在短时间内通知州和地方政府）在概念上有吸引力，但这样的监测制度在实践中可能存在问题，因为基于过滤器的PM方法需要大量的现场工作，包括采样和随后的实验室分析。相反，人们可能会考虑使用事先生成的随机时间表，例如，在一个日历年的年初。然而，根据本文关于地方政府协调行为的发现，目前还不清楚事先的时间表是否会对当地的污染者严格保密。然而，随机化并不是唯一的潜在解决方案。本文研究结果表明，增加监测频率可以减少博弈，改善空气质量。事实上，有证据表明，在实行每三天监测一次，而不是每六天监测一次的时间表的地区，策略性反应要弱得多。虽然将增加监测频率的运行收益和行政成本的综合评估超出了本文的范围，但我们的发现确实支持在环境政策制定中两个相关的新建议。首先，应该推广先进的连续监测技术，以取代间断的、基于采样的环境监测（例如，Giles，2013）。其次，除了事先的成本收益计算外，可追溯的和独立性评估对于确保监管设计的完整性和有效性非常重要（Greenstone，2013；Auffhammer，2015；Cropper、Fraas和Morgenstern，2017）。

数据和程序下载：

https://www./openicpsr/project/124621/version/V1/view

排版 | e只小猫咪

下面这些短链接文章属于合集，可以收藏起来阅读，不然以后都找不到了。

3.5年，计量经济圈近1000篇不重类计量文章，

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle