分享

​最新: 时间序列因果推断, 问题, 方法和模型最全综述

 计量经济圈 2023-07-11 发布于浙江

必读最新进展,时间序列因果推断:问题、方法和模型

正文

关于下方文字内容,作者:匿名,罗马财经大学金融工程,通信邮箱:rome@email..edu.cn

作者之前的文章,一篇满足我所有DID幻想的最新AER, 交叠, 连续DID, 调节, 机制分析等范文!

Moraffah, R., Sheth, P., Karami, M. et al. Causal inference for time series analysis: problems, methods and evaluation. Knowl Inf Syst 63, 3041–3085 (2021).

Time series data are a collection of chronological observations which are generated by several domains such as medical and financial fields. Over the years, different tasks such as classification, forecasting and clustering have been proposed to analyze this type of data. Time series data have been also used to study the effect of interventions overtime. Moreover, in many fields of science, learning the causal structure of dynamic systems and time series data is considered an interesting task which plays an important role in scientific discoveries. Estimating the effect of an intervention and identifying the causal relations from the data can be performed via causal inference. Existing surveys on time series discuss traditional tasks such as classification and forecasting or explain the details of the approaches proposed to solve a specific task. In this paper, we focus on two causal inference tasks, i.e., treatment effect estimation and causal discovery for time series data and provide a comprehensive review of the approaches in each task. Furthermore, we curate a list of commonly used evaluation metrics and datasets for each task and provide an in-depth insight. These metrics and datasets can serve as benchmark for research in the field.

时间序列因果推断:问题、方法和模型

摘要

时间序列数据是由多个领域(例如医学和金融领域)的按时间顺序的集合。多年来,许多学者用分类、预测和聚类等不同方法来分析此类数据。时间序列数据也被用于研究时间上的处置效果。在许多科学领域,动态系统和时间序列数据的因果结构也在科学发现中发挥着重要作用。通过因果推理,可以估计干预的效果,从数据中找出因果关系。现有的时间序列研究集中于分类和预测等传统任务,或用于解释某些特定方法的细节。论文关注两个因果推理任务,即时间序列数据的处置效应和因果发现,并提供全面的概述。此外,论文为每项任务整理了一份常用评估指标和数据集列表,并提供了深入的分析。这些指标和数据集可以作为该领域研究的基准。

1 简介

第二章介绍流行的时间序列模型。第三章讨论时间序列因果推断的必要定义和假设。第四章讨论时间序列的因果处置效应和因果发现。第五章总结了常用的数据集和常用指标,提供了方法框架。第六章总结了未来研究方向。

2 时间序列模型建模

2.1  自回归模型

AR模型:X(t)与过去变量的回归。

MA模型:X(t)与公式(1)残差的回归。

r阶拆分:将非平稳序列转化为平稳序列。

以上三个模型可以衍生出ARIMA模型、SES模型、DES模型、TES模型

2.2 动态贝叶斯网络(DBN)
记贝叶斯网络G=(V,E),V是节点,E是路径。V点的概率为所有父节点到达该点的局部条件概率乘积。
2.2.1 状态空间模型

SSM代表状态转移公式,用于描述状态转移的概率,常用的形式是线性动态系统(LDS),符合一阶马尔可夫假设。LDS的形式如下:

假设xt不仅由隐藏状态zt决定,还由离散的状态st决定,则联合概率分布函数为:
2.2.2 隐藏马尔可夫模型(HMM)
HMM是SSM的一种形式,假设状态转移遵守马尔可夫过程。联合概率分布函数为:
鲍姆-韦尔奇算法(The Baum–Welch algorithm)是用于估计HMM参数的一种EM算法。
2.3 高斯过程(Gaussian processes,GP)
只有通过对不确定性建模,才能利用可用数据进行稳健分析。因此,贝叶斯推理被用来处理噪声和动态环境中的不确定性。高斯过程是一类贝叶斯非参数模型,特别适合于对时间序列数据进行建模。特别地,高斯过程是一类随机过程,它定义了一组随机变量上的联合高斯分布。符合高斯过程的函数(f(x))由均值(m(x)和协方差(k(x,x’)函数指定,表示为f(x)~G P(m(x),k(x,x’))。形式为:
2.3.1 深度学习和高斯过程(GP)
使用神经网络将输入映射到特征空间(提取非平稳特征),而最后一层稀疏高斯过程在隐藏状态空间回归。例如Maddix DC, Wang Y, Smola A (2018) 。
2.3.2 GP方法
l Marton H, Hernéndez-Lobato JM,Murillo-Fuentes JJ (2018)一文提出了一种基于随机梯度哈密顿蒙特卡罗方法的深度高斯过程模型的推理方法。该论文表明,这些模型中的后验具有非高斯性质,因此,基于变分推理估计高斯后验的现有方法对于多模态后验来说是较差的潜在近似。
l Li SCX, Marlin B (2016)提出了一种不确定性感知分类框架,有助于学习黑盒分类模型,以对稀疏和不规则采样的时间序列进行分类。该框架使用高斯过程回归将不规则时间序列数据转换为统一表示,这允许将稀疏和不规则采样的数据输入到任何黑盒分类器中,该分类器可以使用梯度下降进行学习,同时保留不确定性。
l Tobar F, Bui TD, Turner RE (2015)提出了一个称为高斯过程卷积模型(GPCM)的框架,它作为平稳时间序列的生成模型。该模型背后的主要思想是基于滤波器函数和白噪声过程之间的卷积。这种方法直接从时间序列恢复谱密度的后验分布。在恢复后验分布之前,它还将非参数先验置于谱密度之上。从数据中学习模型允许以概率、分析和计算上易于处理的方式对协方差核以及频谱进行推断。
l Cunningham J, Ghahramani Z, Rasmussen C (2012)提出了一种高斯过程模型,用于分析具有多个时间标记的多个时间序列。所提出的模型可以被视为输入空间和给定数据标记之间的映射。因此,该模型可以用作协方差函数的选择。它还有助于学习和推理成为标准。
l Haufe S et al (2010) 提出了一种利用周期性高斯过程进行长期预测的算法。他们还指出,对于长期预测,有必要通过高斯过程映射概率分布。他们使用常用的平稳周期核的重新参数化,这反过来又允许他们采用解析双逼近策略来计算预测分布的矩。
l 如果想了解高斯过程以及如何使用它们对时间序列数据进行建模,可以参考Rasmussen CE (2003)、Liu H et al (2020)、Roberts S et al (2013)。
2.4 神经网络
对于更复杂、有噪声和更高维度的现实世界数据,ARIMA 和状态空间模型等效率不高。针对这个问题,已有研究结合了各种无监督深度模型。最新的研究可以参考Fawaz HI et al (2019)、Gamboa JCB (2017)和Lim B, Zohren S (2021)。
Graves A (2013)提出了一种使用RNN和LSTM等循环模型生成序列的方法,通过处理每个步骤(xt)的真实数据并预测下一步(xt+1)的值。每一步的输出预测 (yt ) 都是概率性的,并从中采样以作为下一步的输入。从已经训练的网络中的每一步迭代采样,并将其传递到下一步,产生一个新的序列。

3 背景

本节介绍因果处置效果估计中的常见定义和假设。假设A是虚拟变量,代表是否为实验组。Y是结果。X是组间协变量。
定义1:平均处置效应 (Average Treatment Effect)
定义2:样本平均处理效应(Sample Average Treatment Effect)
定义3:条件平均处理效应(Conditional Average Treatment Effect)

定义4:实验组的平均干预效应(Conditional Average Treatment Effect)

以上变量在随机试验中有效,但是观测数据一般只能体现总体的水平,为了获得一致估计量,以下条件需要满足。
假设1:一致性。
假设2:概率不为0
假设3:条件可交换性。非条件可交换性是指实验组(treatment group)里的个体是可交换的,即如果它们被调换,新的实验组将观察到与旧的实验组相同的结果,而新的控制组将观察到与旧的控制组相同的结果。条件可交换性是指给定的X下可交换。
假设4:因果平稳性,即因果关系在不同时间段内保持稳定

假设5:因果充分性假设,即没有未被观测到的混杂变量

假设6:因果马尔可夫条件

假设7:统计模型中的变量关系是否忠实地反映了真实的因果关系

4 因果关系和时间序列分析

本节讨论时间序列数据的因果处置效果估计和因果发现。因果效应估计通常用个体处置效果(ITE)、平均处置效果(ATE)、条件平均处置效果(CATE)和处置者平均处置效果(ATT)等指标来衡量。因果发现是从数据中识别系统中变量之间的因果关系。常用的方法见表1和表2。
4.1 时间序列上的因果处置效应估计
政策制定者经常面临评估干预(即政策变化)对结果的影响。处置效应分为三种:(1)不随时间变化的处置效应,(2)时变的处置效应,以及(3)动态方案。本节介绍时间序列因果处置效应的最新进展和应用。
4.1.1 固定处置效应
当一种干预发生在一个特定时间点并且此后不再改变时,它是时间不变的或固定的,例如单剂量药物。

DID的模型形式:

合成控制方法(Synthetic Control Method):Abadie A, Gardeazabal J (2003)于 2003 年提出的合成控制方法 (SCM) 克服了控制组选择模糊的问题,旨在估计总体水平上发生的干预措施的效果(例如国家、地区、 城市)。这种方法是通过确定每个控制单元的权重,使得所有这些潜在控制单元(称为供体池)的加权平均值最接近治疗前受治疗单元的特征,并使用学习到的权重来估计干预后的反事实 。形式上,SCM 通过最小化以下项来找到权重:
中断时间序列 (ITS) 的使用场景:(1)干预在已知的时间点开始,(2)干预后结果变化相对较快或有一定的滞后,(3)结果持续足够长的时间。

4.1.2 时变处置效应
大多数时候不能用简单的二分法来评估处置效应,例如需医生会根据患者的临床反应重新调整剂量时的药物剂量。在这种情况下,A(代表处置与否的虚拟变量)将与时间相关并且始终被记录(A(t) = {A(1), A(2), ...A(n)})。

大多数研究方法认为影响处置分配和潜在结果的变量都是已知的, 否则结果会有偏差。Bica I, Alaa AM, van der Schaar M (2019)构建了因子模型,采用循环神经网络考虑了潜在变量,模型如图3。

4.1.3 动态处理机制

动态处置模型是将处置变量和协变量的时间序列作为参数,并输出要采取的行动,目的是得到一系列关于如何随时间变化的决策策略。图 4 显示了两阶段动态处置方案,其中 X 和 A 分别表示分类协变量和代表处置动作的虚拟变量。两阶段参与者的观测数据用 (X1, A1, X2, A2) 表示,其中 X1 是处置前协变量,X2 是时变协变量,可能取决于处置期间接受的处置。第一个间隔。随机处置行动为 A1 和 A2,主要结果为 Y = f (X1, A1, X2, A2)。

4.2 时间序列的因果关系
4.2.1 基于格兰杰因果关系和条件独立性的方法
格兰杰因果关系:如果Y包含了X过去值无法包含的信息,则认为Y 是X 的格兰杰原因。

4.2.2 基于结构方程模型的方法

结构方程模型(SEM)长期以来一直用于从观测数据中寻找因果关系。SEM的一种形式是线性非高斯非循环模型(LiNGAM),用于识别因果结构。该模型利用独立成分分析 (ICA) 来识别观测数据中的因果关系。与高斯过程不同,LiNGAM 基于使用数据的非高斯性。该方法的关键在于,当数据为非高斯时,可以识别更多的生成结构。它可以在数学上表示为:

4.2.3 基于深度学习的方法

本节简要介绍深度神经网络如何应用于时间序列数据的因果发现,并如何克服传统时间序列因果模型的缺点。格兰杰因果关系方法建立在时间序列的线性基础上。然而,在现实世界的情况下,时间序列之间的依赖性通常是非线性的,可能会导致格兰杰因果关系的估计不一致。为了将非线性相互作用纳入格兰杰因果关系检测中,Tank A et al (2018)提出了一类非线性架构,例如多层感知器(MLP)和循环神经网络(RNN),其中每个时间序列都使用 MLP 或 RNN 进行建模。非线性框架的输入是所有序列的过去滞后值,输出是单个序列的未来值。作者还利用群体套索惩罚来进一步将输入的权重缩小到零。Dang XH, Shah SY, Zerfos P (2018)提出了一种基于深度学习的框架,该框架由多个定制的门控循环单元(GRU)组成,旨在发现非线性和时间序列间的依赖性。Wu T, Breuel T, Skuhersky M, Kautz J引入了一种新颖的最小预测信息正则化方法来从时间序列推断因果关系,使深度学习模型能够发现非线性因果关系。这项工作对因果关系做出了两个假设。首先是因果充分性假设,该假设指出每个时间序列 x(i ) 只能由 x(1)、x(2)、...x(N) 中的时间序列引起。第二个假设是“均值因果关系”假设,该假设指出因果关系影响其他变量的平均值。他们的模型试图回答这样的问题:在不进行预测的情况下,X( j ) t−1 会被破坏多少?x(i ) t 明显更差?为此,他们采用输入并添加具有可学习幅度的独立噪声,并通过输入和损坏输出之间的互信息来测量损坏程度。上述情况的风险可以由下式给出:

5 模型效果评估

本节概述时间序列和因果时间序列文献中使用的基准数据集和指标。
5.1 数据集
本节简要介绍时间序列因果推理文献中使用的一些数据集。
5.1.1时间序列数据集
l UCR时间序列分类数据集(UCR Time Series Classification Archive):由 120 多个数据集组成。这些数据集代表了一个分类问题。每个数据集中的每个项目都有一个类标签。
https://www.cs./~eamonn/time_series_data_2018/
l Baydogan’s 数据集(Baydogan’s Archive) :由来自语音识别、活动识别和医学等不同应用的十多个不同的多元时间序列数据集组成。
l 纽约出租车数据(NYC Taxi Dataset):单变量时间序列数据集,包含 2014 年 7 月 1 日至 2015 年 1 月 31 日期间纽约市 (NYC) 出租车需求,并观察每半小时记录的乘客数量,包含 10320 个时间戳。
l 真实雅虎服务网络流量数据集(Real Yahoo Services Network Traffic Dataset):单变量时间序列数据集,包含雅虎服务的流量。这些异常现象由人类标记。该数据集由 67 个不同的时间序列组成,每个时间序列包含约 1400 个时间戳。
l 合成雅虎服务网络流量数据集(Synthetic Yahoo Services Network Traffic Dataset):该数据集由 100 个包含异常的合成单变量时间序列数据组成。每个时间序列包含大约 1421 个时间戳。
这些传统数据集在解决传统时间序列问题(例如分类和预测)时非常有效,但没有对照组和实验组,无法用于因果推断。
5.1.2处置效应评估数据集
本节介绍用于研究处置效应的常用现实数据集。
l MIMIC II/III 数据:该数据集包含 ICU 患者的数据,包括患者的血压、氧饱和度、用药以及时间等各种属性(Bica et al.)。
l 广告数据:谷歌的广告数据和搜索数据(Brodersen et al.)。
l 地理实验数据:广告活动数据,一半样本采用非重合地理数据,详见Kerman J, Wang P, Vaver J (2017)。
l 西班牙地区的经济数据:在有关冲突的经济成本的案例研究中,使用西班牙地区的经济数据来分析恐怖主义的影响。作者使用巴斯克人随时间推移的人均 GDP 进行因果分析,详见Abadie A, Gardeazabal J (2003)。
l 加州控烟计划(California’s Tobacco Control Program):利用合成控制方法研究了加州控烟计划的影响,作者使用年度国家级面板数据。这些数据包含 1970 年至 2000 年美国多个州的人均卷烟销量,此期间是第 99 号提案通过的时间。详见Abadie A, Diamond A, Hainmueller J (2010)。
l 空气质量数据:该数据集用于研究汽油含量对空气质量的影响,包括臭氧水平、最低/最高/平均温度、降水和降雪信息,时间涵盖 1989 年至 2006 年。详见Auffhammer M, Kellogg R (2011)。
l 货币政策数据:该数据集来自三个不同的来源。瑞士和欧元的季度 GDP 取自欧盟统计局。瑞士的月度商业信心指数和月度消费者价格指数取自经合组织。月度资产负债表数据、月度活期存款利率和月度平均汇率均取自瑞士国家银行。作者使用该数据集探索欧元-瑞士法郎汇率对数回报的月度因果预测变量,数据范围涵盖 1999 年至 2017 年。详见Pfister N, Bühlmann P, Peters J (2019)。
5.1.3因果发现数据集
本节介绍用于因果发现的常用现实数据集。
l 美国制造业增长数据(US Manufacturing Growth Data):该数据集包含美国制造企业1973-2004 年就业、销售、研发(R&D) 支出和营业收入增长率的微观经济数据。它可用于识别影响公司增长率的因果变量。详见Entner D, Hoyer PO (2010)。
l 糖尿病数据集:该数据集由从两个来源获得的糖尿病患者记录组成:自动电子记录设备和纸质记录,可用于推导真实因果图。详见Schaechtle U, Stathis K, Bromuri S (2013)。
l 温度臭氧数据:该数据集由两个变量、72 个时间点、16 个不同地点组成。两个变量是臭氧和辐射,假设辐射对臭氧有因果影响。详见GongMet al (2017)、Mooij JM et al (2016)、 Schaechtle U, Stathis K, Bromuri S (2013)。
l OHDNOAA 数据集:这是美国国家海洋和大气管理局水文发展办公室提供的数据集,由美国几个方形区域内的 32 个水文相关变量组成。数据是恒定间隔6小时,范围从1979年到2008年。详见Jangyodsuk P, Seo DJ, Gao J (2014)。
l 神经活动数据集:该数据集由实时全脑成像组成,用于记录秀丽隐杆线虫的神经活动。该数据集由 302 个神经元组成,通常用于识别哪些神经元负责运动。
l 人体动作捕捉:该数据集来自 CMU MoCap 数据库,包含两个受试者的关节角度、身体位置的数据。该数据集包含 2024 个时间点的 54 个关节角度。详见Tank A et al (2018)。
l 交通预测数据集:该数据集包含来自加利福尼亚州洛杉矶四个月的传感器数据,共有 207 个传感器被用于收集这些数据。每个传感器的位置(以 GPS 坐标的形式)也包含在数据集中。详见Pan Z et al (2018)。
l 股票指数数据。例如Rothenhäusler D et al (2015)。
5.1.4 综合数据集

本节讨论一些综合数据集和一些使用综合模型的论文。表3总结了综合模型的特点。

l 混杂/共因模型:因果关系文献中的一个关注点是混杂因素的存在。文献中的一些方法提出了数据生成过程来模拟它们的存在。例如,Huang等人使用模拟的数据集,其中有一个共同的原因和共同的影响[74]。这些数据集包含噪声变量和随时间变化的因果变量。e(t)是变量e在时间t的值,让c代表影响e的变量,因此有:

l 非线性模型:由于许多建议的框架是为非线性系统设计的、 已经开发了几种方法来模拟非线性系统以进行评估。非线性模型的一个例子是Papana等人[121]所使用的模拟。在他们的工作中,他们模拟了一个具有线性和非线性关系的三变量系统。还有其他各种使用数据的非线性模型的工作。

l 动态模型:模拟变化过程的模型,即变量的依赖性以非线性和非指数方式随时间变化。变量以非线性和非指数的方式随时间变化。例子可见Löwe S et al (2020)。
处置效应的例子可见Kerman J, Wang P, Vaver J (2017)。
l 混沌模型(Chaotic Models):混沌性是模型偏离其超参数不同值的能力。混沌性通常用洛伦兹模型来表示。彼得斯等人。[121]提出了一种针对具有这种特性的非线性数据的模拟方法。洛伦兹模型的变体在其他地方用于时间序列的因果推理。Khanna 等人的工作中使用了 Lorenze-96 模型。[88] 作者提到它是气候科学的流行模型。
5.2 模型评估指标
5.2.1 时间序列指标
l 分类准确性、平均误差、中误差
l 最长公共子序列(LCS)

l 编辑带有实际惩罚的距离(Edit Distance with Real Penalty)
l 欧氏距离(Euclidean Distance)
l 动态时间规整(DTW):不同于上述方法要求轨迹等长,DTW允许一些点重复使用,以使得轨迹间有最佳对齐方式。

5.2.2 因果时间序列评估指标
本节介绍时间序列因果发现模型的常见变量,然后介绍了处置效应模型的评估指标。这些指标的摘要见表4。

处置效应评估指标:MSE、F检验、T检验

因果发现指标主要是寻找因果关系,包括:SHD结构汉明距离、真/假阳性率、接受者-操作者曲线下的面积AUROC曲线、均方误差、F-分数、精确度和召回率、准确-召回曲线下的面积AUPR、F检验。其中,F检验的定义如下:

6 总结和展望

论文全面介绍了时间序列数据的因果推理理论,将模型分为四类,即自回归模型、动态贝叶斯网络、高斯过程和神经网络,并讨论每个类别的研究现状。论文还讨论了时间序列上两个最重要的因果推理应用,即因果处置效果估计和因果发现,并根据方法对其分类。论文还介绍数据集和评估指标,可作为该领域未来研究的指南。接下来讨论处置效应、因果发现和模型评估的未来展望。
6.1 因果处置效应评估
大多数方法都基于稳定单位处置值假设(SUTVA),即潜在结果只受到处理变量的影响。但是在社会科学等许多研究领域,朋友、家人和熟人会影响受试者。因此,研究时应当考虑社交网络和同伴的影响。此外,现有的模型将处理事件的发生视为离散事件。然而,一些处理事件,例如透析或静脉注射利尿剂,是在一段时间内连续进行的。因此,估计连续时间和连续处置效果是一个需要探索的方向。基于深度神经网络的因果发现方法大多数依赖格兰杰因果关系,还可以考虑珀尔因果关系。未来,利用深度神经网络从时间序列数据中确定因果结构具有较为广阔的前景。此外,时间序列领域的大多数现有算法仅利用观测数据,同时考虑干预时间序列可能会更加有用。
6.2 模型效果评价和基准数据集
模型效果的评估需要稳健的数据集。在因果发现中,当其中一种模式是时间时,我们需要数据集来评估多模式因果发现算法。多模式数据表示不同类型的数据,如图像、文本等。例如,在不同时间拍摄的场景的卫星图像表示多模式数据。当涉及到处置效果估计时,需要适合计算反事实结果和事实结果的数据集,从而考虑个体水平的影响,而非只考虑了总体水平。

上一节提到的大多数数据集都是由观察性研究产生的,在这种情况下不可能同时获得事实和反事实的数据。不过,目前已经有论文使用观察和随机对照试验(RCT)相结合的构建数据来克服这一困难,例如Jaber A et al(2020), Louizos C et al(2017)。未来的研究将需要更多这样的数据来更好地评估处置效应。


关于时间序列方法:1.时间序列分析的各种程序, 38页集结整理成文档,2.ARDL, ARIMA, VAR, (G)ARCH时间数据模型讲解及软件操作,3.R软件中的时间序列分析程序包纵览,4.时间序列分析的各种程序, 38页集结整理成文档,5.时间序列数据分析的思维导图一览, 金融经济学者必备工具,6.送书: 应用时间序列分析(经典),7.为啥时间序列模型比较难学?时间序列的正名路,8.面板数据单位根检验软件操作和解读全在这里,9.动态面板回归和软件操作,单位根和协整检验(Dynamic Panel Data),10.疫情期计量课程免费开放!面板数据, 因果推断, 时间序列分析与Stata应用,11.送书: 应用时间序列分析(经典),12.时间序列模型分解,季节调整分析基础,13.动态因子模型是什么, 又怎么去实现? 14.动态面板分位数估计怎么做?15.动态面板门槛回归程序公布, 使用方法介绍,16.把动态面板命令讲清楚了,对Stata的ado详尽解释,17.时间序列分析概览(今天的重点1),18.全面比较和概述运用机器学习模型进行时间序列预测的方法优劣!19.一文读懂“非平稳时间序列计量经济学分析”, 包括单位根检验, 结构突变检验等,20.中断时间序列分析ITSA是什么? 很流行的政策评估新范式!21.可以在面板回归分析中使用时间序列解释变量或被解释变量吗?22.ARIMA时间序列模型的步骤, 程序和各种检验, 附上代码并通过示例进行解读!23.使用Stata做时间序列分析书籍, 包括模型讲解以及Stata示例操作,24.时间序列中的协整检验和VECM,以及回归后的系列估计操作
关于因果推断书籍:1.一本最新因果推断书籍, 包括了机器学习因果推断方法, 学习主流和前沿方法,2.社会经济政策的评估计量经济学, 提供书籍和数据和程序文件,3.诺奖得主Angrist的因果推断课程文献读物单子再次更新了, 还提供了其他三门课程,4.全面且前沿的因果推断课程, 提供视频, 课件, 书籍和经典文献,5.从网页上直接复制代码的因果推断书籍出现了, 学会主流方法成效极快,6.推荐书籍"用R软件做应用因果分析", 有需要的学者可以自行下载!7.哪本因果推断书籍最好?我们给你整理好了这个书单!8.“不一样”的因果推断书籍, 很多观点让我们能恍然大悟, 涵盖了不少其他书里没有的因果推断方法!9.搞懂因果推断中内生性问题解决方法必读的书籍和文献已搜集好!10.一位“诗人”教授写了本因果推断书籍, 现在可以直接下载PDF参看!11.使用R软件学习计量经济学方法三本书籍推荐,12.机器学习与Econometrics的书籍推荐, 值得拥有的经典,13.史上最全的因果识别经典前沿书籍, 仅此一份,14.用R语言做Econometrics的书籍推荐, 值得拥有的经典,15.Stata学习的书籍和材料大放送, 以火力全开的势头,16.USA经管商博士最狂热崇拜的计量书籍震撼出炉,17.推荐使用Python语言做因果推断前沿方法的书籍,18.一些比较常见的因果推断书籍25本汇总, 很多可以直接下载PDF,19.推荐一本专攻处理效应分析的书籍, 包括主流政策评估计量方法

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

5年,计量经济圈近1500篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 官员方言  | 微观数据 | 内部数据
计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID
数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |
干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验
计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多