分享

从地球系统科学的时间序列推断因果关系

 weiwarm 2020-01-16

Inferring causation from time series in Earth system sciences

Jakob Runge et al 2019 in Nature communications

这是一篇因果推断方法在地球系统科学中应用的综述展望文章。

引言:

过去物理定律的发现可通过精确实验,但这无法用于研究复杂的动态系统如地球系统,比如我们无法针对地球系统开展大尺度实验。计算机模拟实验计算量大,费时费力,且包含很多系统的假设。近几十年来发展出大量观测的或地球系统模式输出的大尺度时间序列。这些数据催生了新的、数据驱动的研究方法:观察性因果关系发现。 

虽然说变量之间的相关不一定代表因果关系,现在发展出很多因果推断的方法,基于“两个相关变量之间要么是因果,要么是被共同因子所驱动”原理。因果推断方法可发现并量化系统中的因果关系的相互依赖性。目前因果推断方法在地球科学中的应用比较少,具有很大潜力。下面按论文的章节进行介绍。

首先作者提出因果推断方法的成功应用案例如PCMCI方法可以直接从气压和海温数据中正确检测出Walker环流,而普通相关/回归方法得到结果在物理不可靠。类似的例子还有识别北极与北半球中纬度极端冬天的遥相关、海温对鱼类数量影响等。

然后对因果推断方法进行了概述基于观测因果推断方法始于1950年代,后来经过不断发展与完善。分别介绍了Granger因果方法、非线性状态空间方法、因果网络学习算法、结构因果模型框架等方法,说明了其原理、特点、问题、应用等方面。

接着,对地球科学中的一般性问题与挑战进行了介绍:

  • 因果假设检验:不同子过程、特定空间区域、不同过程的作用尺度跨越时间与空间、气候变量非高斯特征都是难点

  • 因果网络分析:高维非线性时空数据,所以要对网络节点有合理的定义。

  • 探索性因果驱动检测:很多现象是多种驱动因子综合作用的结果,在检测时面临观测样本量小的问题。

  • 物理模型的因果评估:模型过程的复杂性,包括物理过程、经验过程、参数化等,符合观测的结果其背后物理机制不一定正确。

又介绍了因果推断方法应用在地球科学上的挑战

  • 过程上的挑战:不同过程的时间相关性、状态相关性、噪声等;

  • 数据上的挑战:从高维数据中重建出与子过程因果相关的变量,一些驱动因子无法观测,数据质量、离散变量类型;

  • 计算和统计上的挑战:尺度推移的重要性、多变量带来统计问题、数据的不确定性区间。

需要注意的是,因果推断方法得到结果也是基于每种方法的假设,所以要清楚这些假设对结论的影响。

展望了未来的前进方向

  • 方法上的进一步创新:短期来说,现有方法有各自优、缺点,但相互可以补充。中期来看,可以探索还未被用于地球科学的一些方法,一些机器学习方法也会有用。

  • 验证和基准平台:需要有已知因果关系的基准数据集来比较不同方法。比如一些专家标记的数据,或模型模拟数据。本文作者就建立了一个因果关系测试平台causeme.net。

  • 观测因果推断与物理模型相结合:这也是一种趋势,可以帮助模型设计更高效的实验,并改善模型。一些物理限制也可改进因果推断方法的结果。

  • 检测和归因气候变化:检测气候变化与某一驱动因子的作用需要“非现实世界”,只能通过气候模型模拟。因果推断方法可以有助于分析古气候的反馈作用,也可用于检测emergent constraint的可靠性。

结论目前地球系统研究中还是相关回归占主导,因果推断方法障碍是缺少可靠的基准数据集(作者尝试建立),因果推断方法会对地球科学发展发挥作用。

注:第一作者单位是1 German Aerospace Center, Institute of Data Science, Mälzer Str. 3, 07745 Jena, Germany. 2 Grantham Institute, Imperial College, London SW7 2AZ, UK.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多