分享

确保模型为社会服务的五个原则

 愚然楼 2022-11-27 发表于湖南

数学模型是探索问题的好方法,同时也是断言答案的危险方式。向模型寻求确定性或共识,不应沦为仪式化的量化使用。遵循以下原则,对模型进行全面和坦率的披露,有助于数学建模工具一直保持其价值。

图片

(来源:/articles/d41586-020-01812-9)

早在新冠疫情之前,统计学家就在讨论如何防止P值操控等弊端,特别是P值操控的分析结果很可能影响政策的方向。如今,数学建模成为了关注的焦点,政客们往往声明他们的政策是“科学”决定的。然而,目前没有任何研究能够提供准确、可靠的数据来说明新冠病毒的实质内容。关于新冠病毒,仍有很多未知:比如病毒在人群中的流行率、死亡率和再生率。我们不了解无症状感染者的确切数量,更不了解感染的季节性、免疫系统是如何抵抗病毒的,更不清楚社交距离等干预措施在多样化、复杂社会中产生的影响。

数学模型预测的感染人数、住院人数和死亡率是并不准确的。政治竞争对手往往不使用模型来传达他们的理解,而是用模型来支持预先制定的议程。为了避免模型预测成为政治的附属品,建模者、决策者和公民需要建立新的社会规范。不允许建模者夸大他们模型的确定性,而政治家不允许将责任推卸给他们选择的模型。这一点很重要,因为如果使用得当,模型能够很好地为社会服务:比如预测天气的模型,这些模型是通过数百万次的测试,反复印证得来的。关注天气的野餐者、航空公司高管和渔民等都明白,预测结果并不确定,在此基础上将预测纳入决策。因此,在这里我们提出了5个原则,以期找到将建模应用于政策的最佳方法。

一、了解假设不确定性

评估模型的不确定性和敏感性。不能直接引用不同系统的模型,在一种情况下合理的假设在另一种情况下可能变得荒谬——用于民用核风险的模型可能无法充分评估地震风险。此外,当模型没有需要可靠的关键信息时,也会出现失效。例如,一个用于指导运输政策的模型,它取决于30年后多少乘客出行。

避免这些问题的一种方法是进行不确定性和敏感性的分析。在实践中,这意味着允许所有不确定的变量、数学关系和边界条件同时变化,因为模型的运行限定了它的预测范围。这往往表明,预测中的不确定性比最初断言的要大得多。有分析表明,当现有的模型适当地综合了未来人口增长率、灌溉面积的分布以及两者之间的数学关系的不确定性时,对未来作物灌溉土地量的估计变化超过5倍。

“防止模型隐藏其假设尤其是政治倾向的最好方法,是设定一套社会规范。”

然而,这些全球不确定性和敏感性分析往往没有进行。任何人求助于模型都应该进行这种分析,并将分析结果进行充分的描述和运用。

二、关注参数复杂性

复杂性是相关性的敌人。模型的有用性和它试图捕捉的广度之间存在着矛盾权衡。但许多人被增加模型复杂性的想法所诱惑,试图更准确地捕捉现实。随着更多参数的增加,一个模型变得更复杂,但代价是它的预测通常变得不那么准确。不确定性积累起来,误差可能会增加到预测变得无用的地步。

过度复杂性的一个极端例子是美国能源部使用的一个模型,用于评估在尤卡山储存库处置放射性废物的风险。它被称为总系统性能评估,包含286个子模型和数千个参数。监管机构的任务是预测“一百万年”的安全。然而,一个单一的关键变量——水渗透到地下储存库水平所需的时间——在三个数量级上不确定,使得模型再复杂也变得无关紧要。

复杂性本身往往被视为目的。但其实,建模的目标是找到具有误差的最佳平衡。

更重要的是,在建模方面受过训练的人往往没有进行过这种复杂性分析。例如当桥梁倒塌时,工程师去执行任务,而其他模型则倾向于与大型团队一起开发,并使用复杂的反馈机制,即使预测错得离谱,任何人也不会被追究责任。

三、提高模型的透明度

将目的和内容匹配起来。模型的结果能部分地反映出开发人员的兴趣、学科方向和偏见。没有任何一种模型能够满足所有的目的。

建模者知道工具的选择会影响结果,甚至可以确定分析的结果,所以技术永远不是中立的。例如,美国陆军工兵部队使用了GENESIS海岸侵蚀模型来支持海滩保护项目的成本效益评估。成本效益模型不能真实地预测海浪侵蚀海滩的机制或人类干预海滩补给的有效性。预测结果可以很容易地被技术操纵,以增加支持某些沿海工程项目的证据。更公平的评估应该考虑极端风暴事件在侵蚀过程中的主导作用。

评估模型质量需要同时对透明度作出承诺。包括:“成本效益”、“预期效用”、“决策理论”、“生命周期评估”、“生态系统服务”和“基于证据的政策”。然而,所有这一切都预先假定了一套关于什么是重要的价值观——可持续性、生产力或盈利能力。建模者不应隐藏其选择的规范价值。

防止模型隐藏其假设,包括政治倾向的最好方法是建立一套社会规范。规范内容应包括如何生成模型、评估其不确定性和交流结果。为此若干学科已经制定了国际准则,要求评估进程让利益相关方参与,采纳多种观点,增加透明度,分析敏感性和不确定性。当一个模型用于新的应用程序时,必须重新验证它。

现有的传染病模型准则也反映了这些内容,但尚未得到广泛采用。模型的简化可能是至关重要的。当一个模型不再是一个黑匣子时,那些使用它的人必须评估每个参数及其之间的关系。这使得人们可以交流,不同的框架和假设是如何反映不同的推论的,而不仅仅是一个过于复杂的模型的单一的简化解释。也就是说,多组合理假设的定性描述对于提高决策者的洞察力与提供更准确的定量结果也非常重要。在预测洪水风险和渔业管理方面,可以找到遵守这些准则的模式的例子。其模型考虑了利益相关者提供的洞察力和直觉。

 四、结果的充分解释

量化可能适得其反。过分关注数字会使一门学科从大致正确转向完全错误。不恰当地使用统计结果会代替合理的判断。为了让高风险金融产品看起来安全的模型,在2007、2008年破坏了全球经济。

一旦数字清晰地出现在人们眼前,其他可能的解释和估计就会从人们视野中消失,其他选择被边缘化。就COVID-19而言,各种不同的问题,如提供重症监护医院病床、就业和公民自由,也在发挥重要的作用,但这些问题不能简单地量化然后插入数学模型。

虚假的精确增加了一种虚假的确定性。如果建模者告诉英国,如果不采取措施缓解疫情,将会有51万人死亡,人们会自行想象置信区间。相反,即使是建模者运行的有限不确定性分析也显示出41万-55万人死亡(仅仅基于一个参数)。同样,世界卫生组织预测非洲将有多达19万人死亡(见see go.nature.com/3hdy8kn)。这个数字其实是一个推测,没有理论或经验依据。虽然思维实验是有用的,但它们不应被视为预测。

不确定性的不透明会损害信任。数量社会学领域的经验是信任对于数字的有用性是必不可少的。充分的解释至关重要。

五、承认未知

承认无知。在西方哲学的大部分历史中,无知的自我意识被认为是一种美德。即使在今天,什么是未知的和什么是已知的一样重要。然而,模型可以隐藏无知。

如果不承认无知,人们就会人为地干预政策,导致各种预料之外的后果。更糟糕的是,忽视不确定性会给政客们提供躲避问责的机会。专家们应该有勇气回答“你的问题没有答案”,就像美国政府流行病学家安东尼·福奇在一位政治家调查时所做的那样。

结语

数学模型是探索问题的好方法,同时也是断言答案的危险方式。向模型寻求确定性或共识,不应沦为仪式化的量化使用。

模型的假设和局限性必须公开和诚实地评估。因此,我们认为,良好的建模不能由建模者单独完成,而应是一项社会活动。法国的“统计学家”运动表明了如何用数字来对抗数字,例如在贫困和不平等的量化方面。

关于模型和社会之间关系的社会行动主义是由美国的工程师企业家TomasPueyo提供的。他不是流行病学家,但建立了COVID-19模型,并用通俗易懂的语言解释了不确定性对政策选择的影响。

我们呼吁的不是结束量化,也不是非政治模式,而是对模型进行全面和坦率的披露。遵循这五点有助于数学建模工具一直保持其价值。忽略这五个原则,模型预测则会成为特洛伊木马,成为获得不明确利益和价值的手段。

作者介绍:Saltelli, A. 挪威卑尔根大学科学和人文研究中心和西班牙巴塞罗那加泰罗尼亚开放大学开放证据研究中心教授。

原文参考:Saltelli, A., Bammer, G., Bruno, I., et al. Five ways to ensure that models serve society: a manifesto[J]. Nature, 2020, 582(7813):482-484.

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多