借我借我一双慧眼吧,让我把这纷扰看得清清楚楚明明白白真真切切。一首歌这样唱道。可惜,我们没有上帝视角,无法事无巨细观察这个和认识这个世界,大道至简,作为常人,我们就简化来看看这个世界的结构并研究其演化规则。在这个过程中,将研究对象模型化是一种非常重要的手段和方法。我们就一起来走进模型的世界。 1 模型与数学模型1.1 丰富多彩的模型模型并不复杂,我们小时候玩的航模、船模,听过的飞机风洞试验,在天文尺度上,把地球当成一个质点来看待,量子当成波粒二象性对象,引力、磁力作用使用场来描述,这些都属于物理模型。我们分析问题时,常常画图,先把重要的人和对象记下,然后把TA们的关系通过线连接起来。在做古典概率的学生房间分配、邮件投递、电子呆在不同的量子化能级上,常常使用小球装入盒子中的模式转换分析,这些属于心智模型。事实上,模型并不复杂,我们在工作、学习和生活中有意无意地一直在使用。本文讲的是另外一种非常重要的模式——数学模型。 1.2 数学模型及分类 数学模型,就是简化同构复杂对象系统后,形成一套易于理解的数学符号系统。能运算模型来描述对象系统演化过程。 image.png
1.3 建模方法 建模有两种路径,一是根据先验知识进行建模,主要是根据常识或者相应理论进行建模,如微分方程、马尔可夫过程建模等。二是从数据中发现存在的知识。对于前者,判断结构是否合理、选择的因素是否恰当,尤其要估计参数,有些模型是简单的,可以得到解析解,但是对于一些复杂问题就必须用算法来计算结果估计参数了。对于后者,利用数值法来求解结果(如插值和仿真),用机器学习和统计方法来探索结构和估计参数。 在众多的应用领域中,人口领域应用模型很多,非常具有代表性,因此,我们下面就以这个领域来介绍数学模型。由浅入深,不是很难。 2 严峻的人口问题及人口模型2.1 当前人口面临的问题我们能感到人口的影响,如号召大家生三胎,人口第一大国已经是印度等。按照《世界人口展望2022》中方案对中国人口的预测, 2022年7月1日中国总人口已经进入负增长[i]。印度将在明年超过中国,成为世界上人口最多的国家[ii]。据世界人口网报道,我国面临以下重大人口问题[iii]: 2.2 人口模型类别 人口模型属于特定应用领域的模型。一是传统人口学,把人口作为一个整体,以群体为单位进行的宏观测算;二是家庭人口学,以家庭为基本单位,除可以测算传统人口学所有的信息外,还可以测算人口的家庭结构、代际结构,作为中观模型对待。三是微观仿真方法,把人作为一个主体,以个体为单位,模拟其可能出现的社会行为,然后汇总得到人口的总体信息。其中,第二、三两种方法是20世纪80年代以来新兴的分析方法,可以更好地分析、把握人口及其经济社会行为,如可计算“4-2-1”家庭数量及比例、独生子女、二胎、三胎数量等,正日益成为政策分析的有力工具。 3 宏观群体数人口模型模型预测的内容相对少一些,主要是人口的数量和结构。 4 中观家庭人口模型5 微观个人仿真模型 微观仿真模型是人口模型中非常重要的一种新方法,这种方法得到的结果非常精细,还很灵活,可以方便地道许多感兴趣的指标。受到越来越多人的重视。同时,我们在计量经济模型、运输模型、排队论模型中都大量使用仿真方法,在算法上,如MCMC方法中也都需要进行Monte Carlo (蒙特卡洛)仿真。因此,对这个方法进行一个比较详细介绍。笔者也是花了很长时间才悟明白这个方法的一些道理,今天和盘托出,所以,读下去,划算的很。 5.1 Monte Carlo 仿真 蒙特卡洛是摩洛哥著名的赌城,以他的名字命名的方法我们通过一个简单的方法说明。 图片.png
在图 2 内含圆形的正方形 中,正方形边长为4,圆的半径为1。Monte Carlo 仿真就是在这个区域中投点,你可以投飞镖,也可以让计算机模拟投点,只是有要求投的点等可能地出现在方形的任何地方内!根据这个方法,仿真有两个使用方式。 第一种方式:如果投的点足够多(图中蓝色点),我们计算圆内的点 nc,还有总的投的点数量nT,圆的面积可以估计为 Sc = (nc /nT)Ss = 16(nc /nT) ,Ss为方形面积。当然,圆的面积可以由公式 S = πR2 计算,但是当图中圆是没有公式可以计算的异形图像时,用这个方法就可以得到面积了。 第二种方式:如果只投入了一个点(图中橙色点),而它恰巧在圆中,那我们可以知道它这次在圆中的概率为:p = Sc / Ss = π12/42 ≈ 19.63%。由于投点只能在整个方形中,所以,其概率为1. 方形分为两个部分,一个是圆形,一个是方形除去圆后剩余部分。我们可以把投点在方形中的位置与一个随机数X之间建立起一一对应的关系。0<X≤1 。 图片.png
我们在后面进行Monte Carlo 仿真的时候,用的就是第二种方式。 5.2 人口调查表的变形我国人口调查表有18个项目,真实的下表包括全国14亿人,经过简单的描述性统计方法,可以得到性别比、迁移情况、出生率、死亡率、民族结构、总和生育率等多个指标,是非常精细的. 图片.png
上表是2022年的统计数据,要是能预测出2027年5年后的一张相同的表,那就可以得到许多指标了。这个大胆的想法有戏,经过对表 3 一张模拟的原始人口调查表 进行小小的修改,为保护隐私,同时,将相同年龄、相同性别的人假定其生死、迁移等概率都是一样的,于是,去掉个人标识信息,隐藏姓名和身份证号,统一从0号开始从新编辑,得到 表 4 修改后的人口调查表 就可以仿真至2027年。 图片.png
微观模拟模型对家庭人口个体特征分类比较精细,作为预测起点的样本人口规模与抽样比必须足够大!这样才能具有较好的代表性。我国人口的1%样本是1400多万。 按微观模拟方法对数百万成千万个体一个一个地分别就其生育、死亡、婚姻、迁移、离家等各种人口事件做精细的仿真模拟,将用去大量的算力,好在现在算法的优化和硬件的降价解决了这个问题 对表 4 修改后的人口调查表 实现1%等距抽样,抽取编号为0,100,200,300,…的成员,得到一个新的2021年普查数据的1400万条记录的新表 5.3 仿真进行的原理以“死亡”这个属性进行仿真示例。应用的方法为 5.1 节中Monte Carlo仿真的第二种方式,即从一次仿真结果中推断其属于那个类别。表 5 生命表部分内容 为生命表中截取的部分数据。 图片.png
选择第 0 号(原始普查表编号)人员,18岁 6 人口VS自然——社会系统宏观模型6.1 CGE模型6.1.1 CGE模型基本介绍 CGE 模型(Computable General Equilibrium),全称可计算的一般均衡模型,起源于西方经济学中的瓦尔拉斯一般均衡理论,是由抽象的瓦尔拉斯一般均衡理论衍变而成的关于实际经济的数学模型。CGE 模型通常是对一个经济体进行数学上的模拟,从而反映这个经济体是如何通过对商品和要素的数量和价格的调整,实现瓦尔拉斯一般均衡理论所描述的供需平衡。 6.1.2 人口CGE模型 通过连接人口变动模型,拓展居民账户和添加省际调入调出账户将多个地区有机联系构建得到人口CGE模型。 6.1.3 方程具有的模块 通常,CGE模型主要包括三组方程,分别表示供给、需求和均衡关系,形成相应的三个模块,根据研究问题的不同,可以引入更多的主体和研究对象,有更多的模块。这也正体现了CGE模型处理问题的灵活性。 图片.png
图片.png
6.1.4 模型原理图片.png
6.1.5 模型的用处 在国外,CGE模型广泛应用于贸易政策、财政政策和收入分配、环境政策、经济改革、技术,国际商品价格、汇率和利率、工资调整和工会行为、区域发展、粮食政策等领域。 6.2 系统动力学模型7 模型的应用及局限7.1 模型主要作用 https://mp.weixin.qq.com/s/uSHnXmzq4RQdzi54V5butg [[i]] https://new.qq.com/rain/a/20220714A09RYR00 |
|