分享

讲座笔记——张平文院士网络报告《数据科学融通应用数学》

 小朱的读书笔记 2021-11-25

笔者昨天下午3:00~4:30在Zoom平台听了张平文院士报告,特整理一些笔记于此,并且辅以自身观点于内.如若侵权责删.

报告人简介:张平文院士,任北京大学副校长职务,担任大数据分析与应用技术国家工程实验室主任等。

张平文院士的这场网络报告是中国工业与应用数学学会举办的网络科普报告系列的首场报告,所报告的题目是:数据科学融通应用数学.从报告的内容来看,张平文院士主要是从以下四个方面展开的:

  • 应用数学的历史和现状;
  • 数据科学(介绍数据科学的内涵与自身困惑);
  • 数据科学融通应用数学;
  • 机遇在哪里.


笔者在此不打算将张院士的报告PPT内容完完全全照搬下来,这体现不出所作笔记的真正价值。其实,昨天的报告部分内容和观点我之前在同济致远楼报告厅听过,那天是2019年11月24日,是同济数学院成立"智能计算与应用"数学中心之日。

第一部分:应用数学的历史与现状

张院士先在报告中指出数学研究方向开始逐步细化的不争事实,数学分为基础数学和应用数学,具体分类如下:

基础数学代数+几何+分析
应用数学概率统计+运筹优化+计算数学+控制运筹

随后,张院士介绍了应用数学的价值观,分为三点:

  • 简洁与美(理论)
  • 科学意义(交叉)
  • 经济与社会价值(落地)

(笔者注:此处笔者的理解是应用数学依托于基础数学理论,而基础数学自带的公式和结果优美之处更是不言而喻的,比如欧拉公式就是最好的证明.应用数学英文翻译为Applied mathematics,因此它必然是要能够"接地气"的.纯数学理论在世人面前遥遥在上高不可攀,而“落地能够带来一定经济和社会价值的就是Applied mathematics.问题的关键来了,如何让数学实现落地?那么这个时候就有必要进行学科交叉,体现出数学的科学意义.)

值得注意的是,我国应用数学的现状之一是学科分散.笔者自身是做偏微分方程(Partial  differential equation)方向的,隶属于应用数学范畴.与应用数学有联系的数学分支,还有统计、计算、优化、图论和组合.

第二部分:数据科学

本场报告的题目既然是"数据科学融通应用数学",因此在第一部分介绍完应用数学,那么第二部分自然是探讨数据科学的内涵以及自身蕴含的问题了.张平文院士在这部分报告内容先以新一代信息技术为切入点,指出了以下两个要点:

  • 数学是新一代信息技术的基础;
  • 新一代信息技术催生了数据科学.

由此,数学与数据科学的关联就比较清晰明了了.然而,随着人们通过对数据的分析来获取价值,由此演变为数据科学,那么一个自然的问题出现了:数据科学到底应该划分为哪一个方向?谈到这个问题,笔者想起来上学期选修过的"计量经济学"课程.当时看教材时,教材主编认为计量经济学并非隶属于数学而应该归于经济学,而在课上老师指出计量经济学应该是经济理论、统计学和数学的结合.而关于数据科学,张院士也从三个可能方向(统计学、计算机和数学)给出自己的理解.

  • 统计学
  • 计算机(机器学习、人工智能)
  • 数学(优化、计算)

数据科学作为一门新兴学科,是典型的交叉学科,涉及的门类较为广泛.在报告中,张院士指出数据科学的核心是:算法、模型、数学理论.并且,数据和科学可以按照各自的方法互相研究.笔者在此处还不是很能理解,一来对算法不是很敏感,二来流行的数据分析等modern的内容不太清楚.

关于数据科学的困惑之处,张院士指出其中一点:数据科学的独特性还不清晰.并且,张院士举了一个例子:深度学习的可解释性? 这个地方就涉及到深度学习(deep learning)的内容了,笔者依旧是懵逼的.

第三部分:数据科学融通应用数学

在这部分,张平文院士主要谈到了数据科学之于应用数学的四点:
(1)融通应用数学;
(2)极大地拓展了应用数学的舞台;
(3)应用数学落地的途径;
(4)应用数学教育.

首先,张院士认为数据科学促进了应用数学不同的交流和协同发展,比如概率论、优化、统计和计算.其次,原先的应用数学活动的舞台是基于物理的自然科学的,诸如流体和材料领域无一不需要数学,而新时代里的生物、工程、经济等等都需要数据科学作为支撑,故而可以想见应用数学触角所能伸及之处更为深远了.

然而在第三点内容上,张院士总结出数据科学是应用数学落地的重要途径:(1)数据科学各行各业均需要.伴随大量数据产生,数据科学存在就很有必要;(2)数据科学的起点不高;(3)数据科学适合人们创新创业.

从应用数学教育层面来看,以往学生从应用数学系毕业后或进高校、或进金融机构、或进中小学等入职,然现如今数据科学对学生的吸引力足够之强,因而对于应用数学系学生来说就业面也比以前宽广了.

第四部分:机遇在哪里?

(这部分由于笔者记得过少,后期又由于直播平台的问题,因而只能分享一点内容.)

张院士从数据科学研究人员的角度出发,指出了需要具备的基础理论是:离散几何离散拓扑图论与组合.其实细心的读者想必会注意到,所列的基础理论均是涉及"离散"的问题.而像基础数学里面的"分析"分支则是探讨"连续"问题,因为研究对象针对的是函数.

而针对的算法和模型部分,张院士列出了以下要点:
(1)机器学习特别是深度学习的数学理论;
(2)知识图谱;
(3)新型算法;
(4)机理与数据融合模型与算法.


者所内容到这结束,只是此处仍然意犹未尽.不论时代赋予我们的机遇现在何处,而个人能否抓住又是另外一个问题.在未知晓答案之前,做好充分的准备才是上上之策.

机遇只偏爱那些有准备的头脑的人。——巴斯德

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多