分享

数据密集型科学

 求是1025 2023-04-01 发布于山东

“范式”(paradigm)源自希腊词“Paradeig-ma”,意指“模范”或“模型”。由美国科学史家、科学哲学家T.S.库恩(Thomas Samuel Kuhn,1922~1996)于1962年在《科学革命的结构》中提出,指科学家团体所共同遵从的思维和行为方式,体现了某个科学发展阶段的特殊内在结构,并随着科学的发展而变化:几千年前,为描述自然现象的经验或实验科学范式,即第一范式;几百年前,为利用归纳法和数学模型进行理论科学研究的第二范式;几十年前,为利用计算科学来模拟复杂现象的第三范式。

在数据爆炸性增长和大数据技术蓬勃发展的当代,美国资讯工程学家J.M.格雷(James Nicholas Gray,1944~ )在2007年提出了基于科学大数据来进行科学研究的第四范式——数据密集型范式。其研究特点是:数据由设备抓取或由模拟器/传感器产生,数据依靠专门软件得到处理,信息或知识利用计算机网络进行组织、存储和分享,科学发现依赖机器学习或人工智能进行。

天文学是最早采用数据密集型科学的学科之一,因其具有天然的数据驱动特征,例如:斯隆数字巡天(Sloan Digital Sky Survey; SDSS)最新的第16批公开释放数据(DR16)的数据量达到了273TB;中国的天眼工程(Five-hundred-meter Aperture Spherical Telescope; FAST)每天都在产生PB级别的数据,并配套专门的高性能计算和大数据存储中心以支持其数据处理、存储和分析。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多