分享

周永章:地质大数据分析的若干工具与应用

 新用户21158657 2020-07-09

地质大数据分析无疑是大数据时代地质学研究方法革新的重要课题。最近两年,国际数学地球科学协会、国际数字地球学会、中国矿物岩石地球化学学会大数据与数学地球科学专业委员会以及中国地质学会数学地质与地学信息专业委员会的每年年会都有专题和较大篇幅的主题报告涉及地质大数据分析,国内重要学术刊物如《岩石学报》、《地学前缘》、《地质通报》纷纷出版专辑介绍地质大数据分析领域的研究成果,还出版了专门的学术著作(周永章等,2018c)。

在科学发展史上,人类经历过四次重要的范式变革:第一范式的核心是归纳法;第二范式的核心是以理性演绎法为主;第三范式主要针对复杂性系统进行模拟;第四范式就是以对大数据有效分析为特征。大数据技术,包括海量数据获取技术、存储技术、计算技术,分析技术和数据可视化,成为当前第四范式的主要工具。

从宏观层面来看,大数据是一种思维和认知论的革命,它将开启一次重大的时代转型。传统的研究主要依靠有限的调研,再加上经验,然后实现事物和业务决策的判断。然而,随着技术革新,社会的快速发展经常导致我们的经验往往跟不上事物的发展变化。大数据可以全方位地呈现事物的发展轨迹,并能呈现事物实时动态的发展变化,甚至可以呈现事物各种因素之间的相关关系,找到影响事物的关键因素,进而控制事物的未来发展趋势,作出最正确的业务判断和业务决策。在大数据时代,人类的思维方式必然会产生革命性的变革。

大数据挖掘特别适合于窥探具有多维性和全面性的现实世界,它可以从很多看似支离破碎的信息中复原一个事物的全貌,进而能够预测或判断出尚未观察到的现象。相关性思维作为大数据的核心思维之一,与基于普遍联系的哲学思维不谋而合。利用大数据方法把影响事物的相关因素找出来,就能够透过现象抓住事物的本质和规律,把握事物的发展和变化。

大数据本质上是高维数据,因此对高维数据的处理变成大数据挖掘技术的最重要基石(图1)。

图1 高维数据处理的基本框架(据Leskovec et al.,2016修改)

地质学作为一门典型数据密集型学科,在大数据时代,正面临着前所未有的挑战与机遇。大数据正在引发地质学领域一场深刻的革命,地质学家需要改变传统思维模式,拥抱大数据时代的到来。

基于上述分析,《大地构造与成矿学》在2020年第2期集中发表一批地质大数据挖掘(含机器学习、智能地质学)技术应用的成果,促进地质大数据分析应用往纵深方向发展。本文介绍了若干个地质大数据分析工具,其中部分已在地质大数据分析中得到有效应用,部分还需更深入的应用研究,积累更多的研究案例。

1


知识图谱

知识图谱、演化算法、图形社区发现、机器学习与卷积神经网络模型、遥感大数据技术、地质大数据研究的支撑系统等都是地质大数据分析的有力工具,并已获得实际应用。

知识图谱是一个知识库,它描述真实世界中存在的各种实体或概念及其关系,是一张巨大的语义网络图。知识图谱的构建技术通常包含信息抽取、信息融合和知识加工三个过程。随着人工智能的技术发展和应用,知识图谱逐渐成为关键技术之一,现已被广泛应用于智能搜索、智能问答、个性化推荐等领域。

图2 土壤污染知识图谱构建方法

2

演化算法

演化算法是一种基于种群的元启发式最优化算法,已成为地质大数据挖掘中一个重要应用方向。它可以用来精确地获取大数据中隐含的演化趋势与时空特征。

3


图形社区发现

社区结构是地质复杂网络中普遍存在的现象。图形社区发现技术可以用来识别社区结构,分析整个网络的结构和功能、预测网络各元素间的交互关系具有诸多应用,例如地震预报、地质网络分析、特殊地质现象识别、矿床预测等。

4

机器学习与卷积神经网络模型

机器学习与卷积神经网络模型是当今地质大数据挖掘的重要方向。它已成功应用矿物岩石自动识别、构造环境智能判别、找矿靶区智能预测等研究。

5

遥感大数据技术

遥感技术是地质数据获得的主要技术手段。分布式集群化存储技术、多源异构数据关联分析技术、面向数据密集型应用的高性能计算技术无论从深度还是广度都有力地促进了遥感大数据的信息挖掘。遥感大数据智能处理和数据挖掘是遥感数据最大化利用的焦点。

6

地质大数据研究的支撑系统

选择恰当的支撑系统,包括数据框架在地质大数据研究中是至关重要的。基于大数据的城市土壤污染智能监测、模拟、管控与预警研究的目标在建立基于中山大学“天河二号”超算平台的土壤污染大数据研究支撑系统。它采用层次式体系结构来开发支撑平台,将系统任务进行层次划分,使得系统中的每一层实现其对应功能,层与层之间又能相互隐藏,简化编程难度。

图3 城市土壤污染大数据支撑系统框架图

图4 多源异构地质信息的深度融合

这些地质大数据分析方法已有成功的应用案例,并将广泛用于各种地质研究,如城市土壤污染智能监测、模拟、管控与预警研究,得益于地质大数据研究支撑系统的恰当选择,以及地质大数据技术的强力支持,建立了可解释的多源多层城市土壤污染知识图谱,源于多源异构大数据有效融合的主要障碍正在去除。

本文来源:周永章,陈川,张旗,王功文,肖凡,沈文杰,卞静,王亚,杨威,焦守涛,刘艳鹏,韩枫.地质大数据分析的若干工具与应用[J].大地构造与成矿学,2020,44(02):173-182.


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多