分享

借着霍金离去,谈谈时空大数据与人工智能 | 独家

 力拔山气盖世v5 2020-03-15

作者:李振宇

编辑:洪月月

卓越的物理学家、宇宙学家、数学家、思想家、哲学家霍金先生,今年3月14日离我们而去,虽极少人能真正理解他的学术成果,但是因其非凡的人生际遇仍备受世人瞩目。霍金到底研究了什么?究其根本就是时空问题,有关时间的起源和空间的边界,以及若干我们还无法理解的东西。

回到我们可爱的地球,回到我们现实的生活,时空是永远无法回避的话题,比如说——时空大数据。一度,“时空大数据”被频繁提及,成为标题党的招牌,炫技的噱头,或者是装旧酒的新瓶。

然而,“时空大数据”究竟是什么,大都默契回避,概因“大数据”无需解释,而“时空”又难以厘清。除了霍金,伟大先哲如老子、牛顿、康德、爱因斯坦,只揭开了时空秘密的一个暗角,就能在人类历史中荣耀至今,可见“时空”之复杂。

借着大师的离世,我们认真的谈一谈“时空大数据”。

1

人工智能、人的智能与时空

不谈人工智能,大数据都显得毫无意义。

谈人工智能,要先谈人的智能。人的智能从哪里来?这是一个悠久的哲学问题。

谈人的智能,就绕不开“时间和空间”。

牛顿的绝对时空观、爱因斯坦的广义相对论、霍金的宇宙大爆炸和时空奇点,虽然都在说时空,但与“时空大数据”关联度较低。谈时空大数据,要从康德的时空观和认识论出发。而谈康德,则要先谈休谟。

经验主义哲学家休谟是个怀疑论者,他认为:人类的知识来源于经验而非理性。经典例子:我们是怎么认知“太阳晒热了石头呢”?我们观察到“太阳晒”,又观察到“石头热”,这两件事情总是先后发生,于是习惯性认为“太阳晒热了石头”,但我们只看到关联而没有看到因果关系,从而,他否定因果律的存在。(神似某些关于大数据的论述,关注关联关系而非因果关系)

这让当时的理性学派陷入恐慌,因果律一旦不存在,科学将是“沙滩上的大楼”。直到10年后,康德的哲学体系成功调和了经验学派和理性学派的矛盾,使科学成为可能。康德认为:人类知识来源于在时空框架内融合感官经验。康德承认,人类的知识来源于经验,而经验来源于感官(感性认识),而时间和空间是感官和经验得以存在的基础架构。

总结一下:人的智能=时空+感官+经验。

人工智能时代话题,传感器代替人的感官,机器学习等同于人的经验,不变的是时空——人工智能=时空+传感器+机器学习。100%的数据都是时空数据,时空之外无数据。

由此可见,时空大数据概念之宏大,超越了具体的数据和应用,狭义上讲,时空大数据是一种时空维度数据融合分析的方法,或称空间智能;广义上讲,时空大数据几乎是人工智能的代名词。

2

人工智能与时空决策

时空是所有智能的“锚点”,近些年最受关注的人工智能:阿尔法狗和自动驾驶,本质上他们都是“时空决策”。

对于阿尔法狗,棋盘的361个交叉点是空间,下棋的顺序就是时间,人工智能计算落子就是“时空决策”的过程;

自动驾驶是更典型的“时空决策”——通过传感器感知特定时间和空间范围内的周边环境,决定采取何种控制措施。与人类的驾驶逻辑相同——多方观察,判断路况,操控车辆。最大的挑战来自于,当越来越多的传感器集成到车身以后,作为大脑的控制系统,如何拥有人脑一样的智能,实时融合这些信息,判断出车辆所处的真实环境。

我们生活在时空当中,几乎所有行为都涉及时空决策,基本问题是“何时、何地、何为”,城市规划、农业种植、军事指挥、物流配送、行车导航、商业智能等等,无一例外都是时空决策问题。

那么,既然所有的决策都是时空决策,这些决策从古至今也在进行着,人工智能时代,会带来哪些变化和挑战?

3

人工智能中的时空融合框架

在人脑中,我们可在时空框架内融合视觉、听觉、触觉,感知周围世界,做出判断,比如驾驶汽车。因为时空框架的存在,“信息孤岛”问题在人脑中并不明显。进入智能时代,传感器替代人的感官,机器学习总结人的经验,解决“信息孤岛”的时空框架在哪里?

人脑的时空框架是与生俱来的“先验直观”,只有造物者知晓其中的秘密;那么,人类创造的计算机世界中,独立的时空框架该如何定义?

智慧的人类发明了历法以标记时间,发明了测绘体系以计算空间,成为人类认知时空的参照和度量体系,但仍未解决基础时空(没有任何对象的时空)的定义问题,在时空参考系中,时间和空间是连续分布的,而连续的数据在计算机中无法明确定义和索引,导致时间和空间难以作为单独的维度进行数据组织、索引和搜索。

适宜的方法是构建一个“基础时空框架”,将连续的时空离散化处理,将时间和空间划分为多级网格,每一个网格有一个固定的编码,并将编码作为时空网格在计算机中的存在形式。

基础时空框架可以成为数据时空化处理、地理实体编码、空间数据仓库、地理信息服务总线和时空决策支持的底层数据组织框架。

时间和空间不是现实世界的一部分,时空信息也不是数据的属性,数据附属于时空才能有意义的存在。在这个意义上,100%的数据都是时空数据。

这将是一个颠覆性的变化——

首先,连续时空被离散化和结构化,时间和空间在计算机中表现为一维编码,可以被方便的排序和搜索,时空搜索和计算效率数倍提高;

其次,所有的数据,只要被赋予一个时间和空间编码,即融入了一个统一的时空框架。类似于每一个公民,出生即获得一个统一的身份证号,即拥有了唯一的时空标识(身份证号也是时空编码:出生地+出生日期+顺序号)。

最后,多源异构数据的快速时空融合成为可能,当所有的数据被赋予统一的时空标签后,根据空间编码,可快速搜索到描述这一空间的所有数据;根据时间编码,可快速搜索同一时间段内发生的所有事件和事物状态;时空数据融合支持决策高效而精准。

时空网格实现了“连续时空离散化、模拟时空数字化、时空数据结构化”的目标。

4

时空网格的前世今生

网格思想并不是今天才出现的,而是一种通用的人类智慧。

中国商朝的统治者发明了“井田制”,将土地分为网格,每九个网格中,有一个网格是公田;工业社会,人们将瓷砖、地毯、吊顶设计成标准的网格规格,方便生产、运输和安装;城市网格化管理也是网格思想的典型体现。

在空间信息领域,网格技术的应用无处不在,地图切片是典型的多级空间网格体系;在GIS中的空间数据引擎(SDE),也是基于网格创建索引的;栅格数据的空间分析,也是标准的网格方法。这些网格与时空大数据中的网格有什么不同呢?

不同之处在于:以上的网格,是依附于数据集的,是局部网格,不同数据集之间的网格体系并不一致;而时空大数据中定义一套统一、独立的网格体系,并将此网格贯穿到时空大数据的索引、搜索、调度和融合分析的全过程。数据调用从面向数据转变为面向网格。

空间网格的研究,在国际地理学界有20年以上的研究历史。2003年,两院院士李德仁提出“空间信息多级网格”理论,并在863和973科研计划中设立专题项目进行深入研究,一直持续至今。

2017年,OGC公布了一个名为DGGS的最新地理信息参考标准,目标是快速整合空间数据,不必考虑投影坐标参考系的问题。OGC DGGS标准工作组联合主席和澳大利亚地质科学院高级顾问Matthew Purss博士说:“DGGS在全球统一框架中将栅格、矢量和点云数据集成在一起,使地理信息行业不用像以前那样考虑“栅格-矢量分割”和使用地图投影等问题,将彻底改变我们对空间信息的认知、使用和可视化”。

总结

时空大数据在人工智能时代具有不可或缺的重要作用,利用时空网格构建基础时空框架,是解决多源异构、时空密集的数据融合问题,支持时空辅助决策的新方法,在智慧城市建设、行业大数据应用方面有广泛的应用空间,同时也是打通GIS、物联网、大数据与人工智能之间广泛联系的通道。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多