卢萌, 国内空间大数据先驱者之一,Esri中国大数据首席架构师,主要研究专业空间分析统计以及空间大数据挖掘的研究与应用,同时致力于对外传播地理价值,以及在GIS界对大数据与数据挖掘技术进行推广与普及。 目前在个人技术博客和公众号(虾神daxialu)编写连载了国内第一套空间统计的系列入门简介《白话空间统计》,在互联网上的阅读量超过了200万人次。 本文是今年1月份去武汉参加社会计算会议的时候,应约在武汉大学GeoScienceCafe 论坛上面做的主题报告《空间数据挖掘与空间大数据的探索与思考》的讲话录音整理稿,另外虾神配合着PPT又重新编写了部分内容,形成了整个文稿,会以系列文章的形式发出,敬请期待。 以下是空间数据挖掘与空间大数据的探索与思考① 美国科学院院士,世界空间计量界顶级专家:luc anselin教授 今天我所作报告的题目是《空间数据挖掘与空间大数据》,看到这个题目很多同学可能会想:又来了一个忽悠大数据的……但是我讲述的大数据可能与你们常规接触到的有所不同。 首先我们从数据挖掘说起,在数据分析领域有这样一个传奇的故事,叫做啤酒与尿布,是说沃尔玛把啤酒和尿布放一块会提高销量,当年,虾神还是一个小白码农,入门数据挖掘的时候对此也深信不疑。
那么数据挖掘是什么呢?实际上数据挖掘并非是我们想的那些神奇神秘而且高大上的魔法,它的最终目的是直指核心——把数据背后想表达的内容翻到台面上来。这是一句出自Netflix(美国制作电视剧《纸牌屋》的出版商)的话——公司真正的价值观和那些动听的表态完全相反,它们具体通过哪些人被奖励、被提升、被解雇来体现。所以我们经常看到有很多公司将以人为本挂在门口,结果发现其互联网跳槽率排名第一;有些标榜诚信第一,或者正直善良、重视人才、尊重个性,如果把这些显目的标语当成是这些公司的标榜的企业文化,可能就会出现贴着尊重个性标语的公司要求大家上班全部穿白加黑;而所谓以人为本的公司晚上九点钟灯火通明,所以其实这些标语都没用,我们如果真的想明白他们的企业文化,只需要看这些公司去年的优秀员工是谁,为什么被评为优秀员工,就可以知道公司的真正价值。
那么空间数据挖掘的用处有哪些呢?我们知道公交车里外都贴了广告,如果这趟公交能被越多的人看到,那么广告的投放价值就越高;不同时间段发车所影响的受众也有所区别,比如早高峰或者早高峰之后、中午、以及晚高峰和半夜。这样来说我们是不是可以根据“在行驶过程中所影响的人群”来不同地定义它的广告价位呢?在早高峰发出的几辆车,它的广告价位是不是就可以适当调高一点,这是最朴素的一种空间数据挖掘的直观表现,还有更多的一些表现形式。
我们再来看一下全球港口航运,根据最新的统计数据,2015年全球的集装箱制造量多达三亿个,集装箱通常使用一次之后就被扔掉了,造成了很大浪费。所以现在国际航运界计划了一个项目,就是通过全球范围内的调度,在一些不那么热门的航线上运输这些集装箱,并将其重新利用起来,这也是空间数据挖掘正想解决的问题。
空间数据挖掘回归本源是地理分析。 首先地理分析给予了一个关于世界的独特视角,曾有人开玩笑说学GIS的人为什么老迷路,原因可能是学GIS的通常是从上往下看地球,每天悬浮在300米的高空像神一样俯视着大地,把这些人放到地面上平视就会迷路了。
【来源:虾神daxialu】 |
|