分享

基于LBSN数据的全国人口分布与流动研究(流动分析篇)│前沿

 燕子地理图书馆 2018-07-09



由于前文(基于LBSN数据的全国人口分布与流动研究(城市群篇))关于城市群研究的工作,在去年的城市规划年会中尚余一部分工作没有介绍,在这里先做一定的补充介绍。特别是针对“城市群”这一概念而言,还有一种分析的思路,在这里写出来以供大家思考。既然已获得了较为精细的行政单元之间的人口流动数据,那么究竟具体该如何去从人口流动的角度去理解“城市群”呢?围绕这一问题的学术研究应该有不少,这里不做展开,但总的说来,城市群似乎应该有个边界,以便看做一个整体,而以这个边界为准其内部的流动联系应该非常紧密。


是这样简单么?这样思考就已经很简单了么?那么,流量达到多少才是算紧密呢?城市群的“内”和“外”在人口流动上又有何区别呢?城市群和城市群在流量上是不是应该有相似的模式呢?这一连串的问题在深入思考之后有可能并不是更清晰,而是变得更模糊。为了回答这些问题,不妨先假定一批“城市簇群”进行初步分析,并通过观察将这些较为模糊概念转变得具体一些。如下图,本文在这里任取一类城市簇群划分的样式进行展示(本划分方案仅供参考)。




记得同济大学的王德教授曾说过,优质的数据事实上并不需要特别的计算加工,通常就可以反映出一定的特征。诚如王老师所言,或者也可以更呆板一些的理解是,良好的数据可以实现直接用肉眼进行“非监督学习”,因为样本单元一共也就19个,这里我们不妨尝试一次人工的“非监督学习”。就人口流动而言,针对每一个“城市群”地域的划分,均可有流入、流出、以及内部流动3个统计数据。而考虑到本次研究的分析数据对象有4种时段:工作日、周末、黄金周、以及春节(当然前提是这四个时段均以等长时间统计,便于比较),故在城市簇群之间可存在不同维度的比较分析。


若以工作日时段作为基准时段分析,针对上述19个划分出来的城市簇群,他们的流入、流出、内部流动的量化指标分别为(如图所示):


如图从这19个单元之间的差异,至少可看出以下两个特征:


1)从整体体量上看,京津冀、长三角、珠三角、长江中游、海峡西岸、成渝、中原等地区的流动量级较其他地区更大。尤其在内部流动上,长三角地区明显高于其他地区。


2)各单元中的流入、流出量的差异不大,而内部流动的数值与这两个指标的差异较大。部分单元如京津冀、长三角、长江中游、成渝、中原等区域中的内部流动接近与流入、流出的平均值的两倍。但在其他单元,内部流动量并不大。


但是,在整个柱状图中有一处地方很“不和谐”。那便是在珠江三角洲地区,其内部流动甚至出现了低于流入流出量的这一现象,对比与京津冀和长三角地区,这似乎有违常识。当我们再回过头来观察这一现象时,不难发现,这应该是由单元划分所导致的。如果将广东省内其他离珠三角较远的地区纳入这一“城市簇群”,才更为合理,至少在内部流动强度上不应该低于流入与流出量。更进一步,其实这种“不和谐”有些类似于美国的Gerrymandering,有兴趣的朋友可以去wiki查一下。



写到这里,当我们再回想起这一过程,似乎可以归纳一个简单的发现:在发育成熟度较高的城市簇群中,流入流出量大体相当,说明这是一个基数较为稳定的空间地域单元,而在其内部的流动强度则会非常活跃,其流动量可以接近流入流出量均值的2倍左右。当然这一判断并非严谨的学术证明,这个倍数的大小也与划分范围、统计流量口径有直接关系。


带着这个明显的“划分问题”,我们可以进一步从整体上进行观察。其实上述的这种关系结构在其他的几个时段也有不同的。


周末时段,整体上与工作日的呈现相当近似。但是在流动活跃度上较工作日有一定的增加,这也符合人们在周末期间拥有更宽裕的时间规划更多出行的习惯。





而在国庆时间段,我们发现在经济较为发达的地区,出游率大幅度提升,尤其在长三角与珠三角地区。而春节返乡潮的特殊时段,这两个地区则更是喷涌而出,同时长江中游、成渝等地则流入的人更多。


这种在不同时段上流入与流出关系的对比,也可以用如下的图表来显示。我们将全部19个城市簇群单元plot至二维平面上,Y轴表示流出人口量,X轴表示流入人口,圆圈自身代表内部流动量大小,则可以得到四个时段的另一张图。不难发现,流入流出量接近的这一规律仅在工作日时段较为合理,而在其他时段则越来越离散。只需要肉眼就可以看出,离散程度上:春节>国庆>周末>工作日(从左到右依次为工作日、周末、国庆、春节)。



这似乎是个有趣的观察视角,所以我们更进一步地将每一个单元所属的四种类型逐一plot出来进行观察,以下举出几例。




上图中蓝色代表长三角,绿色代表珠三角,红色代表京津冀,从之前的介绍中,我们知道随着时间的推移,每个城市簇群的流动活跃度都在递增,所以不难理解在每幅图中,最靠近原点位置的圆圈指代工作日时段,而由此向外延伸的三个圆圈分别指代周末、国庆、春节等三个时段。有趣的是,尽管珠三角的边界划分上存在一定的问题,但在这里,这种明显的差异性由于将内部流动划入圆圈大小之后被削弱了。转而我们可以更聚焦于时间跨度上每个单元的“膨胀性”。从这一点而言,长三角与珠三角相当近似,他们在不同时间段的“膨胀性”非常显著,这或许可以成为一个不错的衡量指标。这两个单元在国庆、春节的时候流出人口急剧膨胀,而内部的流动量在国庆时略微增加、春节时段骤然缩小。较为合理的解释是,在以旅游为主要目的国庆时段,这两个地区仍然具有很强的吸引力,使得流入人口甚至略大于流出人口,但在以劳动力返乡为主的春节,则反映出这两个地区均大大吸聚外部劳动力。再一次,我们看到京津冀地区似乎在规律上也符合上述分析,只是在“膨胀性”、吸聚力上,远不及另外两个单元。



不妨再来看一下另外两个例子,成渝的情况在前三个时段与前文都很类似,但唯独在春运的那个圆圈却“掉了下来”。更夸张的是在长江中游这个城市簇群单元,他的整个扩展轨迹在图面上是一路朝着右下发展的,其春节的流入量甚至是流出量的3倍。劳动力的输入输出还是相对较为明显的。


总之,当我们将所有19个单元的这些图整合起来,就可以不难发现有三种形态:输出型、均衡型、输入型。


更进一步的问题是,我们如何知道这些输入输出主要的目的地是哪里呢?尤其在周末、国庆的相对流向并不是很明显的情况下,如果要回答一个看起来更简单的问题时反而有些费劲:“人们节假日主要都去哪儿?”确实有不少的景区报告以及各类出游大数据的分析,但当我们打算自己处理这一问题时却发现存在一定的难度。相比较而言,我们并没有采用逐一用周末、国庆日、春节的人口密度减去作为标准参考的工作日的人口密度,即可以找出那些平日里人们不常去的地方。因为这一问题的潜在逻辑是“人们不在大城市待着的话会选择去哪儿?”因此我们更关心那些平时吸引力不高但在节假日激增的地方,因此我们依然选择用流动量作为研究分析对象,而不是人口分布量。


于是,当我们把目标转而投向寻找那些在节假日流入量猛增的地方时,我们似乎找到了一个有趣的结果。我们提取了所有在节假日时段流入人口量增加比例最高的前50位地区,并将其人口的主要来源地进行了标示之后,结果与印象中模糊的概念开始吻合起来。



周末时段中,流入量激增的地区主要分布在山东半岛地区、长三角靠西南以及北部地区、四川西部、东南沿海地区、以及小部分的中原、长江中游、以及京津周边地区。就出行而言,这些地区的主要流入来源也大多就近来自于大城市,而且围绕各自的核心城市形成一定的“周末出游”分布图,比如长三角、山东半岛、以及四川等地。当然也有些地区出游得相对“出格”一些,比如珠三角等地。



而在国庆时段中,流入量激增的地区的分布则呈现出远离城市群地区的特征,同时分布也更加分散。除了集中在四川西部、长白山地区以外、江西地区、部分的内陆地区之外,也出现了内蒙、青海等地区。这些地区的人流来源也更为丰富。这在很大程度上体现出了不同城市群地区的人群在国庆期间的出游偏好:比如京津地区倾向于内蒙地区的出行,而江浙沪一带则倾向于江西、安徽等地,珠三角地区则更趋于前往湖南。



春节时段内人口流动增幅比前50位的地区则分布较为集中。主要分布在长江中游地区、以及海峡西岸西侧的部分地区。这张图也与上一次发布的文中基于分布数据所得的内部内陆地区劳动力缺失猜测相对应。


以上便是上一次发布内容的补充。人口流动数据有很多的观察面,而多数的情况下如果直观的肉眼观测所得到的规律和特征往往也易于用数据指标去量化,反之亦然。



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多