分享

词不达意:不是所有计算结果都能叫分析图【2019-015】

 南柯一梦350 2019-03-06


Highlights

1、拼接栅格请务必检查像素深度

2、不同的分类方法欺骗你的眼睛

3、栅格裁剪应留出一些缓冲距

4、坡度分析要注意坐标系单位

5、分析图应充分体现分析的目的性

6、图例一般应覆盖全部的分析内容

7、分析图应力争不失精准美观


嗨~多磨,拖了一周的正篇更新终于出炉了今天和大家分享一些关于制作分析图思考心得。为了让这篇推文的内容更具操作性,这里会以GIS领域可能是最基本的坡度分析为例,展示地形数据获取、加工,以及分析工具运用的基本步骤注意事项,那么闲言少叙,让我们开始吧~已熟知Highlights前四条的同学可以跳至【坡度分析】的图13之后开始阅读)


【推文缘起】

简单聊聊写这篇推文的目的吧,从本科接触GIS以来我注意到一个奇怪的现象,虽然很多设计课要求同学们使用GIS进行一些地形分析和空间分析,但是最终排版的时候分析图却普遍只占很少的图面,评图的时候老师也不怎么看这些分析图,更鲜有老师针对分析的内容进行深度点评。结果呢,往届作业的分析图就成了不明真相的师弟师妹们唯一的参考,各式各样的小问题也就依葫芦画瓢地流传了下来,比如分析图的目的不明确啦、图例不完整或者不准确啦等等。混迹于学术圈之后,对分析图的认识也略有提高,针对前述现象特撰此文与各位同学分享讨论


【数据获取】

今天会用到两个数据源,其一是“地理空间数据云”,用于获取数字高程模型(Digital elevation model,下文均称为DEM),虽然这里也有不少其他遥感数据,不过有些(比如MODIS中国合成产品目录下的资源)似乎已经停止更新,并且一些日期较早的数据无法立即下载,说实话不如USGS(https://earthexplorer./)方便,然而USGS不用梯子的话速度十分感人,先用这个凑合一下啦。数据获取步骤如下,先自行注册一个账号并登录,然后在高级搜索页面点击左上角的数据集按钮,展开DEM数字高程数据列表,勾选GDEMV2数据并确定,在行政区面板上依次选择广东省深圳市并点击搜索按钮(图1)。由于跨越了两个单元,所以两条DEM数据都需要下载下来,压缩包中文件名末尾标注为“dem”的是数据本体,标注为“num”的是质量评估文件(我从来没用过,可能我还不够专业,其他详细说明可以参阅压缩包中的README。


图1 地理空间数据云查询下载DEM

(http://www./search)


其二是“GADM”,用于获取深圳市的政边界,会在本文最后用于裁剪坡度分析的结果。如果你用百度搜索GADM,第一个结果很可能是错的(Firefox会警告不安全的连接正确的结果大约会出现在第二页第三个前后),网址不带“www”的才是官方网站,所以请改用Bing搜索或者用Wikipedia搜索相关词条再跳转官网以实现曲线救国。数据获取步骤如下,在Data页面点击第一段末尾的country,在Country列表里选中China,点击Shapefile即可(图2)。需要注意的是,该网站的列表将港澳台单独列出(政治如此不正确,如果需要的话请逐一下载,更需注意的是,该数据部分有争议的国境线画法有违我国的主张,所以不可用于任何形式的公开发表,本文同样遵守该原则,下文不会有任何图片直接展示该数据。(然而事实上,现在暂无特别方便的官方渠道获得我国县级以上带坐标的行政区矢量数据,所以我也很无奈


图2 GADM按国家下载行政边界

(https:///data.html)


【栅格拼接】

拼接个栅格也值得单独写一段?没错,这里面有个关于像素深度的大坑要提醒同学们注意回避。将两个压缩包中的DEM数据(就是文件名以dem结尾的那个)解压出来,用ArcMap加载好,中间可能会看到衔接的位置颜色不一样(图3),这是因为两张DEM最大值最小值不同,软件默认按各自的最值渲染由黑到白(由低到高)的渐变,当然这不重要,因为只要将二者拼接起来就没问题了。


图3 ArcMap加载DEM数据


ArcMap有两个用于栅格拼接的工具,分别是【数据管理工具】-【栅格】-【栅格数据集】的【镶嵌】和【镶嵌至新栅格】,区别在于【镶嵌】是把A嵌入B,这会导致数据B被修改,【镶嵌到新栅格】则是把A和B嵌入新生成的C,这样可以保持原始数据无变动。为了帮助各位养成不修改原始数据的习惯,推荐使用第二个工具。

无论使用何种工具,都应在镶嵌栅格前查栅格属性,特别是像素深度,原始DEM栅格的像素深度都是单波段16位有符号整型图4),可以存储从-32768到32767之间的数值,而【镶嵌至新栅格】工具默认参数是8位无符号整型,只能存储从0到255之间的数值,所以如果这里不设定正确的参数,则镶嵌结果中超过255的高度都会被标记为255,正确的参数设置可参考图5,错误镶嵌结果的对比见图6(山无棱天地合了


图4 DEM栅格属性


图5 镶嵌至新栅格的参数设置


图6 错误参数镶嵌成了平顶山


使用【镶嵌】工具一般来说就不会有问题了,即使把像素深度大的栅格镶嵌到像素深度小的栅格,工具也会自动提高目标栅格的像素深度来保证结果的正确性,除非你有良好的备份原始数据的习惯,否则还是推荐熟悉一下【镶嵌至新栅格】。


【栅格表达】

在图6中提前展示了一下按颜色分类后的地形图,说到配色,就不得不提符号系统了,几乎所有涉及到分类和配色表达的选项都在其中。符号系统中比较容易被忽略的是分类方法,先看一下不同方法分类结果的对比(图7),再来讨论其应用场景


图7 不同方法分类结果对比


(本段十分枯燥,可能引起不适请选择性阅读或跳至下一段的总结)分类参数的设置依次为相等间隔(20类)、定义的间隔(100m)、自然间断点(20类)、几何间隔(20类)。全部分类方法的解释在ArcGIS帮助的“对分级符号的数字字段进行分类”词条中有非常详尽的描述(http://desktop./zh-cn/arcmap/10.3/map/working-with-layers/classifying-numerical-fields-for-graduated-symbols.htm),这里不再赘述。那么这些分类方式对于我们来说如何选择呢?相等间隔和定义的间隔都属于均匀间隔的分类方法,前者是按一定比例,后者是按一定数值,当要表达的数据可以按比例或者按数值划分为有意义的组别时,可以选用这两种方法,例如,将地级以上城市的GDP按相等间隔分为5类(亦即20%间隔),看看GDP位于最后20%的城市都分布哪些区域,又如,以20m为间隔对DEM数据进行分类,形成类似于等高线的渐变色表达。自然间断点和几何间隔属于非均匀间隔的分类方法,两者都是基于数据分布特征进行分类,当要表达的数据可以按数据特征划分为有意义的组别时,可以选用这两种方法。其中自然间断点分类的各组别具有组内差异性最小组间差异性最大的特点,这啥意思?说白了就是虽然你不知道该怎么分类,但你知道应该分成几个类别的时候,就可以用自然间断点了,比如一个城市各地块的人均收入数据,你想把他们分为低收入、中等收入、高收入三类,但想不清楚怎么确定中断值,就可以用自然间断点先分成三类看看结果;几何间隔分类的各组别所含元素数量的平方和最小,这又有啥用?说白了就是数据越密集的地方分得越细致,可以充分表达数据分布的变化,比如DEM数据就很适合用几何间隔形成配色均匀赏心悦目的底图,我公众号里每期建筑栅格数据的封面也都是用几何间隔分类的。然而,基于数据特征的分类结果是否具有意义,需要相当的判断力才行,几何间隔的分组不一定有实际意义,其最大的特点还是集中体现在详尽的图面表达上(外貌协会发来贺电,自然间断点就更复杂一些,如果数据本身不完整或者严重有偏的话,分组结果的实际意义可能很难解释,还是以地块尺度的收入数据为例,如果拿到的区域其实只覆盖了中等收入和高收入人群,强行分为三个组别的实际意义就可能难以解释(水平有限,仅供参考如有谬误,欢迎指正)

归根结底,如果很清楚分类的中断值(比例或者数值均可),那么就优先尝试前两种,如果只知道分类的数量,那么就优先尝试后两种,如果单纯为了好看,那就几何间隔。另外,更灵活的分类方法是手动分类,后面坡度分析会有例子的。还有,不要忘了图7其实是同一张DEM的不同分类结果,不要被分类方法欺骗了你的眼


【栅格裁剪】

裁剪栅格又有什么讲究呢这套操作中的栅格裁剪目的是减少不必要的运算量(图1可以看到深圳辖区占DEM的面积并不大),由于地形分析是计算每个栅格与其相邻栅格的关系,所以裁剪应在最终输出范围的基础上向外扩展一些距离,以便保证最终输出范围缘处计算结果的正确性。解决办法之一就是用【分析工具】-【邻域分析】-【缓冲区】工具先对最终输出范围生成一个缓冲区,然后在使用【数据管理工具】-【栅格】-【栅格处理】-【裁剪】工具时将缓冲区作为裁剪范围(图8),结果如图9所示。至于沿着边缘裁剪的后果留到坡度分析再看吧,先记着有这么个事儿就可以了


图8 裁剪工具的参数设置


图9 裁剪结果


【坡度分析】

坡度分析看似简单,实则暗藏杀机,步步惊心。打开【3D Analyst 工具】-【栅格表面】-【坡度】工具,将刚才裁剪好的DEM作为输入栅格,设定好输出路径名称,紧接着是第一个坑——单位应该选择PERCENT_RISE,即百分比(图10),该工具的默认单位DEGREE在咱们圈子里并不常用。然后是第二个坑——距离单位,看到那个惊叹了么,鼠标指上去就会弹出非常别扭的描述(不想解释,根本原因在于【坡度】工具要求输入栅格是投影坐标的数据,然而我们输入的是地理坐标(WGS84)的DEM数据,的默认单位是经纬度啊。这里需要点击环境按钮,展开输出坐标系,选择如下面的指定,然后选择一个基于WGS84的投影坐标系即可,这列选用的是EPSG:3857坐标系(图11(不认识这串神秘代码?可以翻翻公众号的原初之作【2018-001】和【2018-003】),这时再回到【坡度】工具点击确定即可得到图12,如果假装没看见惊叹号恐怕会得到图13醉翁之意不在图,在乎图例之间也。


图10 坡度工具的参数设置


图11 在环境设置中修改输出坐标系


图12 正确的坡度计算结果


图13 错误的坡度计算结果


请仔细观察图12和图13的图名,再回忆回忆推文标题,其实截至目前得到的坡度栅格仅仅是计算结果,尚不能称之为分析图(然而把这个叫做分析图并明目张胆排版到作业上的同学不在少数分析图得有明确的目的性,坡度分析也不例外,要赋予这张坡度栅格以神圣的目的,最基本的操作就是调整符号系统的分类了(前面栅格表达那一节连篇的废话终于用上了,根据《城乡建设用地竖向规划规范》CJJ83-2016,城乡主要建设用地适宜规划坡度有这么几个最大值,分别是2、5、8、10、20、25,赶紧进入坡度栅格的符号系统,点击已分类,点击分类按钮,先将类别改为7(一旦开始手动修改中断值就不能修改分类数量了),然后将中断值逐一改为前述的6个数值即可(图14),此时得到的坡度栅格基本可以成为坡度分了(图15),更具体地说是城乡主要建设用地适宜规划坡度分析,不同的颜色各代表一个有针对性的坡度区间,可与规范中的用地类别相互对应。


图14 坡度栅格分类的参数设置


图15 姑且算是及格的坡度分析图


显然这个图不够美观,所以我们还要略微加工一下,用GADM的深圳市辖区轮廓线作为裁剪范围,对坡度栅格进行裁剪,注意勾选使用输入要素裁剪几何图16),符号系统按前述方式设置后即可得到图17


图16 按几何形状裁剪的参数设置


图17 稍微美观一点儿的坡度分析图


能不能让这张分析图锦上添花呢,这个事儿要特别慎,最常见的一种处理方法——叠图,这可能不总是一个好主意。假设我们把一张透明度为60%的OpenStreetMap底图叠加上去(图18)……很遗憾,现在这张图又不及格了。叠图(无论是坡度栅格透明还是别的图层透明)都会导致颜色的偏差,严格意义上,图例上的颜色要与图纸对应内容的颜色完全一致,叠图显然破坏了图例的准确性(但确实能好看不少)。那么更好的办法是将想要强调的坡度区间利用重分类单独赋值,再将其他必备要素叠加上去,由于篇幅所限不再展开,直接看结果吧(图19)。这里叠加了一个深圳市建筑物数据(给自己打一波广告【2019-014】数据请随意取用),用来对比已建建筑的分地形的关系,虽然由于地形数据的分辨率以及制作年代使得二者之间有些奇怪的叠加冲突,但整体上的关系还算是清楚的,还有哪里或许可以建设基本上也一目了然。


图18 跌破及格线的坡度分析图


图19 锦上添了点儿花的坡度分析图

(为了更好的说明问题放大了比例

(ArcGIS的默认配色用透明度也救不了


最后还要补充一点,那就是图例的完整性,除了一眼就能认出是用来衬底的背景之外,凡是在图面上有所表达的要素都应有其对应的图例名称,用ArcMap出图还要注意一下图例的顺序,万一不小心把建筑轮廓线挪到了下面,那这个分析图就还得补考了(图20)。


图20 看出图例哪儿不对劲儿了么


【后记】

作为本科开始图面表达就不怎么讨人喜欢的学生,早早就脱离了制图美学的康庄大道,走上了数据分析的不归路,追求不失精准美观这么艰巨的任务就交给在座的各位啦革命尚未成功,鄙人也仍须努力

【全文4882字,撰文耗时11h25m】

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多