分享

百度慧眼:大数据识别商圈取得突破

 燕子地理图书馆 2019-08-01

一提起商圈,大家脑海里想到的会是北京三里屯、国贸、上海徐家汇、外滩之类的地方,这些地方与行政区域不同,它们不是由政府划分而成,而是受经济活动影响逐渐演变而成。同时商圈形成之后,又会成为商家进行各项商业活动的重要参考。比如某个品牌要新进入某个城市,第一步就是先汇总当前城市的商圈,快速选择城市核心地段;再比如,O2O公司在划分城市片区时也需要参考商圈来进行。除此之外,商圈还为物业定价、经营决策、商业推广等提供决策支持。也因为商圈如此重要,目前各类APP也纷纷将商圈作为基础的位置分类指标。图一是商圈常见的使用方式。

图一,商圈常见使用方式(上图为糯米APP,下图为携程网站)

但是由于商圈是受人口、空间影响演化而成,缺少统一标准,故尽管各家都在使用商圈,但是对这份数据却缺乏科学、准确的认知。无论是商圈的边界范围抑或是对商圈的定位、描述,更多的还是由人为主观决定。而百度慧眼利用其丰富的地理数据、位置数据、交通大数据及人群画像等数据,结合其强大的分析、挖掘能力,自产一份商圈数据(见图二),这份数据除了不受主观影响外,还具有可实时更新的特点,更好地来满足商业及政府领域的应用。以下详细揭秘慧眼商圈的识别过程。


图二为慧眼产出的北京四环里的商圈

1.商圈概念

识别商圈最最核心的部分是明确商圈概念,即首先需要明确定义出符合什么条件的位置才算是商圈。现在主流的商圈分类包括如下三种:第一种是相对狭义的商圈,即商场、超市或零售店面会以自身位置为核心,向外扩展几千米作为商圈,这类商圈也叫零售商圈,主要满足商家自身经营需要,见图三;第二种是将城市大型购物中心作为城市商圈,这类商圈主要以购物中心命名;第三种则是将具有聚客能力的位置,如购物中心、地铁站、知名居住小区等作为城市商圈,目前业内通用的便是该类商圈,见图一。百度慧眼产品中的商圈概念与第三种类型类似,即认为聚客能力强的位置才可能是商圈,但是又同时增加了对位置属性的界定,即认为具有消费特征的位置才算商业领域认定的商圈,这样类似纯地铁站这种高客流聚集但是又不产出交易行为的位置便不算商圈。


图三、零售商圈

2.商圈数据源

明确商圈概念后,下一步就是选择准确、可靠的数据源作为商圈自动识别的输入项。目前商圈使用到的数据包括:海量位置数据、生活服务类POI(Point of Interest,翻译为兴趣点,指现实世界中的点状地物,如麦当劳、星巴克等在地图上的映射、人群画像、行为数据及地图面状数据等,目前百度地图日提供位置请求服务超过300亿见图四;生活服务类POI是指与人吃喝玩乐相关的POI,如购物中心、饭店、酒店、KTV等,该类型POI量目前有2000万以上,POI反映现实世界真实地物,同一区域存在的多类型POI可反映当前区域业态,竞争态势等,是商业分析核心数据;人群画像、行为数据包括用户性别、年龄、来源、兴趣爱好及线上检索、浏览等行为;地图面状数据是指小区、写字楼、高校等的边界数据,见图六。

图四 海量定位数据

图五 海量POI数据

图六 北京居住小区、高校面数据

2.商圈数据源

在如上数据源中,海量位置数据用于初步判断聚客位置,通过选择合理时间段的位置数据,辅以人群画像、行为、底图面数据等,过滤出一批质量较高的聚集点。之后辅以生活类POI分布,通过给不同类型POI赋不同权重,再过滤一遍聚客点,最后通过策略指定及挖掘算法完成商圈的边界识别。目前产出的商圈边界尚未与路网进行叠加,后续会将商圈边界与路网绑定,产出一份可读性更好的商圈边界。

以北京商圈产出过程为例,经过位置数据、人群画像、面数据等第一次过滤得到的局部热力区域见图七,过滤的阈值根据位置人流热度排序选择。可以看到类似图七里的地铁站沿线(如5号线、1号线等)、火车站、机场、小的邻村市场均属于客流较高区域。之后基于图七的热力区域结果结合消费类POI用户点击、搜索的热度进行排序,过滤掉纯客流聚集地区域,得到北京市商圈见图八。

图七 北京地区热力区域

图八 北京地区商圈截图

截下来来验证北辰、北京西站和回南路商圈,前两个为过滤后商圈,最后一个为被过滤掉的商圈,数据对比见下表,通过图表可知,北辰和北京西站确实优于回南路。 


商圈边界产出后,下一步就需要对商圈进行命名。在这个环节,可以采用人工标注的方法进行,这个方法的缺点是对陌生城市进行标注时效率较低。目前采用对方法是与现在已有的商圈做比对,对匹配不上的再进行人工标注。北京市部分商圈边界及命名见下图。


图九  带名称标注的商圈

至此,商圈自动识别的过程便已结束,后续会对商圈的属性进行定义、打分及分级,请大家继续关注后续文章。

百度慧眼专注于商业与人口大数据研究,用数据量化地理位置的商业价值,助力实体商业。如果你有商业研究问题,面临数据获取困惑,欢迎与我们联系。

联系邮箱:huiyan@baidu.com

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多