作者 | zone7 责编 | 郭芮 最近各大一二线城市的房租都有上涨,究竟整体上涨到什么程度呢?我们也不得而知,于是乎笔者为了一探究竟,便用 Python 爬取了房某下的深圳租房数据。以下是本次的样本数据: 除去【不限】的数据(因为可能会与后面重叠),总数据量为 16971 ,其中后半部分地区数据量偏少,是由于该区房源确实不足。 因此,此次调查也并非非常准确,权且当个娱乐项目,供大家观赏。 统计结果 我们且先看统计结果,然后再看技术分析。深圳房源分布如下,按区划分的话,其中福田与南山的房源分布是最多的。但这两块地的房租十分不菲。 房租单价即 1 平方米 1 个月的价格。方块越大,代表价格越高: 房租单价:平方米/月 可以看出福田与南山独占鳌头,分别是 114.874 与 113.483 ,是其他地区的几倍。如果以福田 20 平方的房间为例算一下每个月的开销: 福田 20 平方房间的租金: 114.874 x 20 = 2297.48 再来个两百的水电、物业: 2297.48 + 200 = 2497.48 我们节俭一点来算的话,每天早餐 10 块,中午 25 块,晚饭 25 块: 2497.48 + 60 x 30 = 4297.48 是的,仅仅是活下来就需要 3997.48 块。隔断时间下个馆子,每个月买些衣服,交通费,谈个女朋友,与女朋友出去逛街,妥妥滴加个 3500: 4297.48 + 3500 = 7697.48 给爸妈一人一千: 7697.48 + 2000 = 9697.48 月薪一万妥妥变成了月光族。 租房单价:平方米/日 如果在乡下没有寸土寸金的感觉,那么可以到北上广深体验一下,福田区每平方米每天需要 3.829 元。 户型方面主要以 3 室 2 厅与 2 室 2 厅为主。与小伙伴抱团租房是最好的选择了,不然与不认识的人一起合租可能会发生一系列让你不舒服的事情。字体越大,代表户型数量越多。 租房面积统计,其中 30 - 90 平方米的租房占大多数——所以,组团租房是最好的选择。 然后是租房描述词云,字体越大,标识出现的次数越多。其中【精装修】占据了很大的部分,说明长租公寓也占领了很大一部分市场。 爬虫思路 先爬取房某下深圳各个板块的数据,然后存进 MongoDB 数据库,最后再进行数据分析。 数据库部分数据: 爬虫技术分析和代码实现 爬虫涉及到的技术工具如下: 请求库:requests HTML 解析:Beautiful Soup 词云:wordcloud 数据可视化:pyecharts 数据库:MongoDB 数据库连接:PyMongo 首先右键网页,查看页面源码,找出我们要爬取的部分。 代码实现,由于篇幅原因只展示主要代码:(获取一个页面的数据) 数据分析: 数据展示: 不管怎样,最近房租的暴涨真得让人无能为力。应对外界条件的变动,我们还是应该提升自己的硬实力,这样才能提升自己的生存能力。 作者:zone7,一只爱折腾的后端攻城狮,爱写作爱分享。 |
|
来自: AnonymousV脸 > 《手机电脑类知识的文章》