分享

数据集 | 2024年中国全国5级行政区划(省、市、县、镇、村)

 大邓的Python 2023-12-29 发布于瑞典

一、数据集概况数据来源:  中华人民共和国国家统计局 

https://www.stats.gov.cn/sj/tjbz/tjyqhdmhcxhfdm/2023/

整理者: ``https://github.com/adyliu/china_area`` 

数据量(2023年): 665552 

数据格式: csv.gz 或 sql.gz

级别:

1级:省、直辖市、自治区

2级:地级市

3级:市辖区、县(旗)、县级市、自治县(自治旗)、特区、林区

4级:镇、乡、民族乡、县辖区、街道

5级:村、居委会

城乡分类 (1开头是城镇,2开头是乡村)

111表示主城区;

112表示城乡接合区;

121表示镇中心区;

122表示镇乡接合区;

123表示特殊区域;

210表示乡中心区;

220表示村庄

code: 共12位(省2位,市2位,县2位,镇3位,村3位)

按截图操作即可获取数据集

分省份2010-2024数据变化

二、读取数据

以 area_code_2024.csv.gz为例, 解压后得到 area_code_2024.csv,importpandas aspd

df = pd.read_csv('area_code_2024.csv', header=None)#, names=['name', 'level', 'code', 'class']

df.columns = ['code', 'name', 'level', 'pcode', 'category']

print(len(df))

df.head(10)

Run665552

三、查看区划等级

区划级别:1级:省、直辖市、自治区

2级:地级市

3级:市辖区、县(旗)、县级市、自治县(自治旗)、特区、林区

4级:镇、乡、民族乡、县辖区、街道

5级:村、居委会

3.1 省

查看所有省名字df[df['level']==1]['name'].values

Runarray(['北京市', '天津市', '河北省', '山西省', '内蒙古自治区', '辽宁省', '吉林省', '黑龙江省', '上海市',

'江苏省', '浙江省', '安徽省', '福建省', '江西省', '山东省', '河南省', '湖北省', '湖南省',

'广东省', '广西壮族自治区', '海南省', '重庆市', '四川省', '贵州省', '云南省', '西藏自治区',

'陕西省', '甘肃省', '青海省', '宁夏回族自治区', '新疆维吾尔自治区'], dtype=object)

code: 共12位(省2位,市2位,县2位,镇3位,村3位), 查看所有省的代码df[df['level']==1]['code'].astype(str).str[:2].values

Runarray(['11', '12', '13', '14', '15', '21', '22', '23', '31', '32', '33',

'34', '35', '36', '37', '41', '42', '43', '44', '45', '46', '50',

'51', '52', '53', '54', '61', '62', '63', '64', '65'], dtype=object)

省份名和区划代码province_code_df = pd.DataFrame(

{'province': df[df['level']==1]['name'].values,

'code':df[df['level']==1]['code'].astype(str).str[:2].values}

)

province_code_df

3.2 市

code: 共12位(省2位,市2位,县2位,镇3位,村3位), 查看所有市的代码city_code_df = pd.DataFrame(

{'city': df[df['level']==2]['name'].values,

'code':df[df['level']==2]['code'].astype(str).str[:4].values}

)

city_code_df

3.3 县

code: 共12位(省2位,市2位,县2位,镇3位,村3位), 查看所有县的代码county_code_df = pd.DataFrame(

{'county': df[df['level']==3]['name'].values,

'code':df[df['level']==3]['code'].astype(str).str[:6].values}

)

county_code_df

3.4 镇

code: 共12位(省2位,市2位,县2位,镇3位,村3位), 查看所有镇的代码zhen_code_df = pd.DataFrame(

{'zhen': df[df['level']==4]['name'].values,

'code':df[df['level']==4]['code'].astype(str).str[:9].values}

)

zhen_code_df

3.5 村

code: 共12位(省2位,市2位,县2位,镇3位,村3位), 查看所有镇的代码village_code_df = pd.DataFrame(

{'village': df[df['level']==5]['name'].values,

'code':df[df['level']==5]['code'].astype(str).str[:12].values}

)

village_code_df

四、 城乡分类

城乡分类 (1开头是城镇,2开头是乡村)

111表示主城区;

112表示城乡接合区;

121表示镇中心区;

122表示镇乡接合区;

123表示特殊区域;

210表示乡中心区;

220表示村庄

查看所有的城镇#category以1为开头,即城镇

df[df['category'].astype(str).str.startswith('1')]

查看所有的镇中心区df[df['category']==121]

精选内容LIST | 社科(经管)可用数据集列表LIST | 文本分析代码列表LIST | 社科(经管)文本挖掘文献列表数据集  | 人民网政府留言板原始文本(2011-2023.12)数据集  |  人民日报/经济日报/光明日报 等 7 家新闻数据集可视化 | 人民日报语料反映七十年文化演变数据集 | 3571万条专利申请数据集(1985-2022年)数据集 |  专利转让数据集(1985-2021)数据集 | 288w政府采购合同公告明细数据(2023.09)代码 | 使用 3571w 专利申请数据集构造面板数据代码 | 使用「新闻数据集」计算 「经济政策不确定性」指数数据集 | 国省市三级gov工作报告文本代码 | 使用「新闻数据」生成概念词频「面板数据」代码 | 使用 3571w 专利申请数据集构造面板数据

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多