基于分区建模的人口数据空间化方法、系统及介质.pdf

上传人:罗明 文档编号:11720947 上传时间:2021-10-15 格式:PDF 页数:22 大小:1.58MB
收藏 版权申诉 举报 下载
基于分区建模的人口数据空间化方法、系统及介质.pdf_第1页
第1页 / 共22页
基于分区建模的人口数据空间化方法、系统及介质.pdf_第2页
第2页 / 共22页
基于分区建模的人口数据空间化方法、系统及介质.pdf_第3页
第3页 / 共22页
文档描述:

《基于分区建模的人口数据空间化方法、系统及介质.pdf》由会员分享,可在线阅读,更多相关《基于分区建模的人口数据空间化方法、系统及介质.pdf(22页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910210697.8 (22)申请日 2019.03.19 (71)申请人 广州大学 地址 510000 广东省广州市番禺广州大学 城外环西路230号 (72)发明人 赵冠伟成方龙杨木壮龚建周 吴志峰 (74)专利代理机构 广州三环专利商标代理有限 公司 44202 代理人 颜希文麦小婵 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/26(2012.01) G06F 16/29(2019.01) (54)发明名称 基于分区建模的人口数据空。

2、间化方法、 系统 及介质 (57)摘要 本发明公开了一种基于分区建模的人口数 据空间化方法、 系统及介质, 所述方法包括: 采集 研究区的影响人口空间分布的原始数据源并进 行预处理; 基于地理探测器模型对数据进行格网 化处理, 得到人口分布影响指标后进行标准化处 理, 初步筛选出人口分布影响因子; 将研究区划 分为若干个分区, 分别对分区的所述人口分布影 响因子进行重新筛选; 同时建立逐步回归方程和 随机森林模型, 将每个分区的人口数据空间化结 果进行精度比较分析, 选取各分区中最优模拟结 果作为每个分区的人口数据空间化最终结果并 进行合并, 得到人口空间分布模拟示意图。 本发 明能够基于分区。

3、建模对研究区进行分区并构建 各分区的人口数据空间化模型, 提高人口空间分 布模拟的精度和效率。 权利要求书3页 说明书11页 附图7页 CN 109978249 A 2019.07.05 CN 109978249 A 1.一种基于分区建模的人口数据空间化方法, 其特征在于, 包括如下步骤: 采集研究区的常住人口数据以及影响人口空间分布的原始数据源并进行数据预处理; 基于地理探测器模型对预处理后的数据进行格网化处理, 在得到对应的人口分布影响 指标后对其进行标准化处理, 初步筛选出人口分布影响因子; 将所述研究区划分为若干个分区, 根据分区之间的自然和社会经济因素差异, 在所述 初步筛选的基础上。

4、, 分别对若干个分区的所述人口分布影响因子进行重新筛选; 根据每个分区的人口密度和重新筛选的人口分布影响因子同时建立逐步回归方程和 随机森林模型, 并反演出每个分区的人口数据空间化结果; 将所述每个分区的人口数据空间化结果与对应的街道尺度进行精度比较分析, 选取各 分区中最优模拟结果作为每个分区的人口数据空间化最终结果; 将若干个分区的所述人口数据空间化最终结果进行合并, 得到所述研究区的人口空间 分布模拟示意图。 2.根据权利要求1所述的基于分区建模的人口数据空间化方法, 其特征在于, 所述影响 人口空间分布的原始数据源包括土地利用数据、 DEM、 POI数据、 路网分布、 夜间灯光数据、 。

5、小 区房价以及房屋建筑面积。 3.根据权利要求1所述的基于分区建模的人口数据空间化方法, 其特征在于, 所述数据 预处理, 具体为: 将收集到的空间数据统一转化成Albers投影, 其中, 设置中央经线为105 E, 起始纬度 为0 , 标准线为25 N和47 N, 参考椭球体为Krasovsky_1940椭球体; 将所述夜间灯光数据和DEM重采样为150米栅格; 对所述POI数据和小区房价数据分别进行坐标纠偏、 去重及空间匹配处理。 4.根据权利要求1所述的基于分区建模的人口数据空间化方法, 其特征在于, 所述格网 化处理, 具体为: 将所述研究区进行150mX150m格网划分; 对所述土地。

6、利用数据与格网图层进行叠置分析处理, 统计每个格网中各种土地类型的 面积, 并计算其对应的土地利用类型指数; 对所述房屋建筑面积与格网图层进行叠置分析处理, 统计每个格网的房屋建筑面积, 并计算其占格网面积的百分比; 对所述路网分布与格网图层进行相交分析处理, 统计每个格网中的道路长度, 并计算 格网道路密度; 采用GIS空间连接方法对小区房价点状数据与格网图层进行空间连接处理, 将字段整 合规则设置为平均值, 统计每个格网中的房价均值; 对所述POI数据先进行核密度分析, 像元大小设置为150; 然后利用GIS分区统计制表工 具, 以格网编码为统计字段, 统计每个格网中各种POI数据的密度均。

7、值; 同时, 用同样的统计 方式统计每个格网中夜间灯光强度均值及海拔高度均值。 5.根据权利要求1所述的基于分区建模的人口数据空间化方法, 其特征在于, 所述标准 化处理, 具体为: 对格网图层属性表中的土地利用指数、 海拔高度、 路网密度、 POI密度、 房屋建筑面积百 分比、 小区房价均值以及夜间灯光强度字段进行标准化处理, 使得各项指标的值域范围处 权利要求书 1/3 页 2 CN 109978249 A 2 于0-1之间, 消除量纲不一致的影响; 对标准化处理后的格网中的各个指标值进行面转栅格处理, 输出栅格大小为150, 对输 出的栅格数据采用自然间断点法进行7级划分; 对人口数据与。

8、研究区街道级行政区划边界按街道名称进行匹配, 计算各个街道的人口 密度值, 并对其进行均匀空间离散化处理, 同时采用自然间断点法进行7级划分。 6.根据权利要求1所述的基于分区建模的人口数据空间化方法, 其特征在于, 所述初步 筛选, 具体为: 利用ArcMap10.2中的创建随机点工具, 以研究区作为处理范围, 随机生成3000个样本 点, 并利用Extract Multi Values To Points工具分别提取对应样本点的人口密度值和各 个人口空间分布影响因子的指标值; 将因变量人口密度值和自变量人口空间分布影响因子输入到GeoDetector2015软件 中, 计算并获取各影响因子。

9、对因变量的解释力q值, 将未通过0.05显著性检验的影响因子剔 除, 完成对人口空间分布影响因子的初步筛选。 7.根据权利要求1所述的基于分区建模的人口数据空间化方法, 其特征在于, 所述重新 筛选, 具体为: 在所述初步筛选的基础上, 基于地理探测器模型对初步筛选后的数据进行格网化处 理, 在得到对应的人口分布影响指标后对其进行标准化处理, 根据各个分区的自然和社会 经济因素差异以及参考初步筛选的结果, 分别对各个分区的人口分布影响因子进行重新筛 选。 8.一种基于分区建模的人口数据空间化系统, 其特征在于, 包括: 数据预处理模块, 用于采集研究区的常住人口数据以及影响人口空间分布的原始数。

10、据 源并进行数据预处理; 识别因子模块, 用于基于地理探测器模型对预处理后的数据进行格网化处理, 在得到 对应的人口分布影响指标后对其进行标准化处理, 初步筛选出人口分布影响因子; 筛选因子模块, 用于将所述研究区划分为若干个分区, 根据分区之间的自然和社会经 济因素差异, 在所述初步筛选的基础上, 分别对若干个分区的所述人口分布影响因子进行 重新筛选; 分区建模模块, 用于根据每个分区的人口密度和重新筛选的人口分布影响因子同时建 立逐步回归方程和随机森林模型, 并反演出每个分区的人口数据空间化结果; 合并输出模块, 用于将所述每个分区的人口数据空间化结果与对应的街道尺度进行精 度比较分析, 。

11、选取各分区中最优模拟结果作为每个分区的人口数据空间化最终结果; 将若 干个分区的所述人口数据空间化最终结果进行合并, 得到所述研究区的人口空间分布模拟 示意图。 9.根据权利要求8所述的基于分区建模的人口数据空间化系统, 其特征在于, 所述数据 预处理, 具体为: 将收集到的空间数据统一转化成Albers投影, 其中, 设置中央经线为105 E, 起始纬度 为0 , 标准线为25 N和47 N, 参考椭球体为Krasovsky_1940椭球体; 将所述夜间灯光数据和DEM重采样为150米栅格; 对所述POI数据和小区房价数据分别进行坐标纠偏、 去重及空间匹配处理。 权利要求书 2/3 页 3 。

12、CN 109978249 A 3 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的计算 机程序, 其中, 在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权 利要求1至7任一项所述的基于分区建模的人口数据空间化方法。 权利要求书 3/3 页 4 CN 109978249 A 4 基于分区建模的人口数据空间化方法、 系统及介质 技术领域 0001 本发明涉及人口数据处理技术领域, 具体涉及一种基于分区建模的人口数据空间 化方法、 系统及介质。 背景技术 0002 人作为社会活动的主体, 是引起自然地理环境发生演变的主导因素。 人口空间分 布是人口学、 。

13、社会学、 统计学的主要研究课题之一, 更是人口地理学最主要研究的核心内 容。 依据联合国经社部发布的 全球人口发展报告2015修订版 可知, 预计到2030年世界 总人口将达到85亿, 在2050年增加到97亿, 下个世纪初将增长到112亿。 人口增长、 庞大的人 口数量引发了对土地资源、 能源资源、 矿产资源等的过度消耗, 同时还造成了严重的环境污 染及生态破坏等问题。 因此, 如何有效、 精确地获取人口在空间上的分布数量及其空间分布 特征, 分析人口在空间上的扩张和迁移, 对协调人地关系、 自然灾害的预防、 灾后救灾、 受伤 人口及财产损失估算、 资源合理利用和环境保护都有巨大的现实意义。。

14、 0003 目前传统的人口统计数据不仅存在时空分辨率低的明显缺点, 当其与多源数据进 行融合或叠加分析时, 也往往会出现行政区划边界与自然单元边界不吻合、 数据空间精度 降低、“可变元” 等问题。 随着3S技术的发展以及大数据时代的到来, 数据种类层出不穷, 人 口数据空间化的计算方法使得统计人口从行政单元向格网单元的转换, 不仅提高了人口分 布的空间分辨率, 而且更容易与其他社会统计数据、 生态环境数据等多源数据进行融合分 析。 0004 但是, 在对现有技术的研究与实践过程中, 本发明的发明人发现, 人口数据空间化 过程中仍存在影响因子选取不合理和模型实用性较差的缺陷, 导致模拟结果精度较。

15、低。 发明内容 0005 本发明实施例所要解决的技术问题在于, 提供一种基于分区建模的人口数据空间 化方法、 系统及介质, 能够提高人口空间分布模拟的精度。 0006 为解决上述问题, 本发明的一个实施例提供一种基于分区建模的人口数据空间化 方法, 包括如下步骤: 0007 采集研究区的常住人口数据以及影响人口空间分布的原始数据源并进行数据预 处理; 0008 基于地理探测器模型对预处理后的数据进行格网化处理, 在得到对应的人口分布 影响指标后对其进行标准化处理, 初步筛选出人口分布影响因子; 0009 将所述研究区划分为若干个分区, 根据分区之间的自然和社会经济因素差异, 在 所述初步筛选的。

16、基础上, 分别对若干个分区的所述人口分布影响因子进行重新筛选; 0010 根据每个分区的人口密度和重新筛选的人口分布影响因子同时建立逐步回归方 程和随机森林模型, 并反演出每个分区的人口数据空间化结果; 0011 将所述每个分区的人口数据空间化结果与对应的街道尺度进行精度比较分析, 选 说明书 1/11 页 5 CN 109978249 A 5 取各分区中最优模拟结果作为每个分区的人口数据空间化最终结果; 0012 将若干个分区的所述人口数据空间化最终结果进行合并, 得到所述研究区的人口 空间分布模拟示意图。 0013 进一步地, 所述影响人口空间分布的原始数据源包括土地利用数据、 DEM、 。

17、POI数 据、 路网分布、 夜间灯光数据、 小区房价以及房屋建筑面积。 0014 进一步地, 所述数据预处理, 具体为: 0015 将收集到的空间数据统一转化成Albers投影, 其中, 设置中央经线为105 E, 起始 纬度为0 , 标准线为25 N和47 N, 参考椭球体为Krasovsky_1940椭球体; 0016 将所述夜间灯光数据和DEM重采样为150米栅格; 0017 对所述POI数据和小区房价数据分别进行坐标纠偏、 去重及空间匹配处理。 0018 进一步地, 所述格网化处理, 具体为: 0019 将所述研究区进行150m X 150m格网划分; 0020 对所述土地利用数据与格。

18、网图层进行叠置分析处理, 统计每个格网中各种土地类 型的面积, 并计算其对应的土地利用类型指数; 0021 对所述房屋建筑面积与格网图层进行叠置分析处理, 统计每个格网的房屋建筑面 积, 并计算其占格网面积的百分比; 0022 对所述路网分布与格网图层进行相交分析处理, 统计每个格网中的道路长度, 并 计算格网道路密度; 0023 采用GIS空间连接方法对小区房价点状数据与格网图层进行空间连接处理, 将字 段整合规则设置为平均值, 统计每个格网中的房价均值; 0024 对所述POI数据先进行核密度分析, 像元大小设置为150; 然后利用GIS分区统计制 表工具, 以格网编码为统计字段, 统计每。

19、个格网中各种POI数据的密度均值; 同时, 用同样的 统计方式统计每个格网中夜间灯光强度均值及海拔高度均值。 0025 进一步地, 所述标准化处理, 具体为: 0026 对格网图层属性表中的土地利用指数、 海拔高度、 路网密度、 POI密度、 房屋建筑面 积百分比、 小区房价均值以及夜间灯光强度字段进行标准化处理, 使得各项指标的值域范 围处于0-1之间, 消除量纲不一致的影响; 0027 对标准化处理后的格网中的各个指标值进行面转栅格处理, 输出栅格大小为150, 对输出的栅格数据采用自然间断点法进行7级划分; 0028 对人口数据与研究区街道级行政区划边界按街道名称进行匹配, 计算各个街道。

20、的 人口密度值, 并对其进行均匀空间离散化处理, 同时采用自然间断点法进行7级划分。 0029 进一步地, 所述初步筛选, 具体为: 0030 利用ArcMap10.2中的创建随机点工具, 以研究区作为处理范围, 随机生成3000个 样本点, 并利用Extract Multi Values To Points工具分别提取对应样本点的人口密度值 和各个人口空间分布影响因子的指标值; 0031 将因变量人口密度值和自变量人口空间分布影响因子输入到GeoDetector2015软 件中, 计算并获取各影响因子对因变量的解释力q值, 将未通过0.05显著性检验的影响因子 剔除, 完成对人口空间分布影响。

21、因子的初步筛选。 0032 进一步地, 所述重新筛选, 具体为: 说明书 2/11 页 6 CN 109978249 A 6 0033 在所述初步筛选的基础上, 基于地理探测器模型对初步筛选后的数据进行格网化 处理, 在得到对应的人口分布影响指标后对其进行标准化处理, 根据各个分区的自然和社 会经济因素差异以及参考初步筛选的结果, 分别对各个分区的人口分布影响因子进行重新 筛选。 0034 本发明的一个实施例还提供了一种基于分区建模的人口数据空间化系统, 包括: 0035 数据预处理模块, 用于采集研究区的常住人口数据以及影响人口空间分布的原始 数据源并进行数据预处理; 0036 识别因子模块。

22、, 用于基于地理探测器模型对预处理后的数据进行格网化处理, 在 得到对应的人口分布影响指标后对其进行标准化处理, 初步筛选出人口分布影响因子; 0037 筛选因子模块, 用于将所述研究区划分为若干个分区, 根据分区之间的自然和社 会经济因素差异, 在所述初步筛选的基础上, 分别对若干个分区的所述人口分布影响因子 进行重新筛选; 0038 分区建模模块, 用于根据每个分区的人口密度和重新筛选的人口分布影响因子同 时建立逐步回归方程和随机森林模型, 并反演出每个分区的人口数据空间化结果; 0039 合并输出模块, 用于将所述每个分区的人口数据空间化结果与对应的街道尺度进 行精度比较分析, 选取各分。

23、区中最优模拟结果作为每个分区的人口数据空间化最终结果; 将若干个分区的所述人口数据空间化最终结果进行合并, 得到所述研究区的人口空间分布 模拟示意图。 0040 进一步地, 所述数据预处理, 具体为: 0041 将收集到的空间数据统一转化成Albers投影, 其中, 设置中央经线为105 E, 起始 纬度为0 , 标准线为25 N和47 N, 参考椭球体为Krasovsky_1940椭球体; 0042 将所述夜间灯光数据和DEM重采样为150米栅格; 0043 对所述POI数据和小区房价数据分别进行坐标纠偏、 去重及空间匹配处理。 0044 本发明的一个实施例还提供了一种计算机可读存储介质, 。

24、所述计算机可读存储介 质包括存储的计算机程序, 其中, 在所述计算机程序运行时控制所述计算机可读存储介质 所在设备执行如上述的基于分区建模的人口数据空间化方法。 0045 实施本发明实施例, 具有如下有益效果: 0046 本发明实施例提供的一种基于分区建模的人口数据空间化方法、 系统及介质, 所 述方法包括如下步骤: 采集研究区的常住人口数据以及影响人口空间分布的原始数据源并 进行数据预处理; 基于地理探测器模型对预处理后的数据进行格网化处理, 在得到对应的 人口分布影响指标后对其进行标准化处理, 初步筛选出人口分布影响因子; 将所述研究区 划分为若干个分区, 根据分区之间的自然和社会经济因素。

25、差异, 在所述初步筛选的基础上, 分别对若干个分区的所述人口分布影响因子进行重新筛选; 根据每个分区的人口密度和重 新筛选的人口分布影响因子同时建立逐步回归方程和随机森林模型, 并反演出每个分区的 人口数据空间化结果; 将所述每个分区的人口数据空间化结果与对应的街道尺度进行精度 比较分析, 选取各分区中最优模拟结果作为每个分区的人口数据空间化最终结果; 将若干 个分区的所述人口数据空间化最终结果进行合并, 得到所述研究区的人口空间分布模拟示 意图。 本发明能够基于分区建模思想对研究区进行分区, 并据此构建适宜于各分区的人口 数据空间化模型, 充分整合土地利用、 夜间灯光、 兴趣点、 小区房价等。

26、各种来源的数据信息, 说明书 3/11 页 7 CN 109978249 A 7 有效纠正了单一数据来源存在的偏差特性, 并增强了模型因子的解释性, 并采用地理探测 器模型对人口空间分布的影响因素进行精准识别, 所得结果更符合区域人口分布的实际特 征, 有利于提高人口空间分布模拟的精度和效率。 附图说明 0047 图1为本发明第一实施例提供的一种基于分区建模的人口数据空间化方法的流程 示意图; 0048 图2为本发明第一实施例提供的另一种基于分区建模的人口数据空间化方法的流 程示意图; 0049 图3为本发明实施例提供的研究区土地利用指数分布图; 0050 图4为本发明实施例提供的研究区格网房。

27、屋建筑面积分布图; 0051 图5为本发明实施例提供的研究区格网道路密度分布图; 0052 图6为本发明实施例提供的研究区区域划分示意图; 0053 图7为本发明实施例提供的研究区150m格网人口数据空间化结果示意图; 0054 图8为本发明第二实施例提供的一种基于分区建模的人口数据空间化系统的结构 示意图。 具体实施方式 0055 下面将结合本发明实施例中的附图, 对本发明实施例中的技术方案进行清楚、 完 整地描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实施例。 基于 本发明中的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例, 都属于。

28、本发明保护的范围。 0056 首先介绍本发明可以提供的应用场景, 如人口数据空间化。 0057 需要说明的是, 在具体实施案例过程中, 本发明实施例的案例说明中仅仅将研究 区分为两个子区域, 主要是为了便于演示, 事实上分区的数量应依据具体案例区情况而定。 除外, 本发明实施方案中的案例说明仅利用了逐步归回分析和随机森林等两种机器学习模 型, 但并不代表其他基于机器学习的方法不在该范畴中。 对于该领域的研究者, 在不脱离本 发明思路的前提下, 做出若干边形和改进, 都属于本发明的保护范围。 0058 本发明具体实施例中, 选取广州市越秀区、 海珠区、 荔湾区、 天河区、 白云区和黄埔 区范围内。

29、共106个街道作为研究区域作为数据源, 利用ArcGIS10 .2、 python语言、 GeoDetector2015等辅助工具, 实现研究区人口数据空间化。 0059 本发明第一实施例: 0060 请参阅图1-7。 0061 如图1所示, 本实施例提供的一种基于分区建模的人口数据空间化方法, 包括如下 步骤: 0062 S101、 采集研究区的常住人口数据以及影响人口空间分布的原始数据源并进行数 据预处理; 0063 具体的, 对于步骤S101, 收集广州市越秀区、 海珠区、 荔湾区、 天河区、 白云区、 黄埔 区共106个街道的常住人口数据、 影响人口空间分布的自然和社会经济因素等原始数。

30、据源。 说明书 4/11 页 8 CN 109978249 A 8 如: 土地利用数据、 DEM、 POI数据、 路网分布、 夜间灯光数据、 小区房价、 房屋建筑面积等。 0064 S102、 基于地理探测器模型对预处理后的数据进行格网化处理, 在得到对应的人 口分布影响指标后对其进行标准化处理, 初步筛选出人口分布影响因子; 0065 具体的, 对于步骤S102, 将收集到的空间数据统一转化成Albers投影, 中央经线为 105E, 起始纬度为0, 标准线为25N和47N, 参考椭球体为Krasovsky_1940椭球体。 将夜间灯光 数据和DEM重采样为150米栅格。 将POI数据、 小。

31、区房价数据进行坐标纠偏、 去重、 空间匹配等 预处理。 将上述处理好的格网图层属性表中的土地利用指数、 海拔高度、 路网密度、 POI密 度、 房屋建筑面积百分比、 小区房价均值、 夜间灯光强度等字段进行标准化处理, 使得各项 指标的值域范围处于0-1之间, 消除量纲不一致的影响。 将标准化处理后的格网中的各个指 标值进行面转栅格处理, 输出栅格大小为150; 然后对输出的栅格数据采用自然间断点法进 行7级划分。 将人口数据与研究区街道级行政区划边界按街道名称进行匹配, 计算各个街道 的人口密度值, 并对其进行均匀空间离散化处理, 同时采用自然间断点法进行7级划分。 利 用ArcMap10.2。

32、中的创建随机点工具(Create Random Points), 以研究区作为处理范围, 随 机生成3000个样本点, 并利用Extract Multi Values To Points工具分别提取对应样本点 的人口密度值和各个人口空间分布影响因子的指标值。 将因变量人口密度值和自变量人口 空间分布影响因子输入到GeoDetector2015软件中, 计算并获取各影响因子对因变量的解 释力q值(q-statistic)。 然后将未通过0.05显著性检验的影响因子剔除, 完成对人口空间 分布影响因子的初步筛选。 0066 S103、 将所述研究区划分为若干个分区, 根据分区之间的自然和社会经济因。

33、素差 异, 在所述初步筛选的基础上, 分别对若干个分区的所述人口分布影响因子进行重新筛选; 0067 具体的, 对于步骤S103, 将研究区划分为两个分区, 根据两个分区的自然和社会经 济因素差异、 参考初步筛选的结果, 分别对两个分区的人口分布影响因子进行重新筛选。 0068 S104、 根据每个分区的人口密度和重新筛选的人口分布影响因子同时建立逐步回 归方程和随机森林模型, 并反演出每个分区的人口数据空间化结果; 0069 具体的, 对于步骤S104, 每个分区中, 依据各街道的人口密度及选取的人口分布影 响因子, 同时建立逐步回归方程和随机森林模型, 并基于建立好的逐步回归方程和随机森 。

34、林模型, 反演出每个分区的基于逐步回归方程和随机森林模型的150m格网的人口密度值; 然后乘以对应的格网面积, 获取每个格网的人口数量。 0070 S105、 将所述每个分区的人口数据空间化结果与对应的街道尺度进行精度比较分 析, 选取各分区中最优模拟结果作为每个分区的人口数据空间化最终结果; 0071 S106、 将若干个分区的所述人口数据空间化最终结果进行合并, 得到所述研究区 的人口空间分布模拟示意图。 0072 具体的, 对于步骤S105和S106, 将每个分区的基于逐步回归方程和随机森林模型 所得的人口数据空间化结果基于街道尺度进行精度比较分析, 选取分区中最优模拟结果作 为每个分区。

35、的人口数据空间化最终结果。 0073 在优选的实施例中, 所述影响人口空间分布的原始数据源包括土地利用数据、 DEM、 POI数据、 路网分布、 夜间灯光数据、 小区房价以及房屋建筑面积。 0074 在优选的实施例中, 所述数据预处理, 具体为: 0075 将收集到的空间数据统一转化成Albers投影, 其中, 设置中央经线为105 E, 起始 说明书 5/11 页 9 CN 109978249 A 9 纬度为0 , 标准线为25 N和47 N, 参考椭球体为Krasovsky_1940椭球体; 0076 将所述夜间灯光数据和DEM重采样为150米栅格; 0077 对所述POI数据和小区房价数。

36、据分别进行坐标纠偏、 去重及空间匹配处理。 0078 在优选的实施例中, 所述格网化处理, 具体为: 0079 将所述研究区进行150m X 150m格网划分; 0080 对所述土地利用数据与格网图层进行叠置分析处理, 统计每个格网中各种土地类 型的面积, 并计算其对应的土地利用类型指数; 0081 对所述房屋建筑面积与格网图层进行叠置分析处理, 统计每个格网的房屋建筑面 积, 并计算其占格网面积的百分比; 0082 对所述路网分布与格网图层进行相交分析处理, 统计每个格网中的道路长度, 并 计算格网道路密度; 0083 采用GIS空间连接方法对小区房价点状数据与格网图层进行空间连接处理, 将。

37、字 段整合规则设置为平均值, 统计每个格网中的房价均值; 0084 对所述POI数据先进行核密度分析, 像元大小设置为150; 然后利用GIS分区统计制 表工具, 以格网编码为统计字段, 统计每个格网中各种POI数据的密度均值; 同时, 用同样的 统计方式统计每个格网中夜间灯光强度均值及海拔高度均值。 0085 在优选的实施例中, 所述标准化处理, 具体为: 0086 对格网图层属性表中的土地利用指数、 海拔高度、 路网密度、 POI密度、 房屋建筑面 积百分比、 小区房价均值以及夜间灯光强度字段进行标准化处理, 使得各项指标的值域范 围处于0-1之间, 消除量纲不一致的影响; 0087 对标。

38、准化处理后的格网中的各个指标值进行面转栅格处理, 输出栅格大小为150, 对输出的栅格数据采用自然间断点法进行7级划分; 0088 对人口数据与研究区街道级行政区划边界按街道名称进行匹配, 计算各个街道的 人口密度值, 并对其进行均匀空间离散化处理, 同时采用自然间断点法进行7级划分。 0089 在优选的实施例中, 所述初步筛选, 具体为: 0090 利用ArcMap10.2中的创建随机点工具, 以研究区作为处理范围, 随机生成3000个 样本点, 并利用Extract Multi Values To Points工具分别提取对应样本点的人口密度值 和各个人口空间分布影响因子的指标值; 009。

39、1 将因变量人口密度值和自变量人口空间分布影响因子输入到GeoDetector2015软 件中, 计算并获取各影响因子对因变量的解释力q值, 将未通过0.05显著性检验的影响因子 剔除, 完成对人口空间分布影响因子的初步筛选。 0092 在优选的实施例中, 所述重新筛选, 具体为: 0093 在所述初步筛选的基础上, 基于地理探测器模型对初步筛选后的数据进行格网化 处理, 在得到对应的人口分布影响指标后对其进行标准化处理, 根据各个分区的自然和社 会经济因素差异以及参考初步筛选的结果, 分别对各个分区的人口分布影响因子进行重新 筛选。 0094 如图2所示, 本发明实施例还提供了另一种基于分区。

40、建模的人口数据空间化方法, 具体步骤如下: 0095 步骤(1): 收集广州市越秀区、 海珠区、 荔湾区、 天河区、 白云区、 黄埔区共106个街 说明书 6/11 页 10 CN 109978249 A 10 道的常住人口数据、 影响人口空间分布的自然和社会经济因素等原始数据源。 如: 土地利用 数据、 DEM、 POI数据、 路网分布、 夜间灯光数据、 小区房价、 房屋建筑面积等。 0096 步骤(2): 将收集到的空间数据统一转化成Albers投影, 中央经线为105E, 起始纬 度为0, 标准线为25N和47N, 参考椭球体为Krasovsky_1940椭球体。 0097 步骤(3):。

41、 将夜间灯光数据和DEM重采样为150米栅格。 0098 步骤(4): 将POI数据、 小区房价数据进行坐标纠偏、 去重、 空间匹配等预处理。 0099 步骤(5): 将研究区进行150m X 150m格网划分。 0100 步骤(6): 如图3所示, 将土地利用数据与格网图层进行叠置分析, 统计每个格网中 各种土地类型的面积, 并计算其对应的土地利用类型指数。 如: 耕地指数、 林地指数、 水域指 数、 城镇用地指数、 农村用地指数等。 同理, 如图4所示, 将房屋建筑面积与格网图层进行叠 置分析, 统计每个格网的房屋建筑面积, 并计算其占格网面积的百分比。 0101 步骤(7): 如图5所示。

42、, 将路网分布与格网图层进行相交分析, 统计每个格网中的道 路长度, 并计算格网道路密度。 0102 步骤(8): 利用GIS空间连接手段, 将小区房价点状数据与格网图层进行空间连接, 字段整合规则设置为平均值, 统计每个格网中的房价均值。 0103 步骤(9): 将收集到的POI数据先进行核密度分析, 像元大小设置为150; 然后利用 GIS分区统计制表工具, 以格网编码为统计字段, 统计每个格网中各种POI数据的密度均值; 同理, 用同样的方式统计每个格网中夜间灯光强度均值及海拔高度均值。 0104 步骤(10): 将上述处理好的格网图层属性表中的土地利用指数、 海拔高度、 路网密 度、 。

43、POI密度、 房屋建筑面积百分比、 小区房价均值、 夜间灯光强度等字段进行标准化处理, 使得各项指标的值域范围处于0-1之间, 消除量纲不一致的影响。 0105 步骤(11): 将步骤(10)中标准化处理后的格网中的各个指标值进行面转栅格处 理, 输出栅格大小为150; 然后对输出的栅格数据采用自然间断点法进行7级划分。 0106 步骤(12): 将人口数据与研究区街道级行政区划边界按街道名称进行匹配, 计算 各个街道的人口密度值, 并对其进行均匀空间离散化处理, 同时采用自然间断点法进行7级 划分。 0107 步骤(13): 利用ArcMap10.2中的创建随机点工具(Create Rand。

44、om Points), 以研 究区作为处理范围, 随机生成3000个样本点, 并利用Extract Multi Values To Points工 具分别提取对应样本点的人口密度值和各个人口空间分布影响因子的指标值。 0108 步骤(14): 经步骤(11)、 (12)、 (13)处理后, 将因变量人口密度值和自变量人口空 间分布影响因子输入到GeoDetector2015软件中, 计算并获取各影响因子对因变量的解释 力q值(q-statistic)。 然后将未通过0.05显著性检验的影响因子剔除, 完成对人口空间分 布影响因子的初步筛选。 0109 步骤(15): 如图6所示, 将研究区划分。

45、为两个分区。 0110 步骤(16): 根据两个分区的自然和社会经济因素差异、 参考步骤(14)的结果, 分别 对两个分区的人口分布影响因子进行重新筛选。 0111 步骤(17): 分别将两个分区的矢量图层与土地利用数据进行叠置分析。 基于街道 尺度, 统计每个街道所对应的各种土地利用面积, 然后计算其相应的土地利用类型指数。 如: 耕地指数、 林地指数、 水域指数、 城镇用地指数、 农村用地指数等。 同理, 将房屋建筑面积 说明书 7/11 页 11 CN 109978249 A 11 分别与两个分区矢量图层进行叠置分析, 统计每个街道的房屋建筑面积, 并计算其占街道 面积的百分比。 011。

46、2 步骤(18): 将路网分布分别与两个分区矢量图层进行相交分析, 统计每个街道的 道路长度, 并计算每个街道的道路密度。 0113 步骤(19): 利用GIS空间连接手段, 将小区房价点状数据分别与两个分区矢量图层 进行空间连接, 字段整合规则设置为平均值, 统计每个街道的房价均值。 0114 步骤(20): 将收集到的POI数据先进行核密度分析, 像元大小设置为150; 然后利用 GIS分区统计制表工具, 以街道编码为统计字段, 统计每个街道各种POI数据的密度均值; 同 理, 用同样的方式统计每个街道夜间灯光强度均值及海拔高度均值。 0115 步骤(21): 将步骤(16)、 (17)、。

47、 (18)、 (19)得到的基于街道的尺度的各项指标值, 按 分区进行标准化处理。 0116 步骤(22): 将两个分区分别进行150m X 150m格网划分。 0117 步骤(23): 将两个分区的人口空间分布影响因子分别进行格网化处理。 土地利用 数据、 房屋建筑数据处理过程与步骤(6)一致; 路网分布数据处理方式与步骤(7)一致; 小区 房价数据处理方式与步骤(8)一致; POI数据、 夜间灯光数据、 DEM数据处理方式与步骤(9)一 致。 0118 步骤(24): 分别将两个分区的人口分布影响指标进行标准化处理。 0119 步骤(25): 每个分区中, 依据各街道的人口密度及选取的人口。

48、分布影响因子, 同时 建立逐步回归方程和随机森林模型, 并基于建立好的逐步回归方程和随机森林模型, 反演 出每个分区的基于逐步回归方程和随机森林模型的150m格网的人口密度值; 然后乘以对应 的格网面积, 获取每个格网的人口数量。 0120 步骤(26): 将每个分区的基于逐步回归方程和随机森林模型所得的人口数据空间 化结果基于街道尺度进行精度比较分析, 选取分区中最优模拟结果作为每个分区的人口数 据空间化最终结果。 0121 步骤(27): 如图7所示, 将两个分区的最优人口数据空间化结果进行合并, 最终得 到整个研究区的人口空间分布模拟示意图。 0122 本发明实施例提供的一种基于分区建模。

49、的人口数据空间化方法、 系统及介质, 所 述方法包括如下步骤: 采集研究区的常住人口数据以及影响人口空间分布的原始数据源并 进行数据预处理; 基于地理探测器模型对预处理后的数据进行格网化处理, 在得到对应的 人口分布影响指标后对其进行标准化处理, 初步筛选出人口分布影响因子; 将所述研究区 划分为若干个分区, 根据分区之间的自然和社会经济因素差异, 在所述初步筛选的基础上, 分别对若干个分区的所述人口分布影响因子进行重新筛选; 根据每个分区的人口密度和重 新筛选的人口分布影响因子同时建立逐步回归方程和随机森林模型, 并反演出每个分区的 人口数据空间化结果; 将所述每个分区的人口数据空间化结果与。

50、对应的街道尺度进行精度 比较分析, 选取各分区中最优模拟结果作为每个分区的人口数据空间化最终结果; 将若干 个分区的所述人口数据空间化最终结果进行合并, 得到所述研究区的人口空间分布模拟示 意图。 本发明能够基于分区建模思想对研究区进行分区, 并据此构建适宜于各分区的人口 数据空间化模型, 充分整合土地利用、 夜间灯光、 兴趣点、 小区房价等各种来源的数据信息, 有效纠正了单一数据来源存在的偏差特性, 并增强了模型因子的解释性, 并采用地理探测 说明书 8/11 页 12 CN 109978249 A 12 器模型对人口空间分布的影响因素进行精准识别, 所得结果更符合区域人口分布的实际特 征,。

展开阅读全文
内容关键字: 基于 分区 建模 人口 数据 空间 方法 系统 介质
关于本文
本文标题:基于分区建模的人口数据空间化方法、系统及介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11720947.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1