LandScan全球人口动态数据        

LandScan Global Population Data

进入数据库

产品介绍

由美国能源部橡树岭国家实验室(ORNL)推出的LandScan是全球人口数据发布的社会标准,它采用地理信息系统(Geographic Information System,GIS)与遥感影像(Remote Sensing,RS)相结合的创新方法。在大约1千米(30" X 30")格网分辨率范围内,LandScan是最好的全球人口动态统计分析数据集之一,可以获取24小时内平均人口分布状况。LandScan采用的算法,采用空间数据、图像分析技术和多元分区密度模型,在特定的行政边界范围内来对人口统计数据进行分析,该算法曾经获得过素有科技产业奥斯卡之称的百大科技研发奖(R&D 100 Award Winner)。目前,还没有单独的人口分布模型能够很好的解析各种空间数据的有效性,规模,准确性,LandScan人口分布模型能够很好解析每个国家或地区的数据和地理情况。每年9月1日发布前一年的数据,历史数据的年份为2000年起。

一、基本信息情况说明

·格式和范围(Format and Extent):数据分布在ESRI网格格式和ESRI二进制光栅格式中。数据集有20,880行和43,200列,覆盖北纬84°到南纬90°,西经180°到东经180°的范围内。

·数据值(Data values):单元数据代表了人口分布数值的平均值或近似值。周围人口数据综合了日常运动和常规出行行为的影响(Dobson等,2000年)。考虑到在一天中的任何时间,都有可能出现的突发情况导致的人口数据的变化,LandScan模型定位于人口分布的整体状况,不只是考虑到地区的静态人口数量。这也能够将LandScan的数据与其他动态人口统计数据进行对比。

·分辨率与坐标系统(Resolution and Coordinate System): 数据集具有30弧秒的空间分辨率,并且以WGS-84坐标系为基准。30弧秒的单元数据表示赤道附近1平方千米的范围。由于数据取自球面型的坐标系中,单元宽度会随着单元的纬度的余弦变化而变小。因此在纬度60°的单元内其宽度将变为原来的一半(cos 60°= 0.5),高度不变。鉴于单元网格的大小不同,单元数值代表全部人口数量,而不是人口密度。人口信息数据来源于中央以下各级行政单位的统计而整理汇总而成。鉴于此,每个光栅格式的数据值映射至不同的坐标系(包括动态投射)中时,将会重新取样,并且人口信息数据也将会受到影响。所以,在进行空间分析前,用户应该尽量确保范围设定在准确的单元大小中(比如 35.25,35.50,35.0),以避免数据集会发生变化。

·数据修订(Data Revisions):数据库每年更新升级,将全新的空间数据和影像分析数据添加至分布式算法中应用。不同版本间的数据集可能会产生不一样的结果。LandScan数据集各种版本之间的差异是由于城市的不断发展或郊区的扩充导致的。另外,有很多地方(比如某个村庄)的高分辨率影像标识已经使用了数年,可能没有必要被更新替换,也可能在不同的空间数据产品中被标识在了不正确的地理位置。

二、方法与原理

    LandScan全球人口分布模型是一个多层次和多元分区密度的空间模型,通过“智能内插”技术(“smart interpolation” technique)的方法计算得出。在多元分区密度制图中,一个源层会转变为一个表面,并且一个从属的数据层会被添加至该表面,该表面具有与其标识相一致的单元的权重系数,或者在从属数据层中导出密度水平值。在LandScan模型中,经典的多元分区密度模型可以通过整合并运用多种辅助或指示数据层进行改善。建模过程中采用中央以下各级行政单位级别的人口统计数据来进行相应国家和地理空间数据(包括土地覆盖情况,道路,坡度,城市地区状况,乡村位置和高分辨率影像分析)的输入,这些都是人口分布的重要参照指标。基于某个地区的空间数据和社会经济与文化数据,单元数值的权重优先取决于一天中的人口数值的变化。具体到一个国家,人口分布模型中的每个单元会计算得到一个似然系数(“likelihood” coefficient),并应用于人口统计数据中,作为该区域内的数值。该区域内的总人口数量然后会被按一定的比例分配给每个单元,以计算出相应的人口系数。得到的人口数量是周围的,或者平均每日或每晚的人口数值。

    位置或属性错误和明显误差情况可以在大容量的不同空间数据中被发现。LandScan包含了人工核实和修改的过程,以改进空间精度和人口分布的相对数值。影像分析能够识别出明显的人口分布的错误,并且创建另外的经过修改的人口似然系数的空间数据层,以修正或减小输入数据的误差。输出的单元数据将会被转换成带有先前修改过的单元数值的属性字段的点。许多修改过的数值将会被应用于城市地区及其周遭范围内。派生出的土地覆盖数据往往不能体现出该城市的特征,比如建筑物密度,或者建筑物高度(能采用高分辨率的影像推断出大概数值)。用作高分辨率影像的对似然系数进行人工修正过的文件可以为每个国家制作,并且需要相应国家做出预算支持。

三、主要数据说明

    LandScan数据集于1998年上线,用于全球人口动态统计分析与风险评估。LandScan原始的算法中采用的是整合后的全球一致的空间数据,但精确性有限。在空间模型中,每个国家或地区的输入数据会用不同权重指标因素来进行描述,以区分不同的居住模式。近十年来,全球的空间数据有着显著的增长,并且高分辨率卫星影像的容量也有着迅猛的增长。这些海量的数据和影像提供了一个机会用以改善每年发布的数据的空间保真度。然而,新的空间数据往往是零散的,因此,LandScan算法必须要考虑到不同输入数据的分辨率和时序的不一致性。LandScan建模过程中所采用的空间数据基本信息介绍如下:

·人口信息数据(Census Information):LandScan2010版以及更早的版本使用的人口信息数据源自美国人口普查局地理研究分所(Geographic Studies Branch, US Bureau of Census)的每年的年中国家人口估算的数据。这些人口数据中不包括临时救援人员,科学考察队和旅行者等短期流动人口。这些年中的估算数据可能不能反映出人群季节性的迁移,比如流离失所者(IDP’s)或难民人群,可能与该国家官方机构年终公布的权威人口统计数据有所出入。

·行政边界(Administrative Boundaries):准确的行政边界区分是LandScan模型中最重要的元素之一,直接牵扯到相关的人口统计数据。每年LandScan模型都会进行更新,以应对部分地区行政边界的改变,相应的人口统计数据也会进行相应的更新。考虑到人口统计数据的相同级别的行政边界单元,会因各个国家之间的差异,而在大小和空间精度上呈献出不同。每个国家行政单元的数量和边界空间保真度是LandScan模型的重要参数。行政区域少而面积大的国家需要在模型参数中给予其不同的权重,用来在适当的地理位置确定其实际的人口数量。一般来说,如果行政边界的空间保真度高,那么越小的行政边界就会有越好的人口分布情况。但是,一些地理位置信息资料较少或空间较为特殊的小的行政边界可能会产生人口分布的误差。为了减小这类误差,在可能的情况下,分析师会来对该行政边界区域进行调整、整合,如合并存在误差的低一级的行政边界单元成为省级,然后根据LandScan模型中人口似然位置的算法将一定的人口数量合理分配至该省级区域。

·土地覆盖(Land Cover):准确的土地覆盖数据是人口分布模型中的关键的组成部分。LandScan模型中使用的土地覆盖数据是不同类型分别率的多元化空间数据源的集合。原始数据源自美国国家地理空间情报局(National Geospatial-Intelligence Agency,NGA)与美国地质调查局(United States Geological Survey,USGS),美国国家航空航天局(National Aeronautics and Space Administration,NASA),美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)等多家机构合作的项目,然后通过ORNL(美国能源部橡树岭国家实验室)影像分析技术将所有的数据进行分析、处理后输出成最后的土地覆盖数据集。数据集中的全球土地覆盖数据均经过30 meter或更高的分辨率的影像技术进行过处理。ORNL(美国能源部橡树岭国家实验室)使用前沿的图像处理算法和高性能的计算机来对极高分辨率(~1 meter)的影像进行处理,以进行数据更新或输入。这些更新或录入逐渐变成了今天越来越完整的全球土地覆盖数据集。这些土地覆盖数据是以不同土地利用类型为权重,并排除了部分土地利用类型(如冰川、荒漠等不适合人类居住地区)。

·其他空间数据(Other Spatial Data):高程和坡度也是人口分布模型中重要的组成部分。尽管有时人类也会到达非常高的海拔地带,但长期的居住确实不切实际的。同样,陡坡也不适合人类进行居住,及进行农业,工业方面的发展。这里要说明的是,在LandScan模型中,坡度是以不同坡度类别的有利程度为权重进行使用。在LandScan模型算法中使用的不同的矢量数据层包括道路,人口密集区(城市地带)和人口聚居区(城镇和村庄)。每种数据层都会作为人口位置的似然指标。分析师必须要根据每种数据层中数据的规模,保真度等,将空间数据的不一致性与该地区的居住特点相互匹配,尽量减小误差。

·海岸线(Coastlines):由于一些地区可能存在的复杂的空间格局,海岸线必须要有非常高的分辨率才能准确的标识沿海地带的特点。由于许多的沿海地区的景象可能发生改变,比如海岸线的变化,沿海岛屿数量可能有所变化,地理位置可能变化等等。考虑到这些原因,LandScan模型加大了对于海岸线范围的数据收录,尽可能多的将相应地区的附属的岛屿,地理位置信息收录,并进行及时的更新,并采用了矢量性的海岸线数据,并且土地覆盖数据和高分辨率的影像也被用于去更好的完善沿海地区的情况。

·影像(Imagery):高分辨率的影像技术被应用于LandScan模型中的方方面面。高分辨率的影像用于最基本的确定居住类型和建筑物特点。影像还用于评估模型中不同空间数据层的保真度,以及对模型算法中每层级的权重系数给予一定的参考。初始输出的模型被叠加在高分辨率的影像中,用以验证相关的人口分布情况。一旦有新的空间数据被录入,在似然系数文件中的不同权重系数将会被迭代修改,并且分布算法将会进行重新运算。另外,高分辨率的影像过去常常被用于创建或修改空间数据层,特别是更新或完善与城市边界界定相关的土地覆盖数据。为了加快大型影像处理过程的效率,一种从高分辨率影像中提取的基于纹理与边缘信息的自动化城市边界界定算法正在被研究。

试用申请表

相关产品