首页 > 范文大全 > 正文

基于OLS和GWR模型的区域土地适宜性模拟研究

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于OLS和GWR模型的区域土地适宜性模拟研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

【摘 要】本文以合肥市包河区为研究区,考虑驱动因子对土地利用适宜性的影响,用全局最小二乘法OLS Logistic回归模型和GWR Logistic模型来建立土地利用格局与其驱动因子之间的回归模型,并进行土地利用格局模拟的实例研究与模型比较。同时,运用此模型定量地分析影响区域土地利用变化的内在机制,预测土地利用未来变化的趋势,可以为包河区及其类似地区的土地利用规划决策提供科学依据。

【关键词】土地适宜性;地理加权回归;模拟

土地利用/覆被变化(Land Use/Cover Change,简称LUCC)研究是对土地利用的数量、质量和空间布局等变化的综合分析。目前流行的方式是在进行土地利用变化驱动力建模时,运用基于全局最小二乘法(Ordinary Least Squares,简称ols)的回归分析方法,对各因子进行全局的参数估计。当考虑某一驱动因子在不同空间位置对土地利用格局的影响程度不同时,常采用地理加权回归(Gergraphically Weighted Regression,简称gwr模型。该模型是对传统回归分析的扩展,允许局部而不是全局的参数估计,通过附加表达空间对象本身相关性和异质性的变化参数,反映样本对回归方程贡献在空间上的分异,使回归结果更加可信。两种方法适用情况不同,在地理要素的空间分析和建模中都有广泛应用。

据此,本文以合肥市包河区为例,考虑驱动因子对土地利用格局的影响,采用OLS和GWR模型来建立土地利用格局与其驱动因子的回归模型,并进行验证和分析。

1 研究区与数据准备

1.1 研究区概况

包河区位于合肥东南迎风口,襟"五河"(包河、南淝河、十五里河、塘西河、派河)而带“一湖”(全国五大淡水湖之一的巢湖)。全区区域面积340平方公里(其中巢湖水面面积70平方公里),辖7个街道、2个镇、1个省级工业园区,常驻人口81万,是合肥市四个城区中面积第一大区、人口第一大区。

包河区属亚热带湿润季风气候年平均气温15~16℃,年日照时数2100H ,多年平均降雨量900~1000mm,且时空分布不均,年内和年际变化很大,最大年降雨量与最小年降雨量相差2~3倍,梅雨显著,夏雨集中。地形、地貌及生态环境状况具典型的江淮分水岭特征,表现为丘陵地貌,地形破碎,干旱缺水,水土流失严重。随着经济发展、人口持续增长和省会城市的辐射影响,城镇和农村建设用地快速扩张,耕地锐减,已严重影响了区域粮食安全和生态系统的稳定。

1.2 数据准备

本研究所使用的土地利用数据来源于包河区2005年土地利用变更调查数据,参考国际粮农组织(Federal Agriculture Organization, 简称FAQ)的土地覆盖分类系统(Land Cover Classification System, 简称LCCS),考虑包河区土地利用特点,结合TM遥感影像对矢量的土地利用现状图进行重分类,得到农业用地、林业用地和城市用地3种土地利用类型。同时,研究利用包河区数字高程模型、自然环境、经济社会等数据,选取坡度、离水系距离这两个自然环境因子和离交通距离、人口密度这两个社会经济因子,作为包河区土地利用空间格局形成和演变的主要驱动因子,应用GIS空间分析的方法对其进行空间量化。

2 研究方法

土地利用变化驱动力建模常采用对评价因子采取某种或多种评价方法,从而获取评价结果的方式。对于评价方法,可以有多种多样的选择,如图1。

本研究采用线性关系,将全局OLS Logistic回归模型和GWR模型应用于土地利用格局模拟的回归建模中,考虑驱动因子对土地利用格局影响的空间不稳定性,对两者进行分析与比较。具体来说,分以下几步:

Step1:根据已有的2005年包河区土地利用类型,并采用重分类将各种不同类型用地分开。

Step2:数据预处理的另一部分工作是将驱动因子空间量化,包括距离交通、人口密度、距离水系和坡度四类因子。

Step3:将上述土地利用类型图和驱动因子空间量化图栅格化,并将每个栅格图层中的所有栅格单元值转换为文本文件,并导入Excel中。

Step4:将所得数据导入SPSS 17.0进行OLS Logistic逐步回归和ROC曲线图。

Step5:将土地利用类型图层和驱动因子图层导入ArcMap 9.3中,利用工具分别对其进行OLS和GWR回归分析。

3 结果与分析

3.1 定性分析结果

基于前述理论,首先在ArcMap中应用工具对土地利用类型和驱动因子图层定性的进行OLS Logistic回归和GWR分析,并与2005年现状对比,如图2所示。

定性分析中,对2005年各类型土地利用类型二值化表明实际的用地情况,以此作为分析结果的参照标准。如果不同分析模型反演土地格局与城市现状越近似,说明其解释能力越强,模型越贴合。分析完成后,将应用OLS Logistic模型和GWR模型的土地适宜性概率计算结果分层,并比较图形取极值部分(极大或极小)分布范围与城市现状二值图中黑色部分,可以发现,OLS Logistic模型的分析结果与现状相符程度更高,这也说明OLS Logistic回归分析模型更适合,我们将在后文中应用OLS Logistic回归分析模型作定量分析。

3.2 Logistic回归结果

本研究选取的候选因子包括:离水系距离、坡度、离交通距离和人口密度等对土地利用分布格局影响较大且相对稳定的因素,在SPSS中处理分析得出结果如表1。

β系数为Logistic回归方程诊断出的关系系数,Expβ是β系数以e为底的自然幂指数,其值等于事件的发生比率。发生比率表示为驱动因子每增加一个单位,土地利用类型发生比的变化情况,Expβ< 1,发生比减少;Expβ=1,发生比不变;Expβ> 1,发生比增加。发生比是事件的发生频数与不发生频数之间的比。

从表中可以看出,除坡度因子的Expβ在1的左右变动较大外,其他因子对所有土地利用类型的Expβ都很接近于1。这说明通过Logistic回归方程可知坡度因子对结果影响较大。

3.3 ROC曲线图结果

将所有候选因子分别与城市用地、林业用地和农业用地做ROC曲线图,结果如表2。

ROC 曲线下的面积越接近1,说明预测精度越高。通常,当ROC值大于0.7时,可以认为所选取的驱动因素具有较好的解释能力。在所有ROC面积中,离水系距离对城市用地的解释和离交通距离对林业用地的解释超过了0.85。离交通距离对林业用地的影响明显大于对其他用地类型;人口密度对城市用地和农业用地的影响接近,对林业用地影响较小;离水系距离对城市用地的影响很大,而对林业用地影响很小;坡度则对三种用地类型影响程度接近。可见,影响城市用地的主要是离水系距离,其次是人口密度;影响林业用地的主要是离交通距离和坡度因子;影响农业用地的因子较多,除离交通距离影响不大外,其他因子影响能力接近。

4 不足与展望

本次所得到结果的准确性还有很多可提升的方面。首先候选因子数量需要增加。如果候选因子更多,可以先做OLS Logistic逐步回归,建立回归方程。然后,选择进入方程的因子作为GWR Logistic的变量。其次,数据处理过程中,可以考虑避开应用现成的工具,而用程序控制栅格像元值,可能可以取得更好的效果。此外,在方法的选择上,本研究也只应用了两种模型。如果条件允许,应该尝试多种模型,甚至混合使用。

土地适宜性评价还存在更多可探索的方面。今后可以尝试将形成的各土地利用类型概率图栅格化,每个栅格单元取用途概率最大值,合成一幅模拟的合理土地利用类型规划图,并与以后年份的土地利用实际状况图比较,分析政策约束对土地利用类型起到的影响和作用。

【参考文献】

[1]陈佑启,杨鹏.国际上土地利用土地覆盖变化研究的新进展[J].经济地理, 2001,21(1):95-100.

[2]史培军,宫鹏,李晓兵,等.土地利用/土地覆盖变化研究的方法与实践[M].北京: 科学出版社,2000.

[3]邵一希,李满春,陈振杰,等.地理加权回归在区域土地利用格局模拟中的应用:以常州市孟河镇为例[J].地理科学,2010,30(1):92-97.

[4]Verburg P H, Soepboer W, Veldkamp A, et al. Modeling the Spatial Dynamics of Regional Land Use: The CLUE-S Model[J]. Environment Management, 2002, 30(3): 391-405.

[5]Fotheringham A S, Chris Brunsdon, Martin Charlton. Geographically weighted regression[M]. U.K. West Sussex: John Wiley & Sons Ltd, 2002.

[6]Verburg P H. Tutorial CLUE-S and DYNA-CLUE[Z]. Handbook of CLUE-S Model, 2008.