(1. 中國科學院地理科學與資源研究所,北京100101;2. 中國科學院大學,北京100049; 3. 國家林業(yè)局林產工業(yè)規(guī)劃設計院,北京100714)
論文來源:地球信息科學學報
摘要:普查數據是地理學空間分析的重要數據源。由于受到數據與計算機處理能力的限制,以往的研究對普查數據空間分析的不確定性未給予足夠重視,也未形成成熟的研究方法。
關鍵詞: 多邊形統計數據;空間分析;不確定性;可塑面積單元問題
1引言
普查數據通常是以行政區(qū)為單元,通過普查、抽樣等方式逐級匯總得到的典型統計型數據[1]。在地理信息系統中,該數據一般是作為行政區(qū)多邊形對象的屬性數據進行存儲。因此,本文將該類統計數據稱為多邊形統計數據,其在地理學及社會科學研究中較易獲得,可得到廣泛使用。該類數據的空間分析較好地揭示了研究對象的空間分布特征[2-3],可服務于政府及企業(yè)的戰(zhàn)略決策工作[4]。因此,對于多邊形統計數據空間分析的研究方法、評價手段及應用模式的分析,具有重要的研究意義和科學價值。本文以多邊形統計數據空間分析的不確定性,研究多邊形統計數據的可塑面積單元問題效應對空間分析結果的影響模式,從而對多邊形統計數據空間分析做出評價。
多邊形數據空間分析通常以空間統計學為基礎,很大程度上與空間數據的描述與探索有關。由于數據本身不滿足經典統計學獨立性的假設,許多情況下,經典假設檢驗方法不適用多邊形統計數據空間分析[5]。經過多年的研究,多邊形統計數據的空間分析方法逐漸發(fā)展成為描述性、空間統計的兩大類核心分析方法[6]。這兩類方法均依賴多邊形的距離、方向、形態(tài)特征、鄰近關系等多邊形自身的空間特征。其中,描述性方法通常為對多邊形的屬性數據表進行簡單的單元統計,如總值、標準差、均值等,及對屬性數據的可視化直觀表達。在空間統計分析中,統計區(qū)(多邊形)組成統計區(qū)集合P,P中每一個統計區(qū)pi 具有統計指標zi;P 的鄰接矩陣W= {wij}表達了多邊形之間的鄰接關系。wij = 1表示統計區(qū)pi與統計區(qū)pj相鄰,wij = 0表示統計區(qū)pi與統計區(qū)pj不相鄰。多邊形統計數據的空間統計分析就是基于多邊形鄰接關系W及相應統計指標的統計分析方法,具體有空間自相關分析與空間集聚分析等。
在地理學及社會科學研究中,不確定性(uncer-tainty)是一個抽象概念,其含義比誤差(error)更為廣泛[7-8],既包含隨機誤差、系統誤差及粗差,也包含數值概念上的誤差。多邊形統計數據是現實的一個抽象表達,不可避免地存在對所表達的現實特性的不確定性。這種不確定性可以由多邊形空間位置的不確定性、拓撲不確定性,及屬性的不確定性等引起[9],也可以由空間分析采用的分析方法導致[10]。對多邊形統計數據而言,針對空間數據質量本身,以多邊形頂點位置坐標精度誤差去衡量多邊形空間誤差及相應的屬性數據與實測數據不相符的情況。然而,在實際應用中,多邊形統計數據作為唯一可靠的研究數據,研究中其不確定性卻往往被忽視,主要原因[7]:(1)缺乏數據。在多數研究中,多邊形統計數據是唯一可獲得的研究數據,因此,以往的研究只能采用不同等級行政區(qū)劃數據對該問題進行一般的說明。(2)計算機處理能力的限制。
對多邊形統計數據空間不確定性研究需要很強的圖形及數據處理能力,需要相應的計算機硬件和軟件的支持。(3)對于多邊形統計數據空間分析的不確定性研究尚未形成成熟的方法。因此,本文提出了一種基于多邊形空間特征的多邊形統計數據空間分析不確定性研究方案。
更多內容請查看pdf