GIS 中矢量多邊形網格化問題研究

GIS 中矢量多邊形網格化問題研究
 
2005-6-21 15:41:34    作者- 朱良峯,吳信才 ,劉修國    來源- 中國地質大學研究生   閱讀768次   [ ]
 
摘要:在實際的GIS 空間分析過程中,爲了更加簡便快捷的實現某些特定的空間分析功能,常常需要將不規則的矢
量多邊形區域轉化爲規則的格網區域。該文介紹了矢量多邊形網格化的四類算法:中心點歸屬法、面積佔優法、重
要性法和麪積內插法。其中面積內插法又可分爲面積權重內插法、基於表面模型的面積內插法和基於統計模型的
面積內插法。同時介紹了各類算法的實現思想,並比較了其優劣及應用範圍,認爲基於表面模型的面積內插法是
一種比較理想且極具發展前景的矢量多邊形網格化方法。
關鍵詞:地理信息系統;矢量多邊形;網格化;面積內插
中圖分類號:P208   文獻標識碼:A   文章編號:1672 - 0504 (2004) 01 - 0012 - 04
  地理信息系統( GIS) 是對與地理空間相關的信息進行有效管理與綜合分析的計算機系統, GIS 把各種與空間信息相關的技術與學科有機的融合在一起,並與不同數據源的空間與非空間數據相結合,通過空間操作與模型分析,提供對規劃、管理、決策有
用的信息產品[ 1 ,2 ] 。目前,GIS 已成爲處理空間信息的標準方法。GIS 的核心功能是空間分析,它特有的對地理空間信息特別是隱含信息的提取、表現和傳輸功能[ 3 ] ,是GIS 區別於一般信息系統的主要功能特徵。在進行GIS 空間分析時,所獲取的空間數
據有相當大的一部分與一定的空間區域分佈有關,對這些數據,多數GIS 系統採用分層存儲的方式進行處理,即將空間信息劃分爲衆多專題圖層(由於大多數區域單元的邊界是不規則的,這些專題圖層在數據結構上表現爲不規則的矢量多邊形) ,然後對這
些專題圖層進行相應的空間分析操作。但直接對這些不規則的矢量多邊形區域進行各類空間分析操作並不容易,例如,區域疊加就是一類常見的空間分析操作,但由於矢量多邊形的數據結構複雜,對矢量多邊形區域進行疊加操作後常會出現“碎屑多邊形”(Sliver polygon) ,雖然可採用一些算法(如設定一模糊容限) 來消除它,但這會明顯降低空間分析的精度。另外,對多個矢量多邊形區域疊加後的結果也
不易進行其它分析與量算。因此,在進行實際的空間分析時,常常需要將邊界不規則的矢量多邊形區域轉換爲邊界較爲規則的格網狀區域(如正方形、三角形或矩形區域) ,再對這些格網狀區域進行各種空間分析操作與屬性運算。相比於不規則的矢量多邊
形區域,格網區域的數據結構簡單,易於在其上進行各種空間分析操作(特別是區域疊加操作) ,並可及時更新數據,從而使信息具有較強的現勢性。本文介紹將不規則矢量多邊形區域網格化爲規則的格網區域時出現的問題及解決辦法,在分析現有網格化算法的基礎上,闡明各類算法的優缺點及應用領域,以期能對實際的GIS 空間分析起一定的指導作用。1  矢量多邊形網格化算法從本質上來講,矢量多邊形區域網格化是一個
從源區域(不規則的矢量多邊形區域) 到目標區域(規則的格網區域) 的轉換過程,這種轉換不僅包括區域邊界形狀的改變,更重要的是它還包括源區域所包含的屬性信息到目標區域的屬性信息的轉換。按照屬性信息轉換規則的差異,矢量多邊形網格化有四類算法[ 3 - 6 ] ,即中心點歸屬法、面積佔優法、重要性法和麪積內插法。在矢量多邊形網格化時,應使生成的格網區域儘量保持區域屬性的真實性,最
大限度保留或體現源區域所蘊含的屬性信息。下面以一個簡單的研究實例來說明各類算法的實現思想和應用範圍。
如圖1 所示,研究區域按照自然地理邊界可劃分爲三個多邊形區域A、B、C ,各區的屬性信息見表1 。現在需要將研究區域網格化爲50 ×50 m 的格網狀區域(圖2) 。不可避免地,網格化後得到的格網區域可能有落在多個源區域的情況(如圖2 中含陰影
斜線的格網區域a 、b、c) 。那麼,究竟該按照怎樣的規則才能實現最大限度地合理推定這些格網區域上
的屬性值呢?

此主題相關圖片如下:
按此在新窗口瀏覽圖片
 (1) 中心點歸屬法是一種最爲簡單的屬性判別方法,它將各個格網區域中心點所在的源區域的屬性值作爲整個格網區域(目標區域) 的屬性值。按照中心點歸屬法的規則,在圖2 中,網格a 的中心點落在源區域B 內,所以格網區域a 的屬性值與B 同,即:面積爲2 500 m2 ,人口密度爲1 97414 人P km2 ,人口總數爲4194 人;網格b 的中心點落在源區域C內,屬性值與C 同,即:面積爲2 500 m2 ,人口密度爲
3 05711人P km2 ,人口總數爲7164 人;網格c 的中心點落在源區域A 內,屬性值與A 同,即:面積爲2 500m2 ,人口密度爲2 75511 人P km2 ,人口總數爲6189人。一般而言,中心點歸屬法適用於具有連續分佈特徵的地理要素,如降水量分佈、人口密度圖等。在
實際應用時,可能會有格網區域的中心點落在多個源區域的邊界上而無法判別中心點位置歸屬的情況,這需要結合其他方法(如面積佔優法、重要性法
或者面積內插法) 來確定,或者直接由分析者根據經驗和需要來指定其屬性值。(2) 面積佔優法是指由在格網區域的組成中佔
面積比例最大的源區域的屬性值來決定整個格網區域的屬性值,它適用於分類較細、格網較小的情況。在圖2 中,按照面積佔優法的規則,格網區域a 和b的屬性值不變;格網區域c 屬性值應爲:面積2 500m2 ,人口密度3 05711 人Pkm2 ,人口總數7164 人。
(3) 重要性法是指根據落在格網區域內不同源區域的重要性而選取最重要的源區域來決定該格網區域的屬性值,它適用於具有特殊意義且面積較少的區域。如在圖2 中,若源區域A 的社會經濟發展水平遠較源區域B、C 爲高,且需要重點考察源區域A內的人口分佈情況(或其他相關的空間信息分佈) ,則可按照重要性法將圖2 中的格網區域a 、b、c的屬性值都賦爲與源區域A 相同。
(4) 上面的三種方法都是以一個源區域的屬性值來決定目標區域(格網區域) 的屬性值,但事實上,目標區域往往是由多個源區域組成的,這就需要考慮它們的共同作用與影響。面積內插法可以有效的解決這個問題。所謂面積內插,是指按照源區域空間數據的分佈特徵與規律,採用一定的插值算法求取目標區域中的數據分佈[ 7 ,8 ] 。面積內插算法有多種,總體上可分爲三類:面積權重內插法、基於表面
模型的面積內插法、基於統計模型的面積內插法。
2  面積內插模型及相關算法
2. 1  面積權重內插法
面積權重內插法是一種比較簡單且相對直觀的算法,它根據規則格網區域內各源區域所佔面積的百分比來確定格網區域的屬性數值[ 6 ,7 ] 。應用面積權重內插法進行矢量多邊形網格化的主要步驟如
下:1) 找出落在各個規則格網區域上的源區域;2) 確
定各個源區域與規則格網區域相交部分的面積,並
計算其佔格網區域面積的百分比;3) 按照面積比例
的多少來分配屬性值。
Goodchild 和Lam 在文獻[8 ]中深入闡述了面積
權重內插的問題。認爲數值型空間屬性變量可分爲
兩種最基本的類型[ 8 ] :和值變量(extensive 變量) 和
均值變量(intensive 變量) 。在實際應用時,面積權
重內插法針對不同類型的屬性變量有不同的表現形
式。某區域t 內和值變量X 的值Xt 等於組成該區
域各子區域屬性變量值(Xi ) 的總和,即: Xt =Σ
n
i = 1
Xi 。
某區域t 內均值變量Y 的值Yt 等於組成該區域各
子區域屬性變量值( Yi ) 按面積(Ai ) 比例的加權平均
值,即: Yt =Σ
n
i = 1
(Ai Yi )PΣ n
i = 1
Ai 。顯然,在圖1 所示的例
子中“, 人口總數”是和值變量,而“人口密度”則是均
值變量。圖3 是從圖2 中抽取的局部區域的放大
圖,按照面積權重內插法的規則進行計算,求得格網
區域a 、b、c 的屬性值(表2) ;這顯然與前文的中心點
歸屬法、面積佔優法或者重要性法的計算結果都不
同。類似地,可以計算出圖2 中其它格網區域的屬
性值。

此主題相關圖片如下:
按此在新窗口瀏覽圖片
2. 2  基於表面模型的面積內插法
數字表面模型(DTM) 是利用一個任意座標場中
大量選擇的X、Y、Z 的座標點對連續表面的一個簡
單的統計表示[ 9 ] 。DTM 是從DEM 的基礎上發展起
來的,但它比DEM 的含義更爲豐富,DTM 包含了地
形起伏和屬性兩個方面的含義,而且有時更主要的
是指“屬性”方面的含義。因此,可以使用基於表面
模型的內插算法來進行矢量多邊形網格化後屬性值
的插值計算。當前,基於DTM 的內插已經有衆多成
熟的算法,按照內插的性質可分爲整體內插和局部
內插(又包括分塊內插和逐點內插) 兩類[ 9 ] ,相應地,
基於表面模型的面積內插也分爲兩類。
2. 2. 1  整體內插算法 整體內插算法又稱全局光
滑算法,它的插值函數由研究區域內所有采樣點的
屬性值來確定,進而可利用這個插值函數進行全區
域的特徵擬合。常用的整體插值算法有多項式趨勢
面擬合、傅立葉分析、小波變換等[ 3 ,9 ] 。應用整體插
值算法計算矢量多邊形網格化後區域屬性值的基本
步驟如下:1) 對於屬於和值變量的源區域的屬性數
據,需先轉換爲均值變量(如“人口總數”需先轉換爲
“人口密度”) ;2) 找出源區域的中心點,將屬性數據
連接到中心點上;3) 使用一種整體內插算法(如多項
式趨勢面擬合等) ,將中心點的屬性數據內插成網格
表面;4) 求出落在每個格網區域上的均值屬性數據;
5) 如果需要求出和值變量屬性數據,將均值變量數
據乘以格網區域的面積即可得出。
整體內插算法易於理解,處理屬性分佈變化簡
單的區域時運算量小,採用低次多項式即可。但當
屬性分佈複雜時,隨着採樣點的增多,插值函數會變
得極不穩定,插值結果會出現難以控制的震盪現象。
另外,在這種情況下還需要解高次的線性方程組,源
區域中採樣點位置或屬性的微小變動都有可能導致
高次多項式參數的極大變化,從而使高次多項式插
值難以得到穩定解[ 9 ] 。該算法在實現時還存在一些
其他的問題,如源區域的中心點有可能落在區域之
外,從而導致插值的結果與實際的空間分佈差別較
大。所以,整體內插算法雖然容易理解,卻無法表達
短尺度的、局部的複雜變化,其解的不穩定性也決定
了該算法很少直接應用於空間插值,而是僅僅用於
檢測整個區域中不同於總趨勢的最大偏離部分。
2. 2. 2  局部內插算法 局部內插算法只使用鄰近
的數據點來估計未知點的屬性值,它可以保留局部
細節在空間區域上的變化,因而獲得廣泛應用。局
部內插的核心問題是鄰近區域的確定。按照內插時
鄰近區域的幾何形態(包括形狀、大小、位置) 是否可
變,局部內插可分爲分塊內插和逐點內插[ 9 ] 。分塊
內插將整個插值空間區域分成若干分塊,對各個分
塊採用不同的函數,但分塊範圍在整個內插過程中
一經確定則不能改變;逐點內插則無此限制,它以待
插點爲中心,定義一個局部函數來擬合周圍的數據
點,鄰近區域的範圍隨待插值點位置的變化而變化。
逐點內插雖然運算量較大,但靈活方便,且內插結果
精度較高,所以應用廣泛。常用的分塊內插算法有:
線性內插算法、雙線性多項式內插算法、二元樣條函
數內插、多面函數法、最小二乘配置法等[3 ] 。常用的
逐點內插算法有:最近鄰點法(Voronoi 多邊形法) 、移
動平均值法(距離倒數插值) 、空間自協方差最佳插值
法(克里金法) 等[9 ] 。基於局部內插算法進行矢量多
邊形網格化的基本步驟與整體內插算法類似,只是在
第3) 步中使用一種局部內插算法,此處不再贅述。
各種內插算法在不同的屬性分佈區域和源區域
控制點不同的採樣方式下會有不同的誤差和精度。
分塊內插的主要問題是分塊大小的確定。分塊的大
小應根據屬性分佈的複雜程度和源區域採樣點的分
布密度來確定,一般要求兩個鄰近的分塊間要有一
定的重疊,以保證兩個分塊間光滑連續的拼接。目
前,還沒有一種智能化或自適應的分塊內插方法來
確定分塊的大小。逐點內插的計算量要比分塊內插
大,其關鍵問題是內插窗口域的確定,採用不同的內
插窗口域將會嚴重影響內插的速度和精度。基於
Voronoi 多邊形的逐點內插方法被認爲是一種較好
的局部內插算法。
2. 3  基於統計模型的面積內插法
在現實世界中,很多空間屬性信息的分佈是遵
循一定規律的,可採用一定的數學分佈模型(如泊松
分佈、二項式分佈或正態分佈) 來表達其空間變化特
徵[ 4 ,10 ] 。顯然,面積權重內插法和基於表面模型的
面積內插算法都沒有考慮這種數學分佈模型的作
用,因此,其插值結果可能會與實際的空間分佈出入
甚大。一種比較新的解決方案是將這些數學統計模
型應用於面積內插,得到一個覆蓋全區的通用函數,
然後將這個函數應用於各個格網區域上,從而求得
各格網區域的屬性值。基於統計模型的面積內插算
法利用附加的空間數據數學分佈模型,採用隨機的
概念來處理面積內插的不確定性問題,從理論上講
應該具有更高的精度[ 5 ] 。但是該方法在實踐中難度
較大,因爲附加的空間數據數學分佈模型的獲取並
不容易,而又有許多的實際數據很難判斷其究竟該
採用何種數學分佈模型來描述,這大大限制了其應
用的範圍與發展前景。因此,目前還很少見到該算
法在矢量多邊形網格化中的實際應用。
3  結語
格網區域數據作爲GIS 中一類重要的數據組織
方式,對GIS 各種分析功能的應用與實現有着極爲
重要的意義。矢量多邊形區域數據則是另一類被廣
泛應用的實際數據表現形式,矢量多邊形區域數據
到格網區域數據的轉化方法決定了格網數據的精
度,並影響後續空間分析結果的精度。因此,將不規
則的矢量多邊形區域轉換爲規則的格網區域時,應
根據屬性數據的分佈特徵與應用要求選用適當的算
法。當前,在大多數GIS 軟件上都能實現中心點歸
屬法、面積佔優法、重要性法和麪積權重內插法,ArcP
Info 的Grid 模塊更是實現了一些基於表面模型的面
積內插算法,而基於統計模型的面積內插算法則應用
較少,主要是因爲該方法需要附加信息且非常複雜煩
瑣。需要指出的是,面積內插並不僅僅應用於矢量多
邊形區域網格化,它還有更爲深廣的應用。事實上,
一切由源區域到目標區域(可能也爲不規則的矢量多
邊形區域) 的轉換(這在GIS 的空間分析中是極爲常
見的) 都可以進行面積內插[11 ] 。因此,更爲全面徹底
地研究各類面積內插算法的實現並評估其精度就無
可避免的成爲當前一個極爲迫切的任務。
參考文獻:
[1 ]  修文羣,池天河. 城市地理信息系統[M] . 北京:希望電子出版
社,1999.
[2 ]  吳信才. 地理信息系統的基本技術與發展動態[J ] . 地球科學—
中國地質大學學報,1998 ,23 (4) :329 - 333.
[3 ]  鄔倫, 劉瑜, 張晶, 等. 地理信息系統———原理、方法和應用
[M] . 北京:科學出版社,2000.
[4 ]  呂安民,李成名,林宗堅. 面積內插算法初探[ J ] . 測繪通報,
2002 ,24 (1) :44 - 46.
[ 5 ]  劉建軍,李春來. 基於遙感和GIS 的巢湖流域人口信息提取
[J ] . 科學通報,2002 ,47 (23) :1835 - 1837.
[6 ]  呂安民,李成名,林宗堅. 人口統計數據的空間轉換[J ] . 乾旱區
地理,2002 ,25 (2) :170 - 175.
[ 7 ]  呂安民,李成名,林宗堅. 面積內插方法及其在GIS 中應用[J ] .
地球信息科學,2001 ,5 (4) :25 - 29.
[ 8 ]  GOODCHILD , LAM. Areal interpolation : a variant of the tradi2
tional spatial problem [J ] . Geo - Processing ,1980 , 27 (1) : 297 -
312.
[9 ]  李志林,朱慶. 數字高程模型[M] . 武漢:武漢測繪科技大學出
版社,2000.
[10 ]  呂安民,劉海啓,李成名,等. 人口密度的面積內插算法研究
[J ] . 中國農業資源與區劃,2002 ,23 (1) :35 - 40.
[11 ]  郭仁忠. 空間分析[ M] . 武漢: 武漢測繪科技大學出版社,
2000.
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章