多源空間數(shù)據(jù)無縫集成研究

宋關(guān)福,鐘耳順,劉紀(jì)遠(yuǎn),肖樂斌

( 中國科學(xué)院遙感應(yīng)用研究所, 北京 100101; 2. 中國科學(xué)院地理研究所, 北京 100101)

論文來源:地理科學(xué)進(jìn)展

摘要:隨著地理信息系統(tǒng)的社會(huì)化發(fā)展, 空間數(shù)據(jù)共享成為一種必然要求, 然而要真正實(shí)現(xiàn)空間數(shù)據(jù)共享, 多格式空間數(shù)據(jù)集成是一個(gè)亟待解決的問題。多源空間數(shù)據(jù)無縫集成( SIM S) 技術(shù)實(shí)現(xiàn)了一種特殊的數(shù)據(jù)訪問機(jī)制, 不僅提供了直接存取多種數(shù)據(jù)格式的能力, 而且使 GIS 軟件具有跨數(shù)據(jù)源…

關(guān)鍵詞: 地理信息系統(tǒng); 空間數(shù)據(jù)共享; 多源空間數(shù)據(jù)無縫集成; 虛擬空間數(shù)據(jù)引擎

1 引言

如果說地理信息系統(tǒng)( GIS) 應(yīng)用在70 年代處于起步階段、80 年代步入專家應(yīng)用階段、 90 年代實(shí)現(xiàn)了企業(yè)應(yīng)用、那么21 世紀(jì)初則進(jìn)入一個(gè)全新的時(shí)代- 社會(huì)化GIS 時(shí)代( 圖1) 。 GIS 社會(huì)化成為一個(gè)重要的趨勢, GIS 已經(jīng)從純粹地學(xué)的圈子跳出來, 逐步走向社會(huì), 完全融入信息技術(shù) ( IT ) 主流, 并不斷地改變著IT 。

隨著GIS 的社會(huì)化進(jìn)一步深入, 隨著網(wǎng)絡(luò)( 特別是Internet) 的廣泛應(yīng)用, 空間數(shù)據(jù)共享 ( Spatial Data Shar ing ) 已經(jīng)成為一種必然的要求, 然而地理信息要真正實(shí)現(xiàn)共享, 必須解決地理信息數(shù)據(jù)多格式集成這一瓶頸[ 1] 。

2 地理信息多格式集成的幾種模式

隨著地理信息系統(tǒng) ( GIS) 的廣泛應(yīng)用, 產(chǎn)生了大量寶貴的空間數(shù)據(jù), 成為當(dāng)今信息社會(huì)的一筆寶貴財(cái)富。幾十年來, GIS 軟件層出不窮, 導(dǎo)致空間數(shù)據(jù)格式多樣性。如何充分利用這些數(shù)據(jù)資源, 是GIS 應(yīng)用中亟待解決的問題。

2. 1 數(shù)據(jù)格式轉(zhuǎn)換

對(duì)其他軟件數(shù)據(jù)格式的包容性, 是衡量一個(gè)GIS 的軟件是否成功的重要標(biāo)準(zhǔn)之一。數(shù)據(jù)格式轉(zhuǎn)換, 是集成多格式數(shù)據(jù)的一種通用方法。GIS 軟件通常都提供與多種格式交換數(shù)據(jù)的能力。數(shù)據(jù)交換一般通過文本的 ( 非二進(jìn)制的) 交換格式進(jìn)行, 為了促進(jìn)數(shù)據(jù)交換, 美國國家空間數(shù)據(jù)協(xié)會(huì)( NSDI) 制定了統(tǒng)一的空間數(shù)據(jù)格式規(guī)范SDT S ( Spatial Data T ransfer Standard ) ; 我國也制定了地球空間數(shù)據(jù)交換格式的國家標(biāo)準(zhǔn)CNSTDF ( Chinese Spatial Data T ransfer For mat) 。業(yè)界還流行著一些著名軟件廠商制定的交換格式, 如AutoDesk的DXF、ESRI 的E00、MapInfo 的 M IF 等, 由于廣為大眾所接受, 成為事實(shí)上的標(biāo)準(zhǔn)( F acto-standard) 。

由于缺乏對(duì)空間對(duì)象統(tǒng)一的描述方法, 不同格式用以描述空間數(shù)據(jù)的模型不盡相同, 以至于數(shù)據(jù)格式轉(zhuǎn)換總會(huì)導(dǎo)致或多或少的信息損失。DXF 著重描述空間對(duì)象的圖形表達(dá) ( 比如: 顏色、線型等) , 而忽略了屬性數(shù)據(jù)和空間對(duì)象之間的拓?fù)潢P(guān)系; E00 側(cè)重于描述空間對(duì)象的關(guān)系 ( 如拓?fù)潢P(guān)系) 而忽略了其圖形表達(dá)能力。因此, CAD 數(shù)據(jù)輸出為E00 格式將丟失顏色、線型等信息; 而Arc/ Info 數(shù)據(jù)輸出到DXF 時(shí)則會(huì)損失拓?fù)潢P(guān)系和屬性數(shù)據(jù)等有價(jià)值的信息。

另外, 通過交換格式轉(zhuǎn)換數(shù)據(jù)的過程較為復(fù)雜, 需要首先使用軟件A 輸出為某種交換格式, 然后再使用軟件B 從該交換格式輸入。一些單位同時(shí)運(yùn)行著多個(gè)使用不同GIS 軟件建立的應(yīng)用系統(tǒng)。如果數(shù)據(jù)需要不斷更新, 為保證不同系統(tǒng)之間數(shù)據(jù)的一致性, 需要頻繁進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換。

2. 2 數(shù)據(jù)互操作

數(shù)據(jù)互操作模式是OpenGIS Consortium ( OGC) 制定的數(shù)據(jù)共享規(guī)范。GIS 互操作是指在異構(gòu)數(shù)據(jù)庫和分布計(jì)算的情況下, GIS 用戶在相互理解的基礎(chǔ)上, 能透明地獲取所需的信息。OGC 為數(shù)據(jù)互操作制定了統(tǒng)一的規(guī)范, 從而使得一個(gè)系統(tǒng)同時(shí)支持不同的空間數(shù)據(jù)格式成為可能。根據(jù)OGC 頒布的規(guī)范, 可以把提供數(shù)據(jù)源的軟件稱為數(shù)據(jù)服務(wù)器 ( Data Ser ver s) , 把使用數(shù)據(jù)的軟件稱為數(shù)據(jù)客戶 ( Data Clients) , 數(shù)據(jù)客戶使用某種數(shù)據(jù)的過程就是發(fā)出數(shù)據(jù)請(qǐng)求, 由數(shù)據(jù)服務(wù)器提供服務(wù)的過程, 其最終目的是使數(shù)據(jù)客戶能讀取任意數(shù)據(jù)服務(wù)器提供的空間數(shù)據(jù)。OGC 規(guī)范基于OMG 的CORBA、Microsoft 的OLE/ COM 以及SQL 等, 為實(shí)現(xiàn)不同平臺(tái)間服務(wù)器和客戶端之間數(shù)據(jù)請(qǐng)求和服務(wù)提供了統(tǒng)一的協(xié)議。 OGC 規(guī)范正得到OM G 和ISO/ T C211 的承認(rèn), 從而逐漸成為一種國際標(biāo)準(zhǔn), 將被越來越多的GIS 軟件以及研究者所接受和采納。目前, 還沒有商業(yè)化GIS 軟件完全支持這一規(guī)范。

數(shù)據(jù)互操作為多源數(shù)據(jù)集成提供了嶄新的思路和規(guī)范。它將 GIS 帶入了開放式的時(shí)代, 從而為空間數(shù)據(jù)集中式管理和分布存儲(chǔ)與共享提供了操作的依據(jù)。OGC 標(biāo)準(zhǔn)將計(jì)算機(jī)軟件領(lǐng)域的非空間數(shù)據(jù)處理標(biāo)準(zhǔn)成功地應(yīng)用到空間數(shù)據(jù)上。但是OGC 標(biāo)準(zhǔn)更多考慮到采用了OpenGIS 協(xié)議的空間數(shù)據(jù)服務(wù)軟件和空間數(shù)據(jù)客戶軟件, 對(duì)于那些歷史存在的大量非OpenGIS 標(biāo)準(zhǔn)的空間數(shù)據(jù)格式的處理辦法還缺乏標(biāo)準(zhǔn)的規(guī)范。而從目前來看, 非OpenGIS標(biāo)準(zhǔn)的空間數(shù)據(jù)格式仍然占據(jù)已有數(shù)據(jù)的主體。

數(shù)據(jù)互操作規(guī)范為多源數(shù)據(jù)集成帶來了新的模式, 但這一模式在應(yīng)用中仍存在一定局限性: 為真正實(shí)現(xiàn)各種格式數(shù)據(jù)之間的互操作, 需要每種格式的宿主軟件都按照統(tǒng)一的規(guī)范實(shí)現(xiàn)數(shù)據(jù)訪問接口, 這在一定時(shí)期內(nèi)還不現(xiàn)實(shí)。

為解決數(shù)據(jù)格式轉(zhuǎn)換帶來的種種問題, 理想的方案是在一個(gè)軟件中實(shí)現(xiàn)對(duì)多種數(shù)據(jù)格式的直接訪問。多源空間數(shù)據(jù)無縫集成 ( Seam less Integration of M ulti-so ur ce Spatial-data——SIM S) 就是這樣一種技術(shù)。

更多內(nèi)容請(qǐng)查看pdf