1 中國科學(xué)院地理科學(xué)與資源研究所,北京,100101
2 環(huán)境保護(hù)部衛(wèi)星環(huán)境應(yīng)用中心,北京,100094
3 北京超圖軟件股份有限公司,北京,100015
論文來源:《武漢大學(xué)學(xué)報 · 信息科學(xué)版》第42卷 第2期2017年2月
摘要:基于關(guān)系型數(shù)據(jù)庫的空間數(shù)據(jù)存儲與處理是地理信息系統(tǒng)(geographic information system,GIS)領(lǐng)域的主流模式,但伴隨著物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、云計算及空間數(shù)據(jù)采集技術(shù)的發(fā)展,空間數(shù)據(jù)已從海量特征轉(zhuǎn)變?yōu)榇髷?shù)據(jù)特征,對空間數(shù)據(jù)的存儲和管理在數(shù)據(jù)量和處理模式上提出了新的挑戰(zhàn)...
關(guān)鍵詞: 空間數(shù)據(jù)庫,大數(shù)據(jù),NoSQL數(shù)據(jù)庫,分布式存儲
新技術(shù)的發(fā)展給空間數(shù)據(jù)存儲與管理又提出了新的挑戰(zhàn)。物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)和云計算技術(shù)及應(yīng)用的蓬勃發(fā)展,使得空間數(shù)據(jù)在數(shù)據(jù)量和應(yīng)用模式上發(fā)生了轉(zhuǎn)變;此外,傳感器技術(shù)的發(fā)展,使采集數(shù)據(jù)的空間分辨率和時間分辨率顯著提高,導(dǎo)致所獲取的數(shù)據(jù)規(guī)模成指數(shù)級快速上升,面對動輒以 TB(trillionbyte ),甚至PB(petabyte)計的數(shù)據(jù),也給空間數(shù)據(jù)存儲和處理帶來巨大的壓力。
傳統(tǒng)的基于關(guān)系型數(shù)據(jù)庫的空間數(shù)據(jù)存儲與管理已經(jīng)無法滿足大數(shù)據(jù)存儲和處理的實際應(yīng)用要求,隨著互聯(lián)網(wǎng)領(lǐng)域云技術(shù)、非關(guān)系型數(shù)據(jù)庫技術(shù)的迅速發(fā)展,各種分布式 GIS技術(shù)的研究成為研究熱點。本文主要著眼于空間大數(shù)據(jù)的存儲與管理,首先分析了傳統(tǒng)集中存儲模式在大數(shù)據(jù)存儲方面的局限性;然后,針對互聯(lián)網(wǎng)領(lǐng)域大數(shù)據(jù)的成功解決方案,研究當(dāng)前主流 NoSQL數(shù)據(jù)庫的特點,分析其在處理空間數(shù)據(jù)時的優(yōu)勢與不足;最后,針對這些需求和存在的問題,本文提出空間大數(shù)據(jù)分布式存儲與處理策略,并在原型系統(tǒng)中進(jìn)行試驗驗證。
基于成熟的關(guān)系型數(shù)據(jù)庫設(shè)計空間數(shù)據(jù)引擎,集中存儲和管理空間數(shù)據(jù)是當(dāng)前應(yīng)用的主流模式。
從空間數(shù)據(jù)引擎和關(guān)系數(shù)據(jù)庫與應(yīng)用程序結(jié)合的緊密程度來看,可以將空間數(shù)據(jù)引擎的體系結(jié)構(gòu)分為內(nèi)置模式、三層結(jié)構(gòu)模式和兩層結(jié)構(gòu)模式,這些集中存儲模式很好地解決了海量空間數(shù)據(jù)存儲和管理的問題。
目前,各種地理空間信息獲取手段多樣、數(shù)據(jù)規(guī)模巨大、更新頻率快、數(shù)據(jù)應(yīng)用現(xiàn)勢性強(qiáng)。傳統(tǒng)的空間數(shù)據(jù)集中,單一的存儲方式不能滿足大數(shù)據(jù)高并發(fā)甚至高時效的應(yīng)用要求,空間數(shù)據(jù)從海量特征轉(zhuǎn)變?yōu)榇髷?shù)據(jù)特征對存儲技術(shù)的要求主要表現(xiàn)如下
在互聯(lián)網(wǎng)領(lǐng)域,基于非關(guān)系型數(shù)據(jù)庫的NoSQL數(shù)據(jù)庫技術(shù)已經(jīng)得到成功應(yīng)用。從數(shù)據(jù)存儲的角度來說,NoSQL數(shù)據(jù)庫非常適合空間大數(shù)據(jù)的存儲,但互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用模式與 GIS領(lǐng)域存在一定差異,由此產(chǎn)生的局限性主要包括如下方面
本文綜合 NoSQL數(shù)據(jù)庫和關(guān)系型數(shù)據(jù)庫各自的優(yōu)勢,提出一種混合的空間大數(shù)據(jù)分布式存儲策略,既滿足大數(shù)據(jù)存儲的需要,又能滿足傳統(tǒng)GIS應(yīng)用的需求。
更多內(nèi)容請點擊下方的PDF下載