解放地理信息

黃騫

論文來源:新經(jīng)濟導刊

摘要:海量數(shù)據(jù)問題一直是地理信息領域的 “阿基里斯之踵”

關鍵詞: 海量數(shù)據(jù)

大數(shù)據(jù)(Big Data)是將規(guī)模龐大、結構復雜、動態(tài)演變的數(shù)據(jù)進行采集、篩選、管理、搜索、分析、挖掘與表達的技術統(tǒng)稱,是連通信息世界和知識世界的橋梁,也是數(shù)據(jù)科學(Data Science)的重要研究方向。

大數(shù)據(jù)的概念原本出自以谷歌為代表的新一代IT 公司,利用數(shù)據(jù)密集型復雜挖掘技術處理海量數(shù)據(jù),并創(chuàng)造驚人價值的現(xiàn)象,創(chuàng)立之初就頗有“沙里取金”的奪人眼球的效果。

美國政府年初宣布的“Big Data Initiative”,更是將其變成包括中國在內的全球各國炙手可熱的新 “掘金點”,Map Reduce 迅速成為學術界、產(chǎn)業(yè)界反復炒作渲染的流行詞匯。

“大數(shù)據(jù)”技術來自搜索、電子商務、科學計算等領域長期與海量數(shù)據(jù)打交道所積累下的經(jīng)驗積累,目前尚不存在公認的基礎理論和解決方案。要真正理解大數(shù)據(jù),用好大數(shù)據(jù),必須跳出現(xiàn)有概念的窠臼,一方面從底層數(shù)據(jù)科學入手,提煉和解答出數(shù)據(jù)背后的科學問題,尋找數(shù)據(jù)真正的意義和基礎規(guī)律;另一方面需要遵循“從實踐中來,到實踐中去”的原則,在實際應用中了解大數(shù)據(jù),研究不同領域的數(shù)據(jù)情況,明確大數(shù)據(jù)可以創(chuàng)造的核心價值與實現(xiàn)難點。

地理信息是天然大數(shù)據(jù)

從上世紀 60 年代誕生之日起,海量數(shù)據(jù)問題一直是地理信息領域的“阿基里斯之踵”。究其原因,主要是兩方面:

第一,地理科學面對的是一個復雜巨系統(tǒng)。 1986 年錢學森院士在現(xiàn)代人類知識體系將地理科學歸結為自然科學與社會科學之間的橋梁科學,研究整個地球表面同人類息息相關的大氣對流層、巖石圈上部、水圈、生物圈和人類圈環(huán)境。因為上至衛(wèi)星遙感數(shù)據(jù)、下至地震傳感數(shù)據(jù),以及我們常見的統(tǒng)計、環(huán)境、水利、資源、土地等領域數(shù)據(jù)都屬于地理數(shù)據(jù),所以地理信息技術需要處理的范圍廣,數(shù)據(jù)源多,數(shù)據(jù)類型多樣,其數(shù)據(jù)量巨大是不言而喻的。

第二,地球表面的信息量巨大,感知手段多樣。以谷歌地圖使用 Landsat TM 影像為例,其空間分辨率為 30 米,則單一時相全球完整覆蓋其整體數(shù)據(jù)量約為 2TB。2012 年底,我國已對成功發(fā)射天繪、天鏈、天拓、遙感、資源、氣象、海洋等多系列衛(wèi)星,建立起環(huán)境與災害監(jiān)測預報小衛(wèi)星星座,“嫦娥一號”對月觀測也取得良好效果,而整個“十二五” 期間我國計劃發(fā)射百余顆衛(wèi)星。

更多內容請查看pdf