究竟什麼是GIS

GIS是個朝陽產業,但它永遠都到不了正午。這自然是一句調侃,但也無不包含着GISer的心酸。因爲GIS的具體定義,很多在學校和行業內摸爬滾打多年的人也未必說的上來,進而它的作用也就變得模糊起來。作爲一個GIS出身的人,每次別人問我學什麼的我回答地理信息系統時,別人總會一愣,然後我就很無奈的補充一句,畫地圖的。地圖學當然是GIS的一部分,但這個定義顯然是不全面的。

GIS在發達國家也不算是一門成熟的學科,更不用提在國內,很多學校將測繪、地質、遙感、計算機圖形學等內容放在GIS專業的課程設置中去,雖然都是相關的知識,但過於寬泛的學習反而丟失了對深度探索的可能性。寫這篇文章也是爲了將自己四年來在學校這個小小的圈子裏摸索的知識、感想和理解都記錄下來,也想分享給更多想了解、必須瞭解和使用GIS的人。

在課堂上,地理信息系統(GIS,GIS,Geographic Information System),是一種以地理信息作爲主要研究對象的信息系統,主要用於用於輸入、存儲、查詢、分析和顯示地理數據。可這樣講,總還是覺的太過籠統與寬泛,想要具體瞭解其本質與用途,還要從根本入手。

首先,想要了解什麼是GIS(地理信息系統),先問一下自己對地理信息的定義是什麼。

實際上多數人對地理這門學科的認知本身就是有侷限的,認爲地理只是研究山川河流、地形地貌,甚至分不清地質和地理的區別,以爲地理學家整日需要風吹日曬研究石頭成分。當更多人是一聽說你學地理,就找個偏門國家問你首都是哪。這種認知侷限也限制了地理學潛在的可能性。其實,底圖合區劃等是地理學的基礎,所有的信息都依靠這些基礎建立聯繫,這種聯繫可以建立的原則就是----每一事物都影響其他的事物,但是對距離近的事物影響更大。位置影響自然環境和人文環境,進而影響人類的活動。所以雖然地理是一門學科,但其內容卻涉及社會學(城市化、人口、住房、種族)、政治(國際關係)、環境科學(資源利用、動植物保護)甚至是醫療和法律。地理學以位置爲基礎,將與我們生活息息相關的部分串聯起來,找到其中的關聯,再用這種關聯去解決問題。因此,地理信息並不是某座山的海拔或者某條河的冰期,而是所有帶着位置標籤的信息。

以美國的普查數據爲例,普查會將美國劃分爲小的普查區域或者街區羣,這裏的普查區和街區羣就是地理標籤,對於每一個地理標籤,數據庫中會詳細記錄該標籤下的實際信息,比如收入的中位數等。

所以,做一個合格GISer的基礎,不是紮實的編程基礎,也不是豐富的統計功底,而是對地理信息的深刻理解和對空間的思考能力。習慣性的將數據中包含的地理標籤帶進思考過程之中,並利用地理上的關聯來解決問題,就是一個GISer與軟件工程師最大的區別。

編程能力的重要性

編程在GIS中的重要性是不容輕視的,例如GISer最常用的軟件ArcGIS就可以利用Python Script大大提高操作的效率,一份完整的Python Script可以自動完成一個空間分析的流程,不需要操作者在其中做任何事情。許多網頁嵌入式的地圖及可視化工具更是大量使用JavaScript和HTML語言,而管理與GIS息息相關的空間數據的數據庫,也高頻率地使用SQL和Spatial SQL。(空間SQL,與SQL在語言結構上幾乎一致,但是可以篩選和管理的內容有所區別)即使不做開發工作,編程知識在GIS學科之中也有舉足輕重的地位。

程序員的思維和習慣也是一個合格GISer必備的素養,即勤學、勤查。勤學在於這個學科爆炸式的更新,新的工具和技能層出不窮,勤查則由於技術之繁雜。單一個ArcGIS就有成百上千種操作和功能,習慣性地使用搜索引擎查閱工具和功能是GISer非常好的習慣,並且時常會帶給你驚喜。

但是!如果說GIS等於開發,或是GIS主要還是做開發,是有失偏頗的。GIS的核心是利用空間數據和空間分析解決問題,而非製造出更多的軟件。技術是GIS的工具,而非GIS真正的內核。

數據!數據!數據!重要的事情說三遍

數據是GIS的基礎,也就是我們上面所說的地理信息,沒有乾淨、完整、準確的數據,所有的分析都是空談。在一份GIS的項目裏面,往往最耗時的部分就是數據的收集和清理。數據的收集往往不是個人可以做到的,大多數GISer使用的都是所謂“二手數據”,即已經存在的、由別的個人和組織已經收集的數據。數據往往又有免費數據和收費的數據,免費數據(在美國)通常是由政府或者其他NGO(非營利組織)收集的,而收費數據則通常由商業公司收集的。對於GIS的工作者來說,常常存在的問題是免費的數據不好用、收費的數據買不起。我大學所在的西雅圖算是免費空間數據非常豐富的地方了,對於整個州的有WAGDA數據庫,還有King County GIS Portal,西雅圖自己也有非常豐富的GIS數據,但是依然有質量層次不齊的問題,很多時候數據找回來,可能有的信息不完整或者不正確,就需要做GIS的人做非常多的功課,去做修改、重新分組或其他的刪除整理等工作。

GIS中使用的數據通常分爲兩大部分,一部分是地圖部分,即顯示出來的區域,比如普查數據會有按照普查區劃分好的地圖呈現,另一部分是數據部分,也叫做Attribute Table。這個表格更像我們所想象的“數據”該有的樣子,打開之後像是excel的形式。

 

GIS中常用的數據分爲兩類,矢量數據(Vector)和柵格數據(Raster),兩種數據在不同的應用場景之中都會有不同的作用,具體兩者的介紹、對比和使用會在之後的文章中寫出。

空間分析:如何有理有據地胡說八道

分析這個詞總是很高大上,數據分析、市場分析,但其實質都是對現實測量和猜測。當然,利用專業知識有理有據的猜測總是很值得參考的。空間分析的本質其實是數據分析,只不過分析過程中使用的是地理信息和空間數據,上一節之中我們提到數據,其實不同類型的數據就是地圖上不同的圖層,進行疊加、合併、拆分、計算等各種運算,在其中尋找規律和結果,就是我們所說的空間分析(Spatial Analysis)。

舉例來說,我們經常使用的手機地圖,從某地到另一個地方的路徑,這個運算的過程其實就是使用了空間分析,考慮兩地之間的公路網、是否有河流,如果有河流是否有橋樑,公路網、河流、橋樑每個都分別是一個數據層,經過疊加和計算,分析出最短的路徑,如果需要計算出最快的路徑,那麼還需要疊加道路限速、車流量和通行速度的數據。谷歌地圖在爲用戶計算路徑的時候還會考慮到是否封路、路段是否收費等因素,雖然算法和達成方式可能不太一樣,但是基本的原理都是相同的。

路經計算的例子是相對比較客觀的,還有些與社會科學相關的分析相對比較主觀。比如需要在哪裏建立食物銀行,雖然也是根據可能需要考慮的因素尋找數據再疊加分析,但是這裏面的變量就相對較大,A和B可能會因爲使用了不同的數據而做出完全不同的結果,對於類似的情況,只能通過儘可能地去了解背景知識才能全面地考慮影響因素。GIS歸根結底只是一個分析工具,具體的使用還是需要GIS的從業人員同時專攻一個方向的專業知識或者在團隊之中有一個相關專業的從業人員。

這篇文章希望從GIS核心的幾個方面出發來闡釋GIS真正的作用,GIS的重點不在開發,也不是統計,更不是簡單的製圖和可視化,這些只是達成GIS的工具,而是空間思維、空間數據和空間分析纔是GIS真正的核心,接下里的文章中,將爲大家從數據、工具、軟件和平臺等更具體地介紹與GIS相關的知識和運用。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章