石油數據的分類方式

一個數據有多種屬性,在實際應用過程中,可以用多種方式對數據進行分類,無論哪種分類也只是從一個維度將數據的特性分開,數據分類有些是爲了實際應用,有些是爲了技術實現。從多年的數據管理實踐工作中,認爲以下分類對數據的管理和應用非常重要。

1、數據主被動產生分類

實際生活工作中數據是無處不在的,我們出門看到天空無雲,陽光燦爛,這種現象其實就是數據,從數據的產生角度,很多時候我們所看到的數據其實只是實際生活工作中很少一部分,或者說只是我們認爲有必要記錄和保存下來的那部分。還有很多數據其實是我們爲了解決某個問題設計出來的。如我們在醫院拍X光照片,這個X光數據的產生就是我們爲了看到我們身體骨骼或者其他方面的信息有意識設計出來的一種數據。在石油勘探開發中,幾乎所有的數據都是爲了解決某個問題主動設計出來的,如地震數據是爲了瞭解地下地質結構,錄井數據是爲了瞭解井筒的巖性和含油性,測井數據是爲了更加精確瞭解層位數據、巖性數據和含油性數據,所有的數據設計的目的是爲了瞭解我們研究對象的某個方面的屬性。我們可以將這種數據稱之爲主動產生數據。

主動產生數據有一個很重要的特徵就是人們在設計這些數據時實際上是依據一定的專業邏輯設計的,在這些數據產生之前,其實已經規劃好了這些數據之間的關係,也就是說這些主動產生的數據之間的關係是天然存在的並且是被我們所知道的。另外一個典型的例子就是我們到醫院體檢的各種指標數據,這些指標數據都是爲了說明我們身體狀況的,但是一個指標又只能說明我們身體狀況的一個側面,所以人們設計了一組相互之間有關係的數據共同說明我們身體狀況這個全貌。石油勘探開發數據和醫院體檢數據一樣,都是主動產生數據的典型代表。

還有另外一種數據,這些數據僅僅是記錄某個事物的過程,或者是記錄某些行爲,但是所有的被記錄的數據不是被設計出來的,不是主動、有目的產生的,而是被動無目的產生的,我們將這些數據稱之爲被動產生數據。這類數據最爲典型的就是互聯網上網行爲數據的記錄,購物行爲的記錄,通訊記錄等。這類數據一個典型特徵就是數據記錄時不知道數據之間的關係,也不知道這些數據將來的應用目的。

數據的主動產生和被動產生,對於如何應用這些數據將會產生非常大的影響。

2、數據KID分類

在所有的石油數據中,有些是原始數據,有些是對原始數據經過加工後得到的中間成果,還有些是最終的研究成果。數據這些不同的特徵可以用KID分類來區別(K-知識、I-信息、D-數據)。

可以簡單理解爲D是原始測量數據,這些數據沒有經過任何後期的加工處理,如地震採集數據、錄井原始數據、測井原始數據、分析化驗數據等。數據可以用以下表達式簡單表達:

D=F1(數據說明、數據定義,測量方法、單位,格式等)

信息(I):信息是爲了說明某個事務或者某個對象的某個屬性的參數或者認識結論,它一般是依據一定的方法對一些數據進行加工而獲得的。

• I=F2(D,I’,數據處理方法,作者,時間,審覈)

• 信息是在數據基礎上進一步考慮數據加工處理的方法、作者、時間、可信度、審覈等內容。

知識(K):知識是決策的依據,是用來說明決策的一系列要素,爲決策提供某一方面的決策依據或者信息。因此,知識一定是依附於決策而存在的,這是知識和信息的最大區別。

• K=F3(決策目的,I,D,K’,方法,作者,時間,審覈,批准)

• 知識是依附一定的決策目的,是在信息或者數據基礎上加工的;知識要進一步考慮數據加工處理的方法、作者、時間、可信度、審覈、批准等內容

對數據款項KID分類也是爲了正確識別數據的各種要素,明確不同數據之間的KID(血緣)關係,這對正確理解數據、應用數據有特別重要的意義。

3、數據IT技術分類

由於數據的複雜性,在實際系統實現上很難用一個系統對石油數據進行管理,實際項目中一般是根據數據的IT屬性對數據進行分類管理,可以分爲結構化數據、非結構化成果數據、圖形(空間)數據、地震數據等。不同的數據類型實現的技術思路和管理內容差異很大,一般都是分別實施。

4、數據產生方式分類

對於石油數據其產生的方式多種多樣,我們看到的一個數據可能由不同的方式產生,針對數據產生方式,分爲以下幾類:

① 源頭人工採集數據(C1):這類數據是源頭數據,並且是通過人工採集方式錄入的。

② 源頭儀器產生數據(C2):這類數據也是源頭產生,但是是由儀器產生,我們從儀器中接入的。

③ 通過其它數據計算得到(C3):是由其它數據通過專業方法計算得到。

④ 引用數據(R):是從其它數據中引用過來的,不是源頭數據。

5) 數據應用分類

數據的應用分類包含的範圍很廣,分類方法也不盡相同,常見的有動態數據和靜態數據分類、原始數據和成果數據分類等。這些數據的分類主要是從不同應用角度考慮和劃分。

當然數據分類還可以有很多其他方面的分類方案,這裏只是常規的分類方案。

數據分類的目的不是簡單的分類,而是爲了後期數據管理技術的落地需要根據不同的數據分類採用不同的技術解決方案。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章