石油数据的分类方式

一个数据有多种属性,在实际应用过程中,可以用多种方式对数据进行分类,无论哪种分类也只是从一个维度将数据的特性分开,数据分类有些是为了实际应用,有些是为了技术实现。从多年的数据管理实践工作中,认为以下分类对数据的管理和应用非常重要。

1、数据主被动产生分类

实际生活工作中数据是无处不在的,我们出门看到天空无云,阳光灿烂,这种现象其实就是数据,从数据的产生角度,很多时候我们所看到的数据其实只是实际生活工作中很少一部分,或者说只是我们认为有必要记录和保存下来的那部分。还有很多数据其实是我们为了解决某个问题设计出来的。如我们在医院拍X光照片,这个X光数据的产生就是我们为了看到我们身体骨骼或者其他方面的信息有意识设计出来的一种数据。在石油勘探开发中,几乎所有的数据都是为了解决某个问题主动设计出来的,如地震数据是为了了解地下地质结构,录井数据是为了了解井筒的岩性和含油性,测井数据是为了更加精确了解层位数据、岩性数据和含油性数据,所有的数据设计的目的是为了了解我们研究对象的某个方面的属性。我们可以将这种数据称之为主动产生数据。

主动产生数据有一个很重要的特征就是人们在设计这些数据时实际上是依据一定的专业逻辑设计的,在这些数据产生之前,其实已经规划好了这些数据之间的关系,也就是说这些主动产生的数据之间的关系是天然存在的并且是被我们所知道的。另外一个典型的例子就是我们到医院体检的各种指标数据,这些指标数据都是为了说明我们身体状况的,但是一个指标又只能说明我们身体状况的一个侧面,所以人们设计了一组相互之间有关系的数据共同说明我们身体状况这个全貌。石油勘探开发数据和医院体检数据一样,都是主动产生数据的典型代表。

还有另外一种数据,这些数据仅仅是记录某个事物的过程,或者是记录某些行为,但是所有的被记录的数据不是被设计出来的,不是主动、有目的产生的,而是被动无目的产生的,我们将这些数据称之为被动产生数据。这类数据最为典型的就是互联网上网行为数据的记录,购物行为的记录,通讯记录等。这类数据一个典型特征就是数据记录时不知道数据之间的关系,也不知道这些数据将来的应用目的。

数据的主动产生和被动产生,对于如何应用这些数据将会产生非常大的影响。

2、数据KID分类

在所有的石油数据中,有些是原始数据,有些是对原始数据经过加工后得到的中间成果,还有些是最终的研究成果。数据这些不同的特征可以用KID分类来区别(K-知识、I-信息、D-数据)。

可以简单理解为D是原始测量数据,这些数据没有经过任何后期的加工处理,如地震采集数据、录井原始数据、测井原始数据、分析化验数据等。数据可以用以下表达式简单表达:

D=F1(数据说明、数据定义,测量方法、单位,格式等)

信息(I):信息是为了说明某个事务或者某个对象的某个属性的参数或者认识结论,它一般是依据一定的方法对一些数据进行加工而获得的。

• I=F2(D,I’,数据处理方法,作者,时间,审核)

• 信息是在数据基础上进一步考虑数据加工处理的方法、作者、时间、可信度、审核等内容。

知识(K):知识是决策的依据,是用来说明决策的一系列要素,为决策提供某一方面的决策依据或者信息。因此,知识一定是依附于决策而存在的,这是知识和信息的最大区别。

• K=F3(决策目的,I,D,K’,方法,作者,时间,审核,批准)

• 知识是依附一定的决策目的,是在信息或者数据基础上加工的;知识要进一步考虑数据加工处理的方法、作者、时间、可信度、审核、批准等内容

对数据款项KID分类也是为了正确识别数据的各种要素,明确不同数据之间的KID(血缘)关系,这对正确理解数据、应用数据有特别重要的意义。

3、数据IT技术分类

由于数据的复杂性,在实际系统实现上很难用一个系统对石油数据进行管理,实际项目中一般是根据数据的IT属性对数据进行分类管理,可以分为结构化数据、非结构化成果数据、图形(空间)数据、地震数据等。不同的数据类型实现的技术思路和管理内容差异很大,一般都是分别实施。

4、数据产生方式分类

对于石油数据其产生的方式多种多样,我们看到的一个数据可能由不同的方式产生,针对数据产生方式,分为以下几类:

① 源头人工采集数据(C1):这类数据是源头数据,并且是通过人工采集方式录入的。

② 源头仪器产生数据(C2):这类数据也是源头产生,但是是由仪器产生,我们从仪器中接入的。

③ 通过其它数据计算得到(C3):是由其它数据通过专业方法计算得到。

④ 引用数据(R):是从其它数据中引用过来的,不是源头数据。

5) 数据应用分类

数据的应用分类包含的范围很广,分类方法也不尽相同,常见的有动态数据和静态数据分类、原始数据和成果数据分类等。这些数据的分类主要是从不同应用角度考虑和划分。

当然数据分类还可以有很多其他方面的分类方案,这里只是常规的分类方案。

数据分类的目的不是简单的分类,而是为了后期数据管理技术的落地需要根据不同的数据分类采用不同的技术解决方案。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章