您的当前位置:首页正文

油田企业数据中心数据资源管理

来源:帮我找美食网
学术论坛 油田企业数据中心数据资源管理 董琰 (胜利油田信息中心山东东营257100) 摘要:本文描述了油田企业数据中心数据资源管理的实现方法、实施步骤与应用效果,重点对数据资源的组织、编目、管理、元数据管理 和综合查询实现方式进行了阐述。 关键词:数据中心数据资源数据资源编目 业务活动业务对象对象特性 中图分类号:TP274 文献标识码:A 文章编号:1007.9416(2012)01—0178.02 1、需求分析 企业数据中心建设是对企业核心数据资源的集中统一管理和 集成化应用的实现,是实现企业数据资源共享和业务协同应用的关 键一环。油田企业数据中心建设具有以下特殊性: 1.1专业门类众多,涉及的数据类型复杂 油田企业勘探开发业务有物化探、分析化验、井筒工程、综合研 究、开发生产、地面工程六大业务域,三十多项业务,涉及的数据类 型有结构化数据、文档数据、图形数据、体数据,其中体数据又有地 震体数据、测录井曲线数据、地质模型数据、网格数据等多种,并且 每种体数据又有多种格式,数据类型的复杂性使数据资源管理难度 很大。 1.2数据量巨大 油田企业的生产数据要每天监测,有的需要几小时就监测一 次,对于自动化采集的监测时间周期更短,而监测点又很多,造成了 数据量增长迅速。比如采油井、注水井日生产数据,对于胜利油田这 种大油田来说,有几万口生产井,每天都产生数据,几十年的开发 期,数据量就能达到商业条。目前胜利油田平均每天的增量数据就 有八九万条,年增长量就几千万条,随着信息化的不断深入,数据量 增长速度会不断加快。 还有一种数据虽然记录数不多,但单体数据量很大,比如精细 三维地震数据体等。巨大的数据量对数据中心的数据资源管理也是 一个巨大的挑战。 1.3新技术的应用不断出现引起新的数据类型 石油天然气勘探开发是一个各种技术综合应用的专业,随时会 出现新的技术和方法,就会产生新的数据类型,数据中心的建设必 须要能够适应这种变化。 1.4数据管理情况不清 由于油田企业以前的数据库建设是按照专业进行的,同一业务 对象不同时期的数据资料被分在了不同的数据库中,一方面数据资 料的整体状况不清, 另一方面,同一数据多头管理,数据质量状况不 清。以上几个特点决定了油田企业数据中心建设必须要制定一套完 整的数据资源组织和分类体系和元数据管理体系。 数据资源管理的目标就是要完成业务对象基于业务过程产生 的成果资料的组织和编目,实现勘探开发数据资源面向业务对象基 于业务过程的组织和管理;完成对于具体的业务对象在具体的业务 过程中产生数据资源的数量、质量状况的整体情况的描述。 2、油田企业数据资源的分类与组织方法 2.1油田企业数据资源的分类 油田企业数据资源的分类可以借鉴图书馆对图书的分类。在 图书馆中,根据图书的专业门类,从大类上分成了自然科学和社会 科学,自然科学按照专业又可分为数学、物理、化学等,这样逐级细 分下去,就能建立一套完整的分类体系,新出的图书可以根据此分 类体系放到其应该归类的门类中,从而实现了有效的管理,方便了 ⑩ 查阅。 油田企业的数据资源都是在不同的业务过程中产生的,如果我 们找到一种相对科学的对业务的划分方法,再把数据资源归类到这 些业务门类中也就找到了数据资源的分类方法。 在油田企业实际业务分析过程中,我们划分了物化探、分析化 验、井筒工程、综合研究、开发生产、地面工程六大业务域,又在各业 务域中逐级划分出了30多个一级业务,70多个二级业务,140多个三 级业务,基本建立了比较科学合理的业务划分体系。 在实际的数据中心建设中,数据资源的来源除了业务产生的数 据外,还有一些公用信息也是非常重要的,这些信息不是从勘探开 发业务本身产生的,而是来源于与其相关的其他专业和部门,这一 部分数据资源与勘探开发业务中产生的数据资源的集合就是数据 中心需要管理与应用的全部数据资源。 综上所述,油田企业数据资源的整体分类应该包含:公共信息、 物化探、分析化验、井筒工程、综合研究、开发生产、地面工程七大部 分,细的划分按照业务的层级分类。 2.2油田企业数据资源的组织方法 为了实现对数据资源进行有效地组织,胜利油田数据中心建设 中对数据资源编目建立的方法如下: (1)以业务对象及分类关系组成业务对象分类树,形成对业务 对象的组织和管理; (2)以业务过程(业务模型六大业务域及业务层级划分)组成业 务树,业务活动是业务树的叶子节点,业务活动唯一的作用对象使 业务活动与业务对象建立了关系; (3)以业务单元为基础与业务活动建立关系,业务活动产生的 数据资料以业务单元的方式组织,产生的数据资料分为结构化数据 (数据表)、文档文档(包括附件)、图形成果(包括附件)以及体数据。 上述三个关系建立数据资源编目体系。表1是数据资料编目的 例子,加上业务对象的分类树和业务活动树就形成了完整的油田企 业数据资源编目。 表1数据资料编目 业务封簟 攮务瑶袖. 夷 名■ 蠢■妞. 曩关业务 ●元聃. 莽 抖1女设'许, 井位设 ”R告 文档磷幂 柚t蛳tj # 坫井蛳设计, 钻井地霸设计按告 文档成果 3k01H02j, 拌 崔占井工程设1计, 拈#工程{叠计报告, 文档成果, 3k01H04 1 井 砧井工程设计, 钻井氍念设计报告、 文档棵 Jl如l肼.2 替 #&抖工程设计, 枣平荆占井工程设l计报毒 文档戚泉, J'kOI140 ̄_3 并 毒占井工程设计 钻井工程主曩技术一览裹, 文幅成果. jAoll ̄4.‘t 箅, 井拄设瞢安装 并I空设量安装示意圉, 文档成果 避10lC啪l一1, 箅、 钻井液性甏调胃酸鼬嘲空削, 泥浆鲢工设计壤告、 文档或鼻|. n删lc02枷B-l #, 钻井寝性能调鼠霞周相控剀, 泥;IE斑报丧, 文植成果, 02舯lC嗍_2 井 正常钻进, 钻井工程斑报裹, 文档成果. 啦∞Ic02m 一1 井 正常t占避. 1占井年报, 文档成集. O曲ol∞2邶^j 井 正常坫进. 1占井胄志. 文档I纛果. J^0Ⅲl册锄DI-3, # 正,II坫避. 坫井日志, 结构化敲掘 Jl柚2∞lc口2删一ll, 葬 正熏l占进, l6捧并史报告 (拦, 文镁成亲, J柚囝 l伽囝 ‘j- 术一用~黼●十~救r一 学术论坛 通过数据资源的分类方法和组织方法,我们找到了对数据资源 术鬲一 姗 的查询、面向业务活动的查询、面向资料的查询和模糊搜索查询四 为业务人员提供了丰富的查询手段。数据资源元数据的登 编目的规则,这些规则能够满足我们对已有和将有数据资料的组织 种方式,记与管理为数据分布情况、质量情况等提供了分析资料,使我们能 和管理需求。 够清楚地了解数据资源的整体状况,方便了数据资源的业务应用。 3、数据资源的元数据管理 下图是对DXFS10井的数据资源状况的展示,通过对数据资源编目 对数据资源情况的管理需要有一套完善的元数据体系来实现。 及元数据的集中展示,能够清楚地了解该井全生命周期的数据资 数据资源的元数据管理,规定了格式化数据、体数据、文档数据和图 源状况。 形数据四种类型的石油天然气勘探开发数据的元数据,主要包括对 数据的产生场景、录入场景、数据质量、数据安全、参考系及数据特 性的描述。石油天然气勘探开发数据管理元数据由四个元数据实体 组成: (1)标识实体:包括业务活动的标识和该活动产生的数据集的 ~ 名称和标识等元数据元素:(2)定义实体:包括业务活动产生的数据 集的概要说明;(3)管理实体:包括业务活动中数据的责任人(单位) 以及数据质量、数据安全级别等元数据元素;(4)表示实体:包括数 据产生场景(操作者、时间、地点等)以及参考系等元数据元素。 按照石油天然气勘探开发数据的表现形式可分为结构化数据、 体数据、文档数据和图形数据等四类,这四类数据的元数据实体集 合构成以下四种元数据子集: (1)结构化数据元数据子集:描述石油天然气勘探开发业务活 动中可以表格化的数据的子集;(2)体数据元数据子集:描述石油天 然气勘探开发业务活动中具有特定格式的体数据的子集;(3)文档 数据元数据子集:描述石油天然气勘探开发业务活动中产生的文档 图1 DXFS1 0井数据资源状况展示界面 数据的子集;(4)图形数据元数据子集:描述石油天然气勘探开发业 务活动中产生的图形数据的子集。 5、结语 4、数据中心数据资源的综合查询实现 通过对数据资源编目的编制和元数据管理系统的建立,为油田 也为数据中心的持续发展与 数据资源编目建立了业务对象、业务活动与数据资料的关系, 企业数据资源管理建立了统一的规则,建设奠定了管理架构基础。数据中心数据资源管理在胜利油田数据 为数据中心数据资源的综合查询奠定了模型基础。  在胜利油田数据中心建设实践中,我们实现了面向业务对象 中心建设中的成功实施也验证了其可行性和实用性。・・・・・・上接第177页 5、结语 在PC时代、互联网时代,中国没有任何话语权,因为我们没有 掌握任何核心技术或者关键技术。而就全球来讲,云计算的发展目 前正处于早期阶段,美国虽然比我们早起步几年,但是应该说和我 们基本上在相同的起跑线上,国际IT巨头所拥有的传统核心技术优 势在云计算产品的开发中没有太大的意义,开源软件将成为云计算 产品的基础。云计算正在给我们带来了新的机会,但是能否真正把 在使用云计算提供的服务时,虽然可以通过SSL对数据进行加 密,但是由于云计算同时为多个用户提供服务,因此你的数据很有 可能与其他云客户的数据存放在一起。 3.5数据恢复风险 尽管云计算提供者承诺他们对数据的存储是安全的、可靠的、 不会丢失的,但是这个承诺只有当真的发生时才能知道是否可信, 存在数据损失后无法恢复的风险。 3.6增加司法调查困难的风险 云计算同时为多个企业提供服务,同时记录了多个企业使用云 计算的情况,当某一个企业需要被调查时,这种多个企业使用云计 算的日志被记录在一起的情况增加了司法调查的难度。甚至有可能 存在司法调查无法进行的风险。 4、云计算将导致社会结构发生破坏性的重建 首先,使现有的技术和产品得到更加高效的应用,并通过信息 化加快缩短了农村和城市的差距;其次,社会财富和资本从代表少 数人利益的企业转入新兴的代表大多数人利益的企业手中;第三, 万物相连瓦解了行业垄断,农村和城市家庭的结构和功能趋于一 致,分散的社会组织在技术和规则的约束下有序运做;第四,有序管 理的市场竞争替代了无序的自由生产竞争,加速了新技术的发明和 使用,缩短了科学知识转变为直接生产力的过程;第五,科技极大的 提高了原材料的使用效率,人们在有序可控的状态下展开世界性贸 易竞争和掠夺;第六,道德规范成为指导人们生活行为的重要准则。 握这次机会,战略战术的运用是非常重要的。如果采用常规的方法, 那么抓住这次机会的可能性接近于零。这是因为云计算是建立在互 联网时代的基础上的,硬件、软件、网络等基础设施没有发生改变。 倪光南院士曾经说过“正是因为云计算够新,而且不成熟,于中 国,才是机会”。我们正在经历一场发生在IT内外的迈向云计算时代 的巨大变革,面对我国信息技术和信息产业追赶世界先进水平的难 得的契机,我们一定创造条件,要抓住机遇,努力将我国的科学技术 水平推进到一个新的高度。 作者简介 郭清溥(1 9 6 3一),男,河南财经政法大学副教授,主要研 究方向为计算机网络及应用,数据库应用。 费岚(1 9 7 2一),女,河南财经政法大学副教授,主要研究 方向为平台开发,数据库技术。 基金项目 河南省软科学资助项目:云计算产业发展战略研究,项目编 号:l l 2400450478。 ⑨ 

因篇幅问题不能全部显示,请点此查看更多更全内容

Top