Q_SY10017-2023元数据管理规范.docx
《Q_SY10017-2023元数据管理规范.docx》由会员分享,可在线阅读,更多相关《Q_SY10017-2023元数据管理规范.docx(18页珍藏版)》请在优知文库上搜索。
1、O/SY中国石油天然气集团有限公司企业标准Q/SY100172023元数据管理规范Specificationformetadatamanagement20231201 实施20231019发布中国石油天然气集团有限公旬发布目次前言III引言.IV1范围12规范性引用文件13术语和定义14元数据分类14.1 结构化数据元数据14.2 非结构化数据元数据25元数据设计25.1 结构化数据元数据设计25.2 非结构化数据元数据设计36元数据采集56.1 元数据采集定义56.2 元数据采集步骤57元数据注册57.1 注册范围57.2 注册原则67.3 注册方法67.4 注册步骤78元数据运维89元数据
2、应用9参考文献10刖百本文件按照GB/T1.12020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。本文件由中国石油天然气集团有限公司标准化委员会信息技术专业标准化技术委员会提出并归口。本文件起草单位:中国石油集团共享运营有限公司、数字和信息化管理部、昆仑数智科技有限责任公司、勘探开发研究院、新疆油田分公司。本文件主要起草人:陈希、方可、刘慈、张云辉、纪晨曦、冯需 宁、刘金平、王健、蔡筱璇、张乐乐、商梅梅、马铮铮、杨桦、王薇 丽、田晓岚、孙静娴、何婷婷。本文件审查专家:黄幽丽、张万莉、王文革、曲京、梅运谊、 刘晓、唐爽。、主巨杉、朱玉秀、刘洋、何梦、主静、高天宇、侯宁宁、李爱李
3、亚东、时付更、刘大为、袁维I引言为进一步规范中国石油天然气集团有限公司(以下简称集团公司)数据管理工作,构建“共建、共治、共享”的数据生态,挖掘数据价值,规划了十二项数据管理标准,数据管理标准的制定可促进集团公司数据管理体系的建立,明确各类数据管理活动的框架和具体要求,促进数据的安全与共享,充分挖掘数据资源价值,持续提升数据应用水平和决策支持能力。十二项数据管理标准包括:一数据管理工作导则: 数据资源目录构建规范;一一数据架构管理规范;一一数据质量管理规范! 数据安全管理规范。 数据湖管理规范; 元数据管理规范;一一数据运营管理规范; 数据分析管理规范。 数据中台管理规范, 数据共享与服务管理
4、规范;一一数据出境安全管理规范。本文件为此系列标准的第七册,通过规定元数据管理的要求,建立从元数据设计、采集、注册、运维和应用的全过程管理机制,统一数据管控、推进资源整合,支撑数据管理工作的落地实施。元数据管理规范1范围本文件规定了元数据分类、设计、采集、注册、运维和应用要求。本文件适用于数据管理工作。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。Q/SY10075-2022数据资源目录构建规范Q/SY105532022数据架构管理规范3术语
5、和定义下列术语和定义适用于本文件。3.1元数据metadata关于数据或数据元素的数据(可能包括其数据描述),以及关于数据拥有权、存取路径、访问权和数据易变性的数据。来源:GB/T360732018,3.83.2结构化数据structureddata可以存储在关系型数据库里,用二维结构来表达实现的数据,3.3非结构化数据unstructureddata形式相对不固定,不便使用二维表来表现,无法用关系数据库存储的数据。非结构化数据形式多样,如文档、PDF文件、Emaik网页、图片、视频、音频、XML文件等。3.4血缘分析datalineageanalysis针对数据流转过程中产生并记录的各种信息
6、进行采集、处理和分析的过程。4元数据分类4.1 结构化数据元数据结构化数据的元数据分为业务元数据、技术元数据和操作元数据,说明如下:a)业务元数据:用户访问数据时了解业务含义的途径,包括主题域、业务对象、逻辑实体、属性名称及数据标准等:b)技术元数据:为开发人员或技术用户提供系统信息,包括物理数据库表名和字段名、字段属性、其他数据库对象的属性和数据存储特性;c)操作元数据:主要用于满足信息系统运维的需求,包括数据迁移信息、数据源和目标系统信息、批处理程序、任务频率、调度异常处理、备份与恢复信息、归档规则和使用等信息。4.2 非结构化数据元数据非结构化数据的元数据分为文件元数据、基本特征类元数据
7、与内容增强类元数据,说明如下:a)文件元数据:非结构化数据对象的抽象类,包括所有格式的办公文档、文本、图片、图像、音频、视频等;b)基本特征类元数据:实现对非结构化数据对象的规范化定义,如标题、格式、来源等;c)内容增强类元数据:基于非结构化数据内容的上下文语境,解析目标文件对象的数据内容,加深对目标对象的客观理解,如标签、索引等。5元数据设计5.1 结构化数据元数据设计5.1.1 业务元数据设计5.1.1.1 业务元数据业务元数据包括一级主题域、子主题域、业务对象、逻辑实体、属性和数据标准,相关定义与说明应符合Q/SY100752022的要求。5.1.1.2 业务元数据设计要求业务元数据设计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Q_SY10017 2023 数据管理 规范