4(第三章,数据治理)

目录

概述

业务驱动因素

目标和原则

1、可持续发展

2、嵌入式

3、可度量

基本概念

数据治理与数据管理的关系

数据治理组织

数据治理运营模型类型

数据管理岗位的类型

数据治理的成果体现

国内的数据治理

什么是数据治理

为什么进行数据治理

数据治理的必要性

数据治理体系


概述

之前文章有些过,数据治理在国内是比较广的定义,但在我们实施的很多项目中,很多数据治理项目主要就是搞数据仓库(原始库、标准库、主题库等),计算各种指标,为大屏服务,其他什么元数据盘点、数据质量还搞一搞业务相关的,像数据安全就比较虚了,唉,现在场景多了,接下来会改变很多吧,像业务术语表就很重要,一定要建。附:业务术语表是数据治理的核心工具。IT 部门要认可业务术语的定义,并将定义与数据进行关联。业务术语表的工具有很多,有些是大型 ERP 系统、数据集成工具或者元数据管理工具的一部分以及一些独立工具。

而在DAMA中,数据治理是数据管理的1/11,数据治理是数据管理的管理,数据治理制定制度和实施细则,在组织内多个层次上实践数据管理。

数据治理有两个核心内容:组织架构和规章制度。

数据治理 (Data Governance,DG) 的定义是在管理数据资产过程中行使权力和管控,包括计划、监控和实施。
数据治理职能是指导所有其他数据管理领域的活动。数据治理的目的是确保根据数据管理制度和最佳实践正确地管理数据。

数据治理项目的范围和焦点依赖于组织需求,但是大多数都包含以下内容:

数据治理不是一个一次性的行为,要当一个持续性的项目集或者认为是一个过程来做。

另外数据治理要与IT治理区分开,IT治理制定关于IT投资、IT应用组合和IT项目组合的决策,从另一个角度还包括软硬件、总体技术架构;数据治理仅仅聚焦于管理数据资产和作为资产的数据。

业务驱动因素

数据治理最常见的驱动因素是法规遵从性,特别是监管行业(金融、医疗等那些需要引入法律所要求的治理程序)。

其他因素:

  1. 减少风险。
  2. 改进流程。
  3. 法规遵从性。

忽然想起来之前搞片子经常搞的一页:

目标和原则

1、可持续发展

2、嵌入式

3、可度量

基本概念

数据治理并不直接管理数据,而是确保数据被恰当地被管理。

数据治理与数据管理的关系

数据治理组织

数据治理运营模型类型

集中式、分布式、联邦式。这个模式其实主要是由组织的业务模式来决定的。

DMBOK本章活动章节中的定义数据治理运营框架描述的:

开发数据治理的基本定义很容易,但是创建一个组织采用的运营框架可能很困难。在构建组织的运营框架时需要考虑以下几个方面:

数据管理岗位的类型

主要看下作为业务角色的管理专员,指的是职责是为别人管理财产的人,例如华为的数据Owner。其实和运营模式来看,华为是分布式,主推数据管家,阿里是集中式,比较推中台,当然不是矛盾,而是一些特点吧。

数据治理的成果体现

现在这个时代,数据治理也应该能线上体现,例如中心门户、协作门户、提供核心的文档,我们为制造业做了很多资产门户,除了数据资产以外,很多核心文档也会放上去,例如:

  1. 数据治理战略和项目章程,包括愿景、效益、目标、原则和实施路线图;
  2. 数据制度和数据标准;
  3. 数据管理制度的角色和职责说明;
  4. 数据治理相关新闻公告;
  5. 指向相关数据治理社区论坛的链接;
  6. 指向相关数据治理主题执行进展的链接;
  7. 数据质量测试报告;
  8. 问题识别和上报的规程;
  9. 请求服务或获取问题的入口;
  10. 相关在线资源的描述和链接、演示文档和培训计划;
  11. 数据管理实施路线图。

国内的数据治理

参考参考这个内容,简单看看,以后有机会拿一个项目方案看看。

什么是数据治理

为什么进行数据治理

Kilobyte(KB)=1024B相当于一则短篇故事的内容。 
Megabyte(MB)=l024KB相当于一则短篇小说的文字内容。 
Gigabyte(GB)=1024MB相当于贝多芬第五乐章交响曲的乐谱内容。 
Terabyte(TB)=1024GB相当于一家大型医院中所有的X光图片资讯量。 
Petabyte(PB)=l024TB相当于50%的全美学术研究图书馆藏书资讯内容。 
Exabyte (EB)=1024PB;5EB相当于香港六合彩至今全世界人类所讲过的话语。 
Zettabyte(ZB)=1024EB如同全世界海滩上的沙子数量总和。 
Yottabyte(YB)=1024ZB相当于7000位人类体内的微细胞总和。

数据治理的必要性

缺乏数据治理常常导致组织尽管在整个数据价值链上进行了大量投资,却无法从数据中获得任何实质性的收益。

1、海量数据需要治理

海量数据的爆发增长使我们犹如进入了一个数字海洋,我们在数据的海洋中望洋兴叹,不知所踪。数据蕴含着丰富的价值,是当代的石油,当代的黄金。但是如果不能对数据进行有效管理和开发,数据并不可能产生真正的价值。如果没有高效的管理和治理,数据价值就不可能产生,甚至有可能造成巨大的风险,有效的数据管理和治理是数字经济发展的基础

2、海量的数据引发“数据危机”

3、数据治理成为国际关注焦点

各国都在将数据管理和治理看作重要的内容,这也成为全球关注的焦点。比如欧盟,发布了全球第一个最严格的数据法规——《通用数据保护条例GDPR);法国提出了“数据税”的探索;美国联邦政府将数据作为政府的联邦战略,以政府数据治理为主要视角,来提出了未来的联邦政府的数据的愿景和关键的行动计划。

4、数据治理成为国内关注焦点

中国是全球数据增长最快的,拥有数据最多的国家。我们掌握了丰富的高质量的数据,如何将这些数据转化成新的经济增长的动力是我们经济发展下一步的主要内容。对这样海量的数据进行有效的管理是我们大家共同面临的主要目标。

这里的核心就是做到数据的有效的管理。数据如源源不断的水,不断滋润着数字经济的发展。中国人崇尚水文化,强调上善若水,水善利万物而不争。但是我们也看到,水可载舟,亦可覆舟,如果说不能对水进行有效的治理,就会导致水患。同样的,数据也需要治理。加强数据治理,发挥数据价值成为抢占未来发展主动权的重要方向。

5、千行百业数据治理的价值和意义重大

数据治理体系

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/2980216.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

Linux 操作系统的引导过程

Linux系统开机引导过程: 开机自检 检测硬件设备,找到能够引导系统的设备,比如硬盘MBR引导 运行MBR扇区里的主引导程序GRUB启动GRUB菜单 系统读取GRUB配置文件(/boot/grub2/grub.cfg)获取内核的设置和…

《内向者优势》:不要低估一个内向的人

#世界读书日 作者主页: 🔗进朱者赤的博客 精选专栏:🔗经典算法 作者简介:阿里非典型程序员一枚 ,记录在大厂的打怪升级之路。 一起学习Java、大数据、数据结构算法(公众号同名) ❤…

[RTOS 学习记录] 复杂工程项目的管理

[RTOS 学习记录] 复杂工程项目的管理 这篇文章是我阅读《嵌入式实时操作系统μCOS-II原理及应用》后的读书笔记,记录目的是为了个人后续回顾复习使用。 前置内容: 工程管理工具make及makefile 文章目录 1 批处理文件与makefile的综合使用1.1 批处理文件…

C语言学习/复习29--内存操作函数memcpy/memmove/memset/memcmp

一、内存操作函数 1.memcpy()函数 注意事项1:复制的数目以字节为单位 注意事项2:一定要保证有足够空间复制 模拟实现1 拷贝字符案例:由于拷贝时函数本事就以字节为单位拷贝所以该例子也可用于其他类型数据的拷贝。 模拟实现2 将自身的…

YOLOv8 关键点检测模型训练部署

文章目录 1、YOLOv8安装及使用1.2、命令行使用1.3、使用python-API模型预测1.4、pt转换ONNX 2、训练三角板关键点检测模型2.1、训练命令 3、ONNX Runtime部署 1、YOLOv8安装及使用 参考链接: 同济子豪兄视频 github原文链接 # 安装yolov8 pip install ultralytics --upgrade …

Linux-LVM与磁盘配额

一、LVM概述 Logical Volume Manager,逻辑卷管理 能够在保持现有数据不变的情况下动态调整磁盘容量,从而提高磁盘管理的灵活性 /boot分区用于存放引导文件,不能基于LVM创建 LVM机制的基本概念 PV(物理卷)&#xff…

情感识别——情感计算的模型和数据集调查

概述 情感计算指的是识别人类情感、情绪和感觉的工作,已经成为语言学、社会学、心理学、计算机科学和生理学等领域大量研究的主题。 本文将概述情感计算的重要性,涵盖思想、概念和方法。 情感计算是皮卡德于 1997 年提出的一个想法,此后出…

生产数据采集系统

在数字化浪潮的推动下,生产数据采集系统已经成为企业提升生产效率、优化运营管理的关键工具。那么,什么是生产数据采集系统呢?简单来说,生产数据采集系统是指通过一系列技术手段,实时收集、处理和分析生产线上的各类数…

STM32 I²C通信

一、IC总线通信 1.1 IC总线特点 IC(Inter Integrated Circuit,集成电路总线),通过串行数据线SDA(Serial Data)和串行时钟线SCL(Serial Clock)来完成数据的传输。 特点:…

java泛型介绍

Java 泛型是 JDK 5 引入的一个特性,它允许我们在定义类、接口和方法时使用类型参数,从而使代码更加灵活和类型安全。泛型的主要目的是在编译期提供类型参数,让程序员能够在编译期间就捕获类型错误,而不是在运行时才发现。这样做提…

(ICML-2021)从自然语言监督中学习可迁移的视觉模型

从自然语言监督中学习可迁移的视觉模型 Title:Learning Transferable Visual Models From Natural Language Supervision paper是OpenAI发表在ICML 21的工作 paper链接 Abstract SOTA计算机视觉系统经过训练可以预测一组固定的预定目标类别。这种受限的监督形式限制…

[笔试训练](四)

010 Fibonacci数列_牛客题霸_牛客网 (nowcoder.com) 题目: 题解: 1.创建一个数组fib[],保存范围内的所有斐波那契数,再求离N最近的斐波那契数。 2.创建3个数a,b,c,依次先后滚动,可得出所有的斐波那契数&#xff0c…

椋鸟数据结构笔记#11:排序·下

文章目录 外排序(外部排序)文件拆分并排序归并文件两个文件归并多文件归并优化 萌新的学习笔记,写错了恳请斧正。 外排序(外部排序) 当数据量非常庞大以至于无法全部写入内存时,我们应该怎么排序这些数据呢…

贪吃蛇(C语言版)

在我们学习完C语言 和单链表知识点后 我们开始写个贪吃蛇的代码 目标:使用C语言在Windows环境的控制台模拟实现经典小游戏贪吃蛇 贪吃蛇代码实现的基本功能: 地图的绘制 蛇、食物的创建 蛇的状态(正常 撞墙 撞到自己 正常退出&#xf…

SpringCloud系列(11)--将微服务注册进Eureka集群

前言:在上一章节中我们介绍并成功搭建了Eureka集群,本章节则介绍如何把微服务注册进Eureka集群,使服务达到高可用的目的 Eureka架构原理图 1、分别修改consumer-order80模块和provider-payment8001模块的application.yml文件,使这…

刷题之Leetcode242题(超级详细)

242.有效的字母异位词 力扣题目链接(opens new window)https://leetcode.cn/problems/valid-anagram/ 给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。 示例 1: 输入: s "anagram", t "nagaram" 输出: true 示例 2…

使用kali进行DDos攻击

使用kali进行DDos攻击 1、打开命令提示符,下载DDos-Attack python脚本 git clone https://github.com/Elsa-zlt/DDos-Attack 2、下载好之后,cd到DDos-Attack文件夹下 cd DDos-Attack 3、修改(设置)对ddos-attack.py文件执行的权…

抖音小店现在还能做吗?未来还有多大的发展空间?聊聊我的看法

大家好,我是电商笨笨熊 关于“抖店还能做吗”这样的问题,每年都有人在问; 尤其是今年来说,抖店已经走过了四五年的时间,很多人担心抖店还能走多远,还能做多久; 一些一直未进入抖店但持续在观…

【从零开始学习IO机制 | 第一篇】I/O的演进之路

前言: 自诞生以来,Java 一直是软件开发领域的重要一环。作为一种广泛应用于各种应用程序和系统的编程语言,Java 一直致力于提供高效、可靠的 I/O(输入/输出)操作,以满足不断增长的软件需求和用户期望。 Ja…

javaweb-数据库

数据库管理系统(DataBase Management System,简称DBMS) MySQL 官网:MySQL :: Developer Zone 安装 官网下载地址:MySQL :: Download MySQL Community Server (Archived Versions) 图形化工具 通常为了提高开发效…