我的编程空间,编程开发者的网络收藏夹
学习永远不晚

做数据治理前,应该了解并避开的十大坑

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

做数据治理前,应该了解并避开的十大坑

这个数据可能会劝退一大波正准备做或者正在观望数据治理的企业:既然这笔投资90% 的概率失败,那为什么要继续。

诚然,做数据治理很难,但对于一些正在数字化转型道路上迈步前行的企业来说,这又是一件关系到企业发展战略的不得不做的基础工程。

我们梳理了导致数据治理失败的十大原因,希望能给正准备进行数据治理的组织一些启发。

1. 目标不明晰

数据治理是一个复杂的系统工程,一个明确合理的目标,能让数据治理更加有的放矢,反之,不合理不清晰的目标,则会将这场治理,导向失败。

目标环节的问题主要出现在两个方面:

  • 一是目标与业务脱节。不考虑治理能怎样为业务赋能,而是单从技术角度出发,为了治理而治理,这样一方面会导致数据治理难以取得业务支持,难以在业务层面落地;另一方面也会导致数据治理成为“空治理”,难以带来实际效果。
  • 二是目标不够准确。作为系统工程,其目标也需要分阶段分情况分部门来拆解制定,如若目标定得太空泛,如“我们数据治理的目标是为了解决所有数据质量问题”,或者目标定得太浅层,如将其目标定为解决某一小方面的业务数据问题,都会导致数据治理工作难以有效规划,顺利开展。

所以,数据治理的第一步一定要做好:分析业务问题,找到企业的核心业务诉求,定义数据治理的目标和范围。

2. 高层支持乏力

数据治理的关键在于“治理”,谈及治理,则必然会涉及全局性的改良,数据战略、组织机构、流程优化等方方面面都需配合数据治理的进程进行相关调整与优化。而这些,仅靠少数人、少数部门是难以实现的。

一旦缺乏高层支持,或者高层影响力不足,那么数据治理难以深入到各级部门、各业务领域的核心人员和核心环节,那么这个需要组织内部统一认知、齐心协力的系统工程就会很难落地。

当然,要取得更多的支持,对于数据治理的目标以及成效一定要有清晰的呈现。组织在开展数据治理的过程中需坚持业务价值导向,明确数据治理的定位是有效地对数据资产进行管理,确保其准确、可信、可感知、可理解、易获取,为大数据应用和领导决策提供数据支撑。

3. 人员参与度低

数据治理是一个从上到下的工作,资源的调动,制度的设计、执行、监督,最终都要落实在人上,只有获得组织内部全链条的支持,最终才能取得成效。

很多组织认识到了数据的价值,也成立了专门的数据治理团队,但通常这些团队里都是技术人员,并被划分到技术部门,导致整个数据治理的落地是重技术、轻业务的。技术部门往往受制于组织范围,主要从技术维度来治理,单方面解决数据问题,往往是治标不治本。

数据治理既是技术部门的事,更是业务部门的事,一定要建立多方共同参与的组织架构和制度流程,数据治理的工作才能真正落实到人,不至于浮在表面。

4. 过程不透明

数据治理的过程不透明,这一点上文提到的高层支持度和人员参与度两个要素息息相关。

这里的不透明主要指的是两个方面:

  • 一是制定的规则章程制度标准等未进行宣贯。相关人员对此并无知悉,自然也就谈不上遵守执行,那么这些文件便只能成为一纸空谈。
  • 二是数据治理没有存在感。数据治理的进度、成果等,都没有阶段性的呈现,业务人员感受不到数据治理带来的效果也就不愿配合,高层管理人员接收不到数据治理的成效价值也就意识不到数据治理的重要性,从而降低投入。

5. 分工混乱

数据治理项目涉及范围广,牵扯到不同的业务部门、信息部门和应用系统,需要协调好各方关系,分工合理,通力协作才能保证项目的成功。

一些组织在数据治理的过程中,没有建立起一个分工明确的架构体系,比如让IT人员去负责数据质量,然而数据质量问题产生的源头往往在业务那里,不了解业务的IT人员往往难以对此做出相应决策与应对措施,这往往会导致岗位职责事项模糊、互相推诿问题难以解决的情况。

只有要让懂业务的人做业务定义的事,让他们成为所属数据标准的归口部门,让懂技术的人完成具体的业务实现,二者各司其职,各尽其能,才能逐步构建成熟、健全的数据治理分工体系。

6.权责不清

建好了平台,通过跨部门的合作,配置好了数据规则,并据此找到了数据的问题,然而过了一段时间之后问题依旧存在,或者反复出现。这种问题出现的根源在于没有建立好一个关于数据的认权追责机制的闭环,出现数据问题不知道该找谁,多方协调,导致项目实施速度变慢,并导致许多质量问题没有得到解决。

比如某互联网集团通过十多年的数据架构经验,明确了一个稳定的持续迭代的中间层是保持数据架构有序的关键,为此,该集团将数据资产研发和数据应用研发角色剥离开来,以沉淀资产、中间层建设、资产架构优化为主要职责,设立数据资产工程师岗位和独立晋升通道,明确权责并辅之以绩效激励,让数据治理开展得更加顺畅。

7. 标准缺失

数据标准落地难是数据治理中的普遍性问题。对于很多进行过数据标准管理的组织来说,花很大精力梳理的标准体系最后还是沦为了一堆Word和Excel文档。

在金融业,或者像国家安全等一些特殊行业,数据标准的执行力度较好,而在政府和普通企业,数据标准基本上就是一种摆设。造成这种问题的原因有两个:一是大家对数据标准工作的不重视。二是国内的企业做数据标准,动机往往不是为了做好数据治理,而是应付上级检查,很多都是请咨询公司,借鉴同行业企业的标准本地化修改而成,一旦咨询公司撤离,企业本身是没有数据标准落地的能力的。

8. 短期主义

数据治理是一个需要践行长期主义事情, 它是用来支撑组织战略和长远发展的,应当不断吸收新的数据来源,持续追踪数据问题并不断改进,所以数据治理工作不应当是一锤子买卖。

一些组织在进行数据治理时,将其视作一次性项目,希望能在一个短期的单位时间内带来较高的投资回报,如果未达预期,就要将其作为一个成本支出给砍掉;或者为了赶进度,没有沟通协调好各部门的需求与关系,都会导致数据治理最终失败。

9. 贪大求全

提起二八原则,大家都不陌生。这个原则在数据治理中同样适用:80%的数据业务,其实是靠20%的数据在支撑;同样的,80%的数据质量问题,其实是由那20%的系统和人产生的。在数据治理的过程中,如果能找出这20%的数据,和这20%的系统和人,先从核心系统,核心数据开始做起,再渐渐覆盖到其他领域,将会起到事半功倍的效果。

许多组织在进行数据治理时往往会陷入“大而全”的陷阱,他们希望一次数据治理能覆盖全业务和全技术域,将各个业务系统、各类数据都纳入其中。但其实数据治理本身就是一个很大的概念,包括很多方面内容,一味贪大求全,抓不住重点,往往会导致数据治理看似什么都做了,但其实又什么都没做,成本、时间都上去了,但是效果却很不明显。

10. 过度依赖工具

数据治理工作是结合了业务、技术、流程、组织架构、专业人员和专业方法的各项工作的集合,这些工作很大程度上依赖于各类数据治理工具来实施落地。一套好的数据治理工具,的确可以使数据治理工作事半功倍,但如果过度依赖于工具,数据治理也将会难以施行下去。购买一个能对数据进行分类或者管理的平台很容易,但如果你想更改数据结构,或者清理无价值的数据,工具便难以支撑了。

归根结底,数据治理还是对与数据相关的人的行为的治理,除了工具外,组织架构、制度流程、实施和运维等一系列工作同样至关重要,这一系列配套不做好,后续工作难以得到保障。

小结

因为其涉及到的工作的复杂性,数据治理之路必然不是一路坦途。

学习前车之鉴,避开常见陷阱,数据治理抓重点,在建组织、明规范、梳流程的基础上,选用合适的工具,也能让数据治理之路更顺畅。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

做数据治理前,应该了解并避开的十大坑

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

做数据治理前,应该了解并避开的十大坑

本文我们梳理了导致数据治理失败的十大原因,希望能给正准备进行数据治理的组织一些启发。

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录