我的编程空间,编程开发者的网络收藏夹
学习永远不晚

数据治理的王者——Apache Atlas

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

数据治理的王者——Apache Atlas

file

一、Atlas是什么?

在当今大数据的应用越来越广泛的情况下,数据治理一直是企业面临的巨大问题。

大部分公司只是单纯的对数据进行了处理,而数据的血缘,分类等等却很难实现,市场上也急需要一个专注于数据治理的技术框架,这时Atlas应运而生。

Atlas官网地址:https://atlas.apache.org/

Atlas是Hadoop的数据治理和元数据框架。

Atlas是一组可扩展和可扩展的核心基础治理服务,使企业能够有效,高效地满足Hadoop中的合规性要求,并允许与整个企业数据生态系统集成。

Apache Atlas为组织提供了开放的元数据管理和治理功能,以建立其数据资产的目录,对这些资产进行分类和治理,并为数据科学家,分析师和数据治理团队提供围绕这些数据资产的协作功能。

file

  • Atlas支持各种Hadoop和非Hadoop元数据类型

  • 提供了丰富的REST API进行集成

  • 对数据血缘的追溯达到了字段级别,这种技术还没有其实类似框架可以实现

  • 对权限也有很好的控制

二、架构原理

file

Atlas包括以下组件:

  • 采用Hbase存储元数据
  • 采用Solr实现索引
  • Ingest/Export 采集导出组件 Type System类型系统 Graph Engine图形引擎 共同构成Atlas的核心机制
  • 所有功能通过API向用户提供,也可以通过Kafka消息系统进行集成
  • Atlas支持各种源获取元数据:Hive,Sqoop,Storm。。。
  • 还有优秀的UI支持

三、效果图

file

file

更多大数据,Atlas,ES,Kafka等技术博文,欢迎关注实时流式计算:

file

本文由博客一文多发平台 OpenWrite 发布!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

数据治理的王者——Apache Atlas

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

数据治理的王者——Apache Atlas

一、Atlas是什么?在当今大数据的应用越来越广泛的情况下,数据治理一直是企业面临的巨大问题。大部分公司只是单纯的对数据进行了处理,而数据的血缘,分类等等却很难实现,市场上也急需要一个专注于数据治理的技术框架,这时Atlas应运而生。Atlas官网地址:htt
数据治理的王者——Apache Atlas
2020-02-25

Spark与Apache Atlas在Ubuntu的数据治理

Apache Spark和Apache Atlas都是大数据处理领域的重要工具,它们在数据治理方面发挥着关键作用。Apache Spark是一个快速、通用的集群计算系统,用于大规模数据处理和分析,而Apache Atlas则是一个开源的数据
Spark与Apache Atlas在Ubuntu的数据治理
2024-10-22

Atlas如何帮助企业进行数据治理和合规性监管

Atlas是一个强大的数据治理平台,可以帮助企业进行数据治理和合规性监管。通过Atlas,企业可以建立和维护全面的数据目录,包括数据资产的分类、标记、血统和关系等信息。这样可以帮助企业更好地了解其数据资产的情况,并有效管理和监控数据的使用和
Atlas如何帮助企业进行数据治理和合规性监管
2024-03-11

Apache Superset 1.2.0教程 (二)——快速入门(可视化王者英雄数据)

上一篇我们已经成功的安装了superset,那么该如何可视化我们的数据呢?本文将可视化王者英雄的数据,快速的入门Superset。一、连接数据源首先确保mysql可以正常连接使用,并且准备好数据。登录进入superset,选择Databases点击右上方+号,
Apache Superset 1.2.0教程 (二)——快速入门(可视化王者英雄数据)
2015-10-28

数据库故障转移的巅峰对决:数据斗士,王者归来

当数据库遭遇故障时,故障转移成为企业确保业务连续性的关键手段。本文将深入探讨两种主流的故障转移解决方案:Synchronous Replication(同步复制)和 Asynchronous Replication(异步复制),并比较它们在性能、数据一致性和恢复时间目标(RTO)方面的优缺点。
数据库故障转移的巅峰对决:数据斗士,王者归来
2024-02-15

数据库故障转移的智慧宝典:数据王者,纵横捭阖

数据库故障转移的智慧宝典:确保数据安全,纵横捭阖
数据库故障转移的智慧宝典:数据王者,纵横捭阖
2024-02-15

数据库设计工具的王者:掌握神器,驰骋数据世界

掌握数据库设计工具的王者:驰骋数据世界
数据库设计工具的王者:掌握神器,驰骋数据世界
2024-03-10

编程热搜

目录