我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Teradata 数据库 - Mr

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Teradata 数据库 - Mr

Teradata 数据库 - Mr

Teradata 数据库

笔者大学所学计算机专业,读书时接触过Oracle、mysql和SQL SERVER,一度坐井观天觉得数据库应该也就这些了,但自笔者毕业进入数据仓库这个行业,接触的第一个商业数据库即是Teradata,亦是接触到的第一个MPP体系架构,先简单谈谈个人对Teradata的认识吧

产品特点:

MPP架构,为提供商业大数据分析处理而设计构建(OLAP)

通过PE、BYNET、AMP中间件构建出高效的并行数据库系统(作为行式数据库对硬件资源要求特别在于内存资源需求上优势很明显)

通过PI和SI构建数据的均匀分布和高效的读写能力

提供了丰富的SQL请求工具(BTEQ、Teradata SQL ASSISTANT、FASTLOAD、MULTILOAD、FASTEXPORT、TPUMP)

提供了完备的管理工具(Teradata Manager、DBQM、Teradata Administrator)

提供了丰富的二次开发接口(PP2、CLI、ECLI、ODBC、Oracle Transparent Gateway、WinCLI、TS/API)

产品不足

过于封闭,在网上很难找到Teradata数据库的相关资料,产生异常或疑问只能咨询Teradata内部人员(或有相关经验人员)

这给后期架构规划和日常异常的处理上带来了很大的不便,随着与Teradata方合作的开展,亦愈发认识到,技术的完全封说的好听点是为了操作的合规性和单一性,说的直白点就是为了最大化专利技术的经济效益(之间产生过几次数据库异常,Teradata中国区的工程师处理不了都是申请美国工程师的技术支持,这也能看出来对于Teradata内部亦是存在比较明显的技术封闭现象)

扩展性不足,作为一款MPP体系架构产品,对比开源hadoop以及笔者现在所用的商业Vertica数据库,其扩展性表现十分有限

笔者接触过Teradata 5系列和2系列的架构环境,均采用了共享阵列存储,其最大的问题就在于,阵列插满磁盘就无法有效进行扩容了,节点的扩展没有接触不好妄加评论,当然现在的Teradata可能在这块有了很大的提升和对市场需求积极的调整(在最后一次架构规划中,Teradata方给出了基于X86服务器的2系列架构方案)

兼容性不足,这点也可称之为可移植性(当然这类大存储的MPP数据库也不会轻易做移植),当然其缘由还是在于其封闭性

从底层硬件到上层数据库软件以及后期的服务,甚至机柜都是由Teradata定制化的实现,当然现在的Teradata可能在这块有了很大的提升和对市场需求积极的调整(在最后一次架构规划中,Teradata方给出了基于X86服务器的2系列架构方案)

IO能力有限,行式存储数据库的通病,在压缩比较低的情况下,加剧了OLAP场景中对于数据库IO能力瓶颈的产生

下面我们就来简单认识认识Teradata吧。

1、Teradata因数据仓库而存在

Teradata 是一个关系型数据库管理系统 (RDBMS).

• 为运行世界上最大的商业数据库而设计;

• 企业级数据仓库的首选解决方案;

• 基于Linux/UNIX与NT的开放式系统平台;

• 完全符合ANSI标准;

• 可以运行于单个或多个节点;

• 可以帮助企业提供自服务端到客户端的所有应用

• 运用并行处理方式来管理Terabytes以上的数据

 

2、Teradata与EDW 

 

 

 3、数据仓库发展的五个阶段

 

 4、Teradata数据库系统体系架构

 

 

基本读写过程

•解析引擎PE将SQL请求拆分成 各AMP的请求以便幵行处理

• 解析器分解接收到的SQL交易 请求,验证语法、权限等

• 优化器产生最优的查询方案

• 分发所优化的方案到AMP

• 数据通过表PI的HASH值均匀 分布到各AMP管理的磁盘( 写)

• 信息传递层可汇总各AMP数 据,将最终结果返回客户端( 读)

5、The Parsing Engine (PE) 解析器

 

 PE的作用:

• 一种VPROC,用亍解释SQL请求、 接收输入记录、审查数据、发送信 息到AMPS

• 每个PE能幵发操作120条会话,每 个会话能处理多个请求

• 当多个用户同时访问系统时, Teradata能够通过PE在各节点间自 劢平衡负载,不需要人工干预

6、BYNET(高速连接网络) 

 

 

 BYNET的作用是:

• 负责AMP与PE之间的通信

• 通信方式可为:Point-to-Point, Multi-Cast, and Broadcast communications

• 将AMP返回给PE的结果集进行合并 • 它的存在使得Teadata的并行成为可能

• BYNET可以是硬件也可以是软件 • 随着节点的增加,BYNET的带宽线性增长

7、AMP - Teradata并行处理的基础

 

 

 • 一种VPROC,每节点可包含多个 AMP

• 每个AMP拥有独立内存和CPU资 源,与一个VDISK连接,管理数 据库/表的部分数据。

• 控制所有磁盘交互及部分数据库 的操作,如读、写、转换、格式 化等

• 各个AMP幵行处理,互不干扰, 交易处理结果在信息传递层汇总 后,直接返回给应用程序

• 一个请求可以分发到所有AMP一 起共同工作,每个AMP也可以同 步处理多个请求

8、Teradata支持MPP架构,通过系统扩展实现并行 处理能力的线性扩展 

 

9、Teradata数据分布

Teradata采用hash算法根据用户建表所选的PI进行数据分布,当然这里有所有MPP体系架构数据库的通病,数据倾斜问题,Terdata为方便DBA的维护管理工作,提供了数据重组功能,当然作为一个大型的MPP数据库,数据库对象量级的过于庞大,数据倾斜问题的处理往往会占用DBA相当大的维护管理成本(靠每个用户遵守PI选择的原则只是理论上的期望)

 

关于Teradata组件和语法的分享这里就不详述了,如有兴趣欢迎留言交流

 

后期随着使用的深入,在逐步了解其强大同时也更加了解其封闭,要使用Teradata购买其产品只是一个开始,后续在于配套的维护和扩容上还需源源不断的投入,在这个注重信息安全和成本控制的时代趋势中,伴随着去IOE的深入和开源技术的成熟,Teradata注定淡出大部分国内市场,至少对于笔者所处的通信行业来讲是如此,自然首当其冲的还是企业对投入成本的控制,当然不可否认的是,Teradata作为一个为大数据商业数据库产品,确有其独到之处。

老生常谈,在数据仓库体系架构中,至少在当下,RDBMS仍是核心的一环,笔者所在的环境,在对hadoop生态取代Teradata探索中有过血淋淋的教训,在面对Teradata服务即将到期的时候不得不再次进行基于MPP体系架构的RDBMS招标,事实证明开源与商业的组合架构现阶段最为合适,故而这样的架构沿用至今,只是对于数据仓库环境,基于MPP架构体系的列式存储RDBMS应是首选

关于MPP体系架构相关知识,我们下期再聊。

 

 

 

我是Mr.Yu,一名数据仓库行业的资深从业者,很高兴与你的这次分享!

 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Teradata 数据库 - Mr

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Teradata 数据库 - Mr

Teradata 数据库 笔者大学所学计算机专业,读书时接触过Oracle、mysql和SQL SERVER,一度坐井观天觉得数据库应该也就这些了,但自笔者毕业进入数据仓库这个行业,接触的第一个商业数据库即是Teradata,亦是接触到的第一个M
Teradata 数据库 - Mr
2021-03-30

MySQL数据库索引介绍 - Mr

一、什么是索引索引是mysql数据库中的一种数据结构,就是一种数据的组织方式,这种数据结构又称为key表中的一行行数据按照索引规定的结构组织成了一种树型结构,该树叫B+树二、为何要用索引优化查询速度注意:只能加速索引字段三、如何正确的看待索引错误的认知项目上线
MySQL数据库索引介绍 - Mr
2016-01-29

什么是Teradata数据库系统

Teradata数据库系统是一种关系型数据库管理系统(RDBMS),最初由Teradata公司开发。它被设计用于处理大规模数据仓库和数据分析应用的需求。Teradata数据库系统具有高度并行处理能力,可以处理大量数据并支持复杂的分析查询。它
什么是Teradata数据库系统
2024-04-09

Teradata支持并行数据库架构吗

是的,Teradata是一种支持并行数据库架构的关系型数据库管理系统。它使用共享存储架构和共享无状态节点的方式来实现并行处理,能够有效地处理大规模数据并支持高并发查询。Teradata的并行数据库架构能够实现数据的分布式存储和并行处理,从而
Teradata支持并行数据库架构吗
2024-04-09

Teradata数据库系统支持的数据类型有哪些

在Teradata数据库系统中,支持的数据类型包括:数值类型:INTEGER、DECIMAL、FLOAT、DOUBLE PRECISION等。字符串类型:CHAR、VARCHAR、CLOB、GRAPHIC、VARGRAPHIC等。日期和
Teradata数据库系统支持的数据类型有哪些
2024-04-09

Teradata中怎么创建一个新的数据库

要在Teradata中创建一个新的数据库,可以使用以下SQL语句:CREATE DATABASE database_name;其中,database_name 是要创建的数据库的名称。要注意的是,Teradata中的数据库名称是不区分大小
Teradata中怎么创建一个新的数据库
2024-04-09

Teradata数据库系统的主要特点有哪些

并行处理能力强:Teradata数据库系统具有强大的并行处理能力,可以将查询任务分解成多个子任务并在多个处理单元上同时执行,从而提高查询速度和性能。灵活的扩展性:Teradata数据库系统支持水平和垂直扩展,可以根据需求灵活增加节点和存储容
Teradata数据库系统的主要特点有哪些
2024-04-09

Teradata怎么实时处理数据

要实现实时处理数据,您可以使用Teradata的以下功能和工具:Teradata Real-Time Interaction Manager(RTIM):该工具可以实时捕获、处理和响应客户行为数据,从而实现个性化的实时营销和交互。Terad
Teradata怎么实时处理数据
2024-04-09

如何在Teradata中进行有效的数据仓库设计

在Teradata中进行有效的数据仓库设计需要考虑以下几个关键步骤:确定业务需求:首先要明确数据仓库的目标和所需的数据分析和报告功能。了解业务需求将有助于确定数据仓库的数据模型和设计。数据建模:根据业务需求,进行数据建模,包括确定实体、属性
如何在Teradata中进行有效的数据仓库设计
2024-04-09

Teradata如何应用在数据湖和数据仓库一体化的架构中

在数据湖和数据仓库一体化的架构中,Teradata可以发挥重要作用。Teradata是一种集成式数据分析平台,可以处理大规模的数据,并提供高性能的数据处理和分析能力。在数据湖中,Teradata可以帮助用户将不同来源的数据整合到一个统一的
Teradata如何应用在数据湖和数据仓库一体化的架构中
2024-04-09

Teradata和其他数据仓库解决方案有什么不同

Teradata是一种关系型数据库管理系统,专门用于数据仓库和分析应用。与其他数据仓库解决方案相比,Teradata具有以下特点:并行处理能力:Teradata是一个基于共享架构的并行处理系统,可以实现高效的并行处理和数据加载。这使得Ter
Teradata和其他数据仓库解决方案有什么不同
2024-03-08

Teradata如何应对数据质量和数据清洗

Teradata数据管理和分析解决方案提供商,为数据质量和数据清洗提供了一系列解决方案。以下是一些Teradata如何应对数据质量和数据清洗的方法:数据质量管理工具:Teradata提供了数据质量管理工具,可以帮助用户监控和评估数据质量。这
Teradata如何应对数据质量和数据清洗
2024-04-09

Teradata怎么管理数据集成和数据质量

Teradata是一种强大的数据仓库平台,它提供了多种工具和功能来管理数据集成和数据质量。以下是一些常用的方法:数据集成:Teradata提供了Teradata Parallel Transporter (TPT)工具,它是一个高性能的数据
Teradata怎么管理数据集成和数据质量
2024-04-09

Teradata支持数据压缩功能吗

是的,Teradata支持数据压缩功能。Teradata数据库提供了多种数据压缩技术,可以有效地压缩数据以节省存储空间,并提高查询性能。用户可以通过使用Teradata数据库内置的压缩算法进行数据压缩,以减少存储空间的占用,并加快数据的读取
Teradata支持数据压缩功能吗
2024-04-09

Teradata适用于大数据分析吗

是的,Teradata是一种强大的大数据分析平台,被广泛应用于大型企业和组织中。它具有高度可扩展性和性能优势,能够处理海量的数据并进行复杂的分析和查询操作。Teradata提供了一系列的工具和功能,帮助用户实现数据集成、数据管理、数据分析和
Teradata适用于大数据分析吗
2024-04-09

Teradata适用于大数据分析吗

正文Teradata,一个高度可扩展的DBMS,专为处理大数据集而设计。其并行处理架构、大数据容量、内置高级分析功能、可扩展性、实时数据处理能力和与大数据生态系统的无缝集成,使其成为大数据分析的理想选择。Teradata支持多种用例,包括客户行为分析、欺诈检测和预测性维护,为企业提供获得有价值见解和推动明智决策的强大平台。
Teradata适用于大数据分析吗
2024-04-08

Teradata支持分布式数据处理吗

是的,Teradata支持分布式数据处理。Teradata的数据库系统是一个高性能的分布式数据库系统,可以处理大规模的数据并进行并行计算。它使用共享架构和多个节点来处理数据,从而实现高可用性和可扩展性。Teradata可以通过在多个节点上运
Teradata支持分布式数据处理吗
2024-04-09

编程热搜

目录