我的编程空间,编程开发者的网络收藏夹
学习永远不晚

HIVE架构

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

HIVE架构

HIVE架构

UI:

     用于提交查询的客户端,hive自带有CLI(command line),现在推荐使用beeline

DRIVER:

               1.用于接收客户端提交的SQL,并实现了session控制

                2.并提供了jdbc/odbc的fetch和execute功能

COMPILER:

               编译器,负责解析SQL,并从METASTORE那里获取元数据生成执行计划,然后发给DRIVER

              执行计划就是一个DAG(有向无环图)

             组件:

                      1.Parser:将查询语句转变成一个parse tree

                      2.Semantic Analyser:将parse tree变成一个内部的查询表示(依然是基于查询块,而不是operator tree)。同时在这一步也会做语法检查,类型检查和类型隐式转换

                      3.Logical Plan Generator:将内部的查询表示转变成一个逻辑计划(包含一个operator tree),一些operator是关系代数的filter,join等,另一些是hive特定的,用于将逻辑计划变成一系列的map/reduce job,比如reduceSink operator(出现在map-reduce边界);这一步Optimizer也会对查询进行优化,比如map端聚合等

                      4.Query Plan Genertor:将逻辑计划转换成一系列的map-reduce tasks.做法是,通过对operator tree递归遍历,然后拆分成一系列的map/reduce task,然后提交到hadoop进行执行

METASTORE

              元数据存储,存储数仓中的DATABASE,TABLE,PARTITION,COLUMN,SERIALIZERS和DESERIALIZERS

             目的:提供数据抽象和数据发现,如果数据抽象,每次查询的时候,用户都需要提供数据格式,extractors和loaders。metasore的数据在表创建或重建都会更新,类似于传统数据仓库(这些信息存在于配置的数据库中,一般是mysql)

EXECUTION ENGINE

              DRIVER将执行计划发给ENGINE,然后ENGINE与底层交互获取结果后,返回给DRIVER。DRIVER再将数据发送给客户端

              这一个ENGINE设计的挺好的,以前是MAPREDUCE,现在可以是TEZ,spark,以后是否在出现新的框架,谁又说得准?!

 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

HIVE架构

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

HIVE架构

UI:     用于提交查询的客户端,hive自带有CLI(command line),现在推荐使用beelineDRIVER:               1.用于接收客户端提交的SQL,并实现了session控制                2.并提供了
HIVE架构
2016-06-18

hive架构由哪几部分组成

这篇文章主要为大家展示了“hive架构由哪几部分组成”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“hive架构由哪几部分组成”这篇文章吧。主要分为以下几个部分: 用户接口,包括 命令行CLI,C
2023-06-03

hive架构及知识体系的示例分析

这篇文章主要介绍了hive架构及知识体系的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1、Hive架构与基本组成Hive的体系结构可以分为以下几部分: (1)
2023-06-02

Hive架构设计及原理的示例分析

这篇文章给大家分享的是有关Hive架构设计及原理的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。Hive架构设计及原理1.什么是Hive:Hive是构建在Hadoop之上的数据仓库平台,可以结构化的数据文
2023-06-03

数据库之Hive概论和架构和基本操作

目录Hive概论Hive架构 Hive安全和启动Hive数据库操作Hive内部表操作-数据添加Hive内部表特点Hive外部表操作Hive表操作-分区表Hive概论Hive是一个构建在Hadoop上的数据仓库框架,最初,Hive是由Fac
2023-04-07

详解hive常见表结构

目录hive简介1.外部表2.内部表3.分区表1.静态分区2.动态分区4.分桶表1.抽样2.map-side join5.表的文件存储格式1.TEXTFILE2.SEQUENCEFILE3.RCFILE4.ORC5.Parquet6.总结5
2022-08-11

数据库之Hive概论和架构和基本操作是什么

今天小编给大家分享一下数据库之Hive概论和架构和基本操作是什么的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。Hive概论H
2023-04-14

c/s架构和b/s架构

C/S架构和B/S架构是两种常见的网络应用架构。C/S指的是客户端/服务器架构,而B/S指的是浏览器/服务器架构,两者都是为了实现交互式的网络应用程序,但在结构和工作方式上有所不同。C/S架构适用于需要更高性能、更好用户体验和离线工作模式的
2023-07-31

mysql 架构类问题之 MMM 架构

MMM 和 MHA 架构MMM 和 MHA 架构的作用对主从复制集群的 master 进行监控当 master 宕机后把写 VIP 迁移到新 master重新配置集群中其他 slave 对新的 master 同步MMM 架构适用的主从复制架构 主 -- 主
mysql 架构类问题之 MMM 架构
2014-12-31

mysql架构类问题之MHA架构

MHA 架构适用的主从复制架构 主 / | 从1 从2 从3故障转移步骤选举具有最新更新的slave尝试从宕机的master保存二进制日志应用差异的中继日志到其他slave应用从master保存的二进制日志提升选举的slave为新的master配置其他slav
mysql架构类问题之MHA架构
2015-04-12

Hive的架构设计考虑了哪些容错机制和故障恢复策略

Hive的架构设计考虑了以下容错机制和故障恢复策略:数据冗余:Hive使用Hadoop分布式文件系统(HDFS)存储数据,HDFS会自动将数据进行冗余存储,确保数据不会因单个节点的故障而丢失。备份和恢复:Hive支持数据备份和恢复功能,可以
Hive的架构设计考虑了哪些容错机制和故障恢复策略
2024-03-11

HDFS架构

HDFS架构(Master-Slave)几个进程的角色nameNode(master):用于保存、管理、持久化文件的元数据(文件名、文件副本数、文件块大小、文件块列表),同时还要接收客户端的文件读写请求。secondaryNameNode:用于实时同步文件元数
HDFS架构
2019-04-12

MySQL 架构

执行流程简介主要分为server层和存储引擎层。server层主要分为:连接器、解析器、优化器、执行器、查询缓存连接器:主要作用就是用户认证、给用户创建连接并使用连接池维护连接。查询缓存:建立连接之后,就可以进行SQL操作了,如果该SQL语句在查询缓存中可以匹
MySQL 架构
2016-06-23
2024-04-02

code 架构

目录 1. code 架构 1.1. 代码质量的评判的维度 1.2. 架构师 1.3. 基础平台篇 1. code 架构 1.1. 代码质量的评判的维度 可阅读性 (方便代码流转) 可
2023-08-30
2023-09-11

Yarn架构

Yarn架构(Master-Slave)进程角色:resourceManager(Master):任务调度和集群资源管理。nodeManager(Slave):单个节点的资源管理。applicationMaster:为任务程序申请资源,任务程序运行状态监控、错
Yarn架构
2016-03-24

Facebook移动架构:Android Flux架构详解

要为Android应用找到一个好的架构不是一件容易的事情。谷歌似乎不太在乎这个事情,因此在设计模式上,除了Activity 生命周期管理之外,再也没有官方的推荐。但是,为你的应用打造一个架构是非常重要的。不管你是否喜欢,任何应用终都会有一个
2022-06-06

阿里P8架构师谈:淘宝技术架构从1.0到4.0的架构变迁!附架构资料

淘宝技术架构变迁自2003年创立以来的,淘宝业务发展非常迅速,几乎是每年以100%的速度在成长。创立之初,为了快速上线,抢占市场,选择了当时流行的LAMP架构,用PHP作为网站开发语言, Linux作为操作系统,Apache作为Web服务器
2023-06-05

编程热搜

目录