我的编程空间,编程开发者的网络收藏夹
学习永远不晚

HIVE架构

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

HIVE架构

HIVE架构

UI:

     用于提交查询的客户端,hive自带有CLI(command line),现在推荐使用beeline

DRIVER:

               1.用于接收客户端提交的SQL,并实现了session控制

                2.并提供了jdbc/odbc的fetch和execute功能

COMPILER:

               编译器,负责解析SQL,并从METASTORE那里获取元数据生成执行计划,然后发给DRIVER

              执行计划就是一个DAG(有向无环图)

             组件:

                      1.Parser:将查询语句转变成一个parse tree

                      2.Semantic Analyser:将parse tree变成一个内部的查询表示(依然是基于查询块,而不是operator tree)。同时在这一步也会做语法检查,类型检查和类型隐式转换

                      3.Logical Plan Generator:将内部的查询表示转变成一个逻辑计划(包含一个operator tree),一些operator是关系代数的filter,join等,另一些是hive特定的,用于将逻辑计划变成一系列的map/reduce job,比如reduceSink operator(出现在map-reduce边界);这一步Optimizer也会对查询进行优化,比如map端聚合等

                      4.Query Plan Genertor:将逻辑计划转换成一系列的map-reduce tasks.做法是,通过对operator tree递归遍历,然后拆分成一系列的map/reduce task,然后提交到hadoop进行执行

METASTORE

              元数据存储,存储数仓中的DATABASE,TABLE,PARTITION,COLUMN,SERIALIZERS和DESERIALIZERS

             目的:提供数据抽象和数据发现,如果数据抽象,每次查询的时候,用户都需要提供数据格式,extractors和loaders。metasore的数据在表创建或重建都会更新,类似于传统数据仓库(这些信息存在于配置的数据库中,一般是mysql)

EXECUTION ENGINE

              DRIVER将执行计划发给ENGINE,然后ENGINE与底层交互获取结果后,返回给DRIVER。DRIVER再将数据发送给客户端

              这一个ENGINE设计的挺好的,以前是MAPREDUCE,现在可以是TEZ,spark,以后是否在出现新的框架,谁又说得准?!

 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

HIVE架构

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

HIVE架构

UI:     用于提交查询的客户端,hive自带有CLI(command line),现在推荐使用beelineDRIVER:               1.用于接收客户端提交的SQL,并实现了session控制                2.并提供了
HIVE架构
2016-06-18

hive架构由哪几部分组成

这篇文章主要为大家展示了“hive架构由哪几部分组成”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“hive架构由哪几部分组成”这篇文章吧。主要分为以下几个部分: 用户接口,包括 命令行CLI,C
2023-06-03

hive架构及知识体系的示例分析

这篇文章主要介绍了hive架构及知识体系的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。1、Hive架构与基本组成Hive的体系结构可以分为以下几部分: (1)
2023-06-02

Hive架构设计及原理的示例分析

这篇文章给大家分享的是有关Hive架构设计及原理的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。Hive架构设计及原理1.什么是Hive:Hive是构建在Hadoop之上的数据仓库平台,可以结构化的数据文
2023-06-03

数据库之Hive概论和架构和基本操作

目录Hive概论Hive架构 Hive安全和启动Hive数据库操作Hive内部表操作-数据添加Hive内部表特点Hive外部表操作Hive表操作-分区表Hive概论Hive是一个构建在Hadoop上的数据仓库框架,最初,Hive是由Fac
2023-04-07

数据库之Hive概论和架构和基本操作是什么

今天小编给大家分享一下数据库之Hive概论和架构和基本操作是什么的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。Hive概论H
2023-04-14

详解hive常见表结构

目录hive简介1.外部表2.内部表3.分区表1.静态分区2.动态分区4.分桶表1.抽样2.map-side join5.表的文件存储格式1.TEXTFILE2.SEQUENCEFILE3.RCFILE4.ORC5.Parquet6.总结5
2022-08-11

Hive的架构设计考虑了哪些容错机制和故障恢复策略

Hive的架构设计考虑了以下容错机制和故障恢复策略:数据冗余:Hive使用Hadoop分布式文件系统(HDFS)存储数据,HDFS会自动将数据进行冗余存储,确保数据不会因单个节点的故障而丢失。备份和恢复:Hive支持数据备份和恢复功能,可以
Hive的架构设计考虑了哪些容错机制和故障恢复策略
2024-03-11

服务架构:分层架构

分层是一种职责分离和依赖管理的方式:每层都有自己特定的职能;高层的服务可以调用低层的服务,但是反过来不行。

服务架构:微服务架构

微服务架构是由很多小而自治的微服务组合而成,每个服务都提供一套独立自洽的业务能力。微服务的定义比较直白,但只有理解它的设计理念和原则,才能真正用好它。
微服务架构2024-11-30

服务架构:大数据架构

大数据,可以简单理解为传统数据库无法处理的数据量,比如主从模式的MySQL在简单场景下可以存储和处理上亿条数据,但涉及到分析场景,能处理的数据量可能远远小于1亿。利用大数据架构,可以轻松处理上亿到千亿数据的分析需求。

X86架构与Arm架构区别

近年来,ARM架构的的兴起下,许多巨头纷纷开始自研ARM架构的服务器芯片,包括国外的亚马逊、谷歌甚至微软,国内的腾讯、华为等等都积极参与其中。
架构芯片2024-11-30

c/s架构和b/s架构

C/S架构和B/S架构是两种常见的网络应用架构。C/S指的是客户端/服务器架构,而B/S指的是浏览器/服务器架构,两者都是为了实现交互式的网络应用程序,但在结构和工作方式上有所不同。C/S架构适用于需要更高性能、更好用户体验和离线工作模式的
2023-07-31

服务架构:Web-Queue-Worker架构

Web前端和wWorker服务都是无状态的。作业的会话状态通常存储在分布式存储里(比如Redis集群)。worker通过异步的方式处理耗时的作业,我们通常使用消息队列来触发作业的创建和执行,或者通过一个定时任务调度批处理任务。worker并

mysql 架构类问题之 MMM 架构

MMM 和 MHA 架构MMM 和 MHA 架构的作用对主从复制集群的 master 进行监控当 master 宕机后把写 VIP 迁移到新 master重新配置集群中其他 slave 对新的 master 同步MMM 架构适用的主从复制架构 主 -- 主
mysql 架构类问题之 MMM 架构
2014-12-31

服务架构:事件驱动架构

事件通常来源于外部系统,比如IoT中的物理设备、互联网用户的端上。我们在设计时,必须认真评估总体的数据量和吞吐量,以保证系统能支撑这个量级。

mysql架构类问题之MHA架构

MHA 架构适用的主从复制架构 主 / | 从1 从2 从3故障转移步骤选举具有最新更新的slave尝试从宕机的master保存二进制日志应用差异的中继日志到其他slave应用从master保存的二进制日志提升选举的slave为新的master配置其他slav
mysql架构类问题之MHA架构
2015-04-12

DDD 必备架构--六边形架构

负责将应用程序输出结果转换为外部系统能够理解的格式,通常包括数据库、RPC调用、缓存、搜索、消息队列、文件系统等,是将内部响应转换为外部响应的桥梁。
架构系统RPC2024-11-30

软件架构模式—分层架构

尽管可以对特定层进行更改,但这并不容易,因为应用程序是一个单一的单元。而且,层之间的耦合关系往往会增加难度。这也使得扩展变得困难。

一文看懂Java微服务架构,WEB2.0,垂直架构,分布式架构,微服务架构

在基于单体架构的设计中,无法满足WEB2.0对项目的需求,需要在单体架构上搭建集群(多个服务器),可以提升项目的稳定性,并且并发量增加,也可以承受住。

编程热搜

目录