大数据Hadoop之——计算引擎Spark
目录一、概述1)Spark特点2)Spark适用场景二、Spark核心组件三、Spark专业术语详解1)Application:Spark应用程序2)Driver:驱动程序3)Cluster Manager:资源管理器4)Executor:执行器5)Worke
2024-11-16
大数据Hadoop之——数据仓库Hive
目录一、概述二、Hive优点与使用场景1)优点2)使用场景三、Hive架构1)服务端组件1、Driver组件2、Metastore组件3、Thrift服务2)客户端组件1、CLI2、Thrift客户端3、WEBGUI3)Metastore详解四、Hive的工作
2024-11-16
大数据之Spark基础环境
目录前言一、Spark概述(一)Spark是什么(二)Spark的四大特点(三)Spark的风雨十年(四)Spark框架模块(五)Spark通信框架总结前言本篇文章开始介绍Spark基础知识,包括Spark诞生的背景,应用环境以及入门案例
2024-11-16
大数据Hadoop-Spark集群部署知识总结(一)
大数据Hadoop-Spark集群部署知识总结一、启动/关闭 hadoopmyhadoop.sh start/stop分步启动:第一步:在hadoop102主机上sbin/start-dfs.sh第二步:在hadoop103主机上 sbin/start-
2024-11-16
大数据框架中Hadoop和Spark的异同是什么
大数据框架中Hadoop和Spark的异同是什么,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。在大数据框架中Hadoop和Spark可以说是很火的了,这俩个框架都是对数据进行存
2024-11-16
Hadoop ,大数据,云计算之间有什么关系
Hadoop、大数据和云计算之间有着密切的关系。Hadoop是处理大数据的重要工具之一,可以在云计算平台上运行,通过云计算平台提供的计算资源和存储资源来实现大数据处理;云计算提供了大规模的计算和存储资源,可以为大数据提供弹性和可扩展的处理能力,从而实现更好的业务决策、优化效率、提高质量等目标。
2024-11-16
hadoop解析大数据量excel
Hadoop是一个开源的分布式计算框架,可以用于处理大数据量的Excel文件。下面是一种使用Hadoop来解析大数据量Excel的方法:1. 将要解析的Excel文件拆分成多个小文件。这可以通过将大文件按行或按列拆分成多个小文件来实现。每个
2024-11-16
Java大数据开发Hadoop MapReduce
MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)Map负责“分”,即把复杂的任务分解为若干个“简单的任务”来并行处理。可以进行拆分的前提是这些小任务可以并行计算,彼此间几乎没有依赖关系
2024-11-16