121人加入学习
(0人评价)
Hadoop生态圈
价格 免费
课程介绍

本课程是整套大数据课程的基石:其一,分布式文件系统HDFS用于存储海量数据,无论是Hive、HBase或者Spark数据存储在其上面;其二是分布式资源管理框架。
YARN,是Hadoop 云操作系统(也称数据系统),管理集群资源和分布式数据处理框架MapReduce、Spark应用的资源调度与监控;

分布式并行计算框架MapReduce目前是海量数据并行处理的一个最常用的框架。Hadoop 2.x的编译、环境搭建、HDFS Shell使用,YARN 集群资源管理与任务监控,MapReduce编程,分布式集群的部署管理(包括高可用性HA)必须要掌握的。

大数据课程技术要点:Hadoop起源与安装、HDFS分布式文件系统、Hadoop文件I/O详解、MapReduce工作原理、MapReduce编程开发、Hive数据仓库工具、Hive深入解读、Sqoop与Oozie、Zookeeper详解、开源数据库HBase。

授课教师

前端课程讲师

学员动态

李萌萌 加入学习
张烨 加入学习
孙Pp 加入学习
黄清廉 加入学习
季晨明 加入学习