Hadoop生态圈

默认教学计划
49人加入学习
(0人评价)
价格 免费
教学计划
承诺服务
课程介绍

本课程是整套大数据课程的基石:其一,分布式文件系统HDFS用于存储海量数据,无论是Hive、HBase或者Spark数据存储在其上面;其二是分布式资源管理框架。
YARN,是Hadoop 云操作系统(也称数据系统),管理集群资源和分布式数据处理框架MapReduce、Spark应用的资源调度与监控;

分布式并行计算框架MapReduce目前是海量数据并行处理的一个最常用的框架。Hadoop 2.x的编译、环境搭建、HDFS Shell使用,YARN 集群资源管理与任务监控,MapReduce编程,分布式集群的部署管理(包括高可用性HA)必须要掌握的。

大数据课程技术要点:Hadoop起源与安装、HDFS分布式文件系统、Hadoop文件I/O详解、MapReduce工作原理、MapReduce编程开发、Hive数据仓库工具、Hive深入解读、Sqoop与Oozie、Zookeeper详解、开源数据库HBase。

课程目标
  • 掌握HDFS原理、操作和应用开发,掌握分布式运算、Hive数据仓库原理及应用
适合人群
  • 0基础,IT小白

授课教师

前端课程讲师

学员动态

伤心童话 加入学习
黄馨卉 加入学习
王炜 加入学习
秦姝祺 加入学习
景玉秀 加入学习