O基础、转行人员
希望学习数据挖掘技术、转行进入大数据行业工作的0基础人员
IT行业内转型
拥有一定的IT行业从业经验,希望转型大数据,获得更高职业发展
技术提升人员
工作或个人需求下需要丰富自身技术栈、需要考取华为HCIE认证的人员
天:Hadoop简介与Apache Hadoop完全分布式集群环境搭建-(3课时)
-大数据应用背景介绍;大数据发展趋势及职业发展路线规划;
-Hadoop详解;Hadoop各发行版介绍;生产环境下的Hadoop发行版;
-Hadoop重要组成部分之HDFS与MapReduce介绍;Hadoop重要组成部分之
Yarn调度框架介绍;
实验:
-Hadoop完全分布式集群环境搭建1:虚拟机环境准备;-Hadoop完全分布式集群环境搭建2:环境变量的配置;-Hadoop完全分布式集群环境搭建3∶集群规划方案详解;-Hadoop完全分布式集群环境搭建4:编写集群分发脚本;-Hadoop完全分布式集群环境搭建5:集群的启动方案;-Hadoop完全分布式集群环境搭建6∶集群测试方案;
-Hadoop完全分布式集群环境搭建7:Hadoop历史日志服务器的部署与配置;
第二天:HDFS分布式文件系统①-(3课时)-HDFS重要概念详解;HDFS的Shell命令行客户端详解;
-HDFS API介绍;HDFS读写机制详解;HDFS元数据管理简介;Namenode、
Fsimage及Edits编辑日志;
实验:
-HDFS API:客户端解决文件权限问题;HDFS API:客户端实现文件的上传和下载;
-HDFS API:客户端文件详情及文件类型判断;HDFS API:客户端的IO操作;-HDFS API:客户端读取IO流的seek;
第三天:HDFS分布式文件系统②-(3课时)
-HDFS元数据管理详解:2NN及CheckPoint检查点;HDFS元数据管理详解:
Fsimage及Edits文件解析;
-HDFS元数据管理详解:CheckPoint周期;HDFS的限额、归档以及集群安全模式;
实验:
-日志采集案例需求分析;日志采集案例的调度功能实现;-日志采集案例的上传功能实现;日志采集案例的验证与调优;
第四天:MapReduce分布式计算框架-(3课时)-MapReduce编程思想简介;MapReduce编程规范;
-WordCount案例:编写Mapper类;WordCount案例:编写Reduce类;
WordCount案例:编写Driver类及本地验证;
-WordCount案例:运行于Yarn集群;MapReduce之Writable序列化接口简介;
实验:
-Writable序列化接口案例实现;
第五天:MapReduce分布式计算框架:原理剖析–(3课时)-MapReduce原理剖析:MapTask运行机制详解;MapReduce原理剖析:
MapTask并行度;
-MapReduce原理剖析:切片机制源码解读;MapReduce原理剖析:
ReduceTask工作机制及Shuffle机制;
-Shuffle机制详解:Combiner组件;Shuffle机制详解:全排序;
第六天:Yarn资源调度框架-(3课时)
-Yarn资源调度框架架构原理、工作机制与调度策略;多租户资源隔离配置;-Namenode启动流程;Datanode启动流程;
-Yarn源码剖析:Namenode如何支撑高并发请求;
第七天:Hive分布式数据仓库工具①-(3课时)
-Hive数据仓库工具的诞生背景;Hive数仓与传统关系型数据库的对比;-Hive数仓的架构原理;Hive的参数及其配置与命令行;
-Hive数据类型之基本数据类型及其类型转换;Hive集合数据类型;-Hive文本文件数据编码格式;Hive数据操作:DDL与数据库基本操作;
-Hive数据操作:DDL之建表语法;Hive数据操作:Hive的内部表与外部表;实验:
-Hive环境搭建:安装MySQL元数据库;Hive环境搭建:Hive的安装配置流程;
Hive环境搭建:Hive环境安装的注意事项;
第八天:Hive分布式数据仓库工具②-(3课时)
-Hive数据操作:分区表、分桶表;Hive数据操作∶修改表、删除表;load命令;
insert命令;
-Hive数据操作:数据导出;Hive查询操作:简单查询语句;where子句;group
by子句;
-Hive查询操作:表连接查询;order by子句;sort by子句;Hive函数︰日期函
数、字符串函数、数学函数、条件函数;
-Hive函数:explode用法;窗口函数、window子句;排名函数;Hive的事务操作
机制;Hive元数据管理详解;
同时兼顾“深度+广度”,专注打造“T”型全能人才!
以掌握算法核心为导向,聚焦数据挖掘、机器学习等前沿技术,充分涵盖所需技术方方面面的同时更加追求深度剖析!
“理论基础高于一切”!
没有扎实的基础学习任何实践技术都会困难!誉天新版大数据课程极其看重数据挖掘背后的技术功底,在编程基础和数学基础上大量深耕,确保任何一位O基础学员轻松面向实战进阶!
企业级真实项目驱动理论检验,助力学员快速迈向高薪!
实践是检验真理的唯一标准!誉天新版大数据课程打造“N”个明星级实战项目,用最真实的企业环境提供给学员无限接近实战的技能锻炼!成熟的认证考试辅导体系,快!准!稳!
Time is money!誉天完善且成熟的考前辅导体系,助力考生快速掌握大纲技能要求,“IE大牛”不再是梦想!
卓越的讲师团队,陪伴每一位学员走向成功!
誉天最卓越的IT讲师团队,合作互联网大厂专家顾问团,为誉天学员提供最全面的技术指导与超前的经验分享!
誉天“人才生态”计划助力誉天学员奔向大厂
誉天猎头团队,为誉天学员奉献上最专业的就业指导;依托誉天“人才生态”战略及超万家合作互联网企业,大厂高薪Offer不是梦!