大数据技术课程

课程介绍
本课程从基础开始,紧抓重点、言简意赅、深入浅出的讲解Spark 2.0,旨在学员能快速上手并灵活掌握;
课程以实操为主,提供完整详细的源码,供学员学习或应用到项目中。课程的课件也很详细,在学员不方便看视频的时候直接看课件并结合源码,同样可以达到很好的学习效果,并能大幅节省学习时间;
课程中编程语言采用当前较有前景的Scala,Hadoop采用Cloudera Hadoop的5.7.1版本,Kafka的0.10版本;
课程中对RDD操作、SQL、Streaming开发有非常深入系统的讲解,且围绕企业需求场景逐级展开和深化。

课程大纲
Scala编程语言使用;
Akka介绍;
Spark生态圈介绍;
Spark分布式计算框架;
SQL On Spark;
Spark流数据处理工具Streaming;
Spark中的大数据挖掘工具Mllib;
Spark日常运维;
Spark在业界的应用案例。

课程目标

全面了解大数据实时处理技术的相关知识;
学习Spark的核心技术方法以及应用特征;
深入使用Spark在大数据处理中的使用;
掌握BDAS相关工具及其主要功能;
学会简单的scala编程;
掌握准实时的处理技术;
掌握Spark的图像处理的技术原理;
了解Spark在业界的应用;
深入了解Spark的算法库。

课程对象
系统架构师、系统分析师、高级程序员、资深开发人员;
涉及大数据实时处理的数据中心运行、规划、设计负责人。