
曙海教學(xué)優(yōu)勢(shì)
本課程面向企事業(yè)項(xiàng)目實(shí)際需要,秉承二十一年積累的教學(xué)品質(zhì),Spark培訓(xùn)――提高云計(jì)算大數(shù)據(jù)速度-以項(xiàng)目實(shí)現(xiàn)為導(dǎo)向,老師將會(huì)與您分享設(shè)計(jì)的全流程以及工具的綜合使用經(jīng)驗(yàn)、技巧。線上/線下/上門皆可,Spark培訓(xùn)――提高云計(jì)算大數(shù)據(jù)速度-專家,課程可定制,熱線:4008699035。
  曙海的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。曙海的課程在業(yè)內(nèi)有著響亮的知名度。大批企業(yè)和曙海
     建立了良好的合作關(guān)系,20多年來,合作企事業(yè)單位以達(dá)30多萬。
?Spark培訓(xùn)——提高云計(jì)算大數(shù)據(jù)速度
培訓(xùn)內(nèi)容:
第一部分:
1、Spark的架構(gòu)設(shè)計(jì)
1.1?Spark的速度為什么如此的快?
1.2?Spark的架構(gòu)設(shè)計(jì)剖析
1.3?RDD計(jì)算流程解析
1.4?Spark的出色容錯(cuò)機(jī)制
2、實(shí)戰(zhàn)使用三種語言開發(fā)Spark
2.1?Scala簡(jiǎn)介、為什么Spark會(huì)使用Scala作為開發(fā)語言?
2.2?在Spark中使用Scala
2.3?使用Java開發(fā)Spark程序
2.4?使用Python開發(fā)Spark程序
2.5?深入使用Spark?Shell
3、快速掌握Scala
3.1?Scala變量聲明、操作符、函數(shù)的使用實(shí)戰(zhàn)
3.2?apply方法
3.3?Scal的控制結(jié)構(gòu)和函數(shù)
3.4?Scala數(shù)組的操作、Map的操作
3.5?Scala中的類
3.6?Scala中對(duì)象的使用;
3.7?Scala中的繼承
3.8?Scala中的特質(zhì)
3.9?Scala中集合操作
4、Spark集群的安裝和設(shè)置
4.1?在一臺(tái)機(jī)器上運(yùn)行Spark
4.2?在EC2上運(yùn)行Spark
4.3?在Mesos上部署Spark
4.4?在YARN上部署Spark
4.5?通過SSH在眾多機(jī)器上部署Spark
4.6?Spark集群設(shè)置
5、編寫Spark程序
5.1?程序數(shù)據(jù)的來源:File、HDFS、HBase、S3等
5.2?IDE環(huán)境構(gòu)建
5.3?Maven
5.4?sbt.
5.5?編寫并部署Spark程序的實(shí)例 
第二部分
6、SparkContext解析和數(shù)據(jù)加載以及存儲(chǔ)
6.1?源碼剖析SparkContext
6.2?Scala、Java、Python使用SparkContext
6.4?加載數(shù)據(jù)成為RDD
6.5?把數(shù)據(jù)物化
7、深入實(shí)戰(zhàn)RDD
7.1?DAG
7.2?深入實(shí)戰(zhàn)各種Scala?RDD?Function?
7.3?Spark?Java?RDD?Function
7.4?RDD的優(yōu)化問題
8、Shark的原理和使用
8.1?Shark與Hive
8.2?安裝和配置Shark
8.3?使用Shark處理數(shù)據(jù)
8.4?在Spark程序中使用Shark?Queries
8.5?SharkServer
8.6?思考Shark架構(gòu)
9、Spark程序的測(cè)試
9.1?編寫可測(cè)試的Spark程序
9.2?Spark測(cè)試框架解析
9.3?Spark測(cè)試代碼實(shí)戰(zhàn)
10、Spark的優(yōu)化
10.1?Logs
10.2?并發(fā)
10.3?內(nèi)存
10.4?垃圾回收
10.5?序列化
10.6?安全
第三部分
11、Spark的機(jī)器學(xué)習(xí)
11.1?LinearRegression
11.2?K-Means
11.3?Collaborative?Filtering
12、Spark的圖計(jì)算GraphX
12.1?Table?Operators
12.2?Graph?Operators
12.3?GraphX
13、Spark?SQL
13.1?Parquet支持
13.2?DSL
13.3?SQL?on?RDD
14、Spark實(shí)時(shí)流處理
14.1?DStream
14.2?transformation
14.3?checkpoint
14.4?性能優(yōu)化