
曙海教學(xué)優(yōu)勢
本課程,秉承二十一年積累的教學(xué)品質(zhì),以項目實現(xiàn)為導(dǎo)向,面向企事業(yè)項目實際需要,老師將會與您分享設(shè)計的全流程以及工具的綜合使用經(jīng)驗、技巧。課程可定制,線上/線下/上門皆可,熱線:4008699035。
  曙海培訓(xùn)的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。大批企業(yè)和曙海
     建立了良好的合作關(guān)系,20多年來,合作企事業(yè)單位以達30多萬。曙海培訓(xùn)的課程在業(yè)內(nèi)有著響亮的知名度。
?Spark培訓(xùn)——提高云計算大數(shù)據(jù)速度培訓(xùn)課程
培訓(xùn)內(nèi)容:
第一部分:
1、Spark的架構(gòu)設(shè)計
1.1?Spark的速度為什么如此的快?
1.2?Spark的架構(gòu)設(shè)計剖析
1.3?RDD計算流程解析
1.4?Spark的出色容錯機制
2、實戰(zhàn)使用三種語言開發(fā)Spark
2.1?Scala簡介、為什么Spark會使用Scala作為開發(fā)語言?
2.2?在Spark中使用Scala
2.3?使用Java開發(fā)Spark程序
2.4?使用Python開發(fā)Spark程序
2.5?深入使用Spark?Shell
3、快速掌握Scala
3.1?Scala變量聲明、操作符、函數(shù)的使用實戰(zhàn)
3.2?apply方法
3.3?Scal的控制結(jié)構(gòu)和函數(shù)
3.4?Scala數(shù)組的操作、Map的操作
3.5?Scala中的類
3.6?Scala中對象的使用;
3.7?Scala中的繼承
3.8?Scala中的特質(zhì)
3.9?Scala中集合操作
4、Spark集群的安裝和設(shè)置
4.1?在一臺機器上運行Spark
4.2?在EC2上運行Spark
4.3?在Mesos上部署Spark
4.4?在YARN上部署Spark
4.5?通過SSH在眾多機器上部署Spark
4.6?Spark集群設(shè)置
5、編寫Spark程序
5.1?程序數(shù)據(jù)的來源:File、HDFS、HBase、S3等
5.2?IDE環(huán)境構(gòu)建
5.3?Maven
5.4?sbt.
5.5?編寫并部署Spark程序的實例 
第二部分
6、SparkContext解析和數(shù)據(jù)加載以及存儲
6.1?源碼剖析SparkContext
6.2?Scala、Java、Python使用SparkContext
6.4?加載數(shù)據(jù)成為RDD
6.5?把數(shù)據(jù)物化
7、深入實戰(zhàn)RDD
7.1?DAG
7.2?深入實戰(zhàn)各種Scala?RDD?Function?
7.3?Spark?Java?RDD?Function
7.4?RDD的優(yōu)化問題
8、Shark的原理和使用
8.1?Shark與Hive
8.2?安裝和配置Shark
8.3?使用Shark處理數(shù)據(jù)
8.4?在Spark程序中使用Shark?Queries
8.5?SharkServer
8.6?思考Shark架構(gòu)
9、Spark程序的測試
9.1?編寫可測試的Spark程序
9.2?Spark測試框架解析
9.3?Spark測試代碼實戰(zhàn)
10、Spark的優(yōu)化
10.1?Logs
10.2?并發(fā)
10.3?內(nèi)存
10.4?垃圾回收
10.5?序列化
10.6?安全
第三部分
11、Spark的機器學(xué)習(xí)
11.1?LinearRegression
11.2?K-Means
11.3?Collaborative?Filtering
12、Spark的圖計算GraphX
12.1?Table?Operators
12.2?Graph?Operators
12.3?GraphX
13、Spark?SQL
13.1?Parquet支持
13.2?DSL
13.3?SQL?on?RDD
14、Spark實時流處理
14.1?DStream
14.2?transformation
14.3?checkpoint
14.4?性能優(yōu)化