
曙海教學(xué)優(yōu)勢(shì)
本課程,秉承二十一年積累的教學(xué)品質(zhì),以項(xiàng)目實(shí)現(xiàn)為導(dǎo)向,面向企事業(yè)項(xiàng)目實(shí)際需要,老師將會(huì)與您分享設(shè)計(jì)的全流程以及工具的綜合使用經(jīng)驗(yàn)、技巧。課程可定制,線上/線下/上門皆可,熱線:4008699035。
  曙海培訓(xùn)的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。大批企業(yè)和曙海
     建立了良好的合作關(guān)系,20多年來(lái),合作企事業(yè)單位以達(dá)30多萬(wàn)。曙海培訓(xùn)的課程在業(yè)內(nèi)有著響亮的知名度。
?課程目標(biāo):
1)知道Spark能做什么,不能做什么。
2)hadoop和Spark的適用場(chǎng)景。
3)能過(guò)熟知Spark的原理、安裝Spark集群。
4)能夠獨(dú)立使用Spark工具來(lái)分析海量數(shù)據(jù)。
5)會(huì)使用shark來(lái)分析數(shù)據(jù)。
6)會(huì)使用Spark  Streaming來(lái)處理數(shù)據(jù)。
7)一個(gè)需求過(guò)來(lái)知道在Spark上面怎么實(shí)現(xiàn)。
培訓(xùn)內(nèi)容:
| 
 ·?Scala語(yǔ)言介紹 ·?Scala語(yǔ)言安裝 ·?Scala快速入門介紹 ·?什么Spark ·?Spark的簡(jiǎn)介 ·?Spark的編譯 ·?Spark的安裝 Spark安裝成功測(cè)試  | 
| 
 ·?Spark原理 ·?Spark的RDD ·?什么是RDD ·?RDD的種類? o?Tranformation o?Action ·?Spark的存儲(chǔ)級(jí)別 ·?Cache介紹 ·?Spark的容錯(cuò)原理 ·?Lineage容錯(cuò) ·?Checkpoint容錯(cuò) ·?RDD的創(chuàng)建 ·?案例? 統(tǒng)計(jì)單詞的個(gè)數(shù)  | 
| 
 ·?Spark調(diào)度組件 ·?RDD?graph ·?作業(yè)與任務(wù)調(diào)度 ·?DAG?Scheduler ·?Task?Scheduler ·?Task細(xì)節(jié) ·?Job的調(diào)度流程 ·?Broadcast?variables介紹 ·?Spark的優(yōu)化 ·?Spark的生態(tài)系統(tǒng)? o?Shark o?Streaming ·?Spark與hadoop的比較 Spark的使用場(chǎng)景介紹  | 
| 
 ·?Spark實(shí)戰(zhàn)一:求最大值 ·?Spark實(shí)戰(zhàn)二:自定義RDD(define?a?new?RDD) ·?Spark實(shí)戰(zhàn)三:RDD創(chuàng)建的種類(Scala、HDFS、localdisk?and?inputformat) Spark實(shí)戰(zhàn)四:基于Spark的日志分析  | 
?
?