
曙海教學(xué)優(yōu)勢
課程可定制,線上/線下/上門皆可,報(bào)名熱線:4008699035。本課程以項(xiàng)目實(shí)戰(zhàn)案例實(shí)現(xiàn)為主線,面向企事業(yè)單位項(xiàng)目開發(fā)實(shí)際,秉承21年積累的教學(xué)和研發(fā)經(jīng)驗(yàn),培訓(xùn)講師將會(huì)與您分享設(shè)計(jì)的全流程以及工具的綜合使用經(jīng)驗(yàn)以及技巧。
我們的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。曙海培訓(xùn)的課程在業(yè)內(nèi)有廣泛的美譽(yù)度。大批企業(yè)和曙海
建立了良好的合作關(guān)系,20多年來,合作企事業(yè)單位以達(dá)30多萬。
?
Spark已經(jīng)被不少互聯(lián)網(wǎng)公司采用,大部分?jǐn)?shù)據(jù)挖掘算法和迭代式算法在逐步MapReduce平臺(tái)遷移到Spark平臺(tái)中,包括阿里巴巴(廣告系統(tǒng)),騰訊(廣點(diǎn)通精準(zhǔn)推薦),百度,優(yōu)酷土豆,360,支付寶等互聯(lián)網(wǎng)公司已經(jīng)在線上產(chǎn)品中使用spark,且取得了令人滿意的效果,另外,部分省份的運(yùn)營商也正在嘗試使用spark解決數(shù)據(jù)挖掘和分析問題,部分銀行,如工商銀行,也正在嘗試spark平臺(tái)。
本課程將為大家全面而又深入的介紹Spark平臺(tái)的構(gòu)建流程,涉及Spark系統(tǒng)基礎(chǔ)知識(shí),概念及架構(gòu), Spark實(shí)戰(zhàn)技巧,Spark經(jīng)典案例等。
通過本課程實(shí)踐,幫助學(xué)員對(duì)Spark生態(tài)系統(tǒng)有一個(gè)清晰明了的認(rèn)識(shí);理解Spark系統(tǒng)適用的場景;掌握Spark等初中級(jí)應(yīng)用開發(fā)技能;搭建穩(wěn)定可靠的Spark集群,滿足生產(chǎn)環(huán)境的標(biāo)準(zhǔn);了解和清楚大數(shù)據(jù)應(yīng)用的幾個(gè)行業(yè)中的經(jīng)典案例,包括阿里巴巴,騰訊,百度等互聯(lián)網(wǎng)行業(yè),中國移動(dòng)和聯(lián)通等運(yùn)營商。
各類 IT/軟件企業(yè)和研發(fā)機(jī)構(gòu)的軟件架構(gòu)師、軟件設(shè)計(jì)師、程序員。對(duì)于懷有設(shè)計(jì)疑問和問題,需要梳理解答的團(tuán)隊(duì)和個(gè)人,效果最佳。
1) 了解Java語言(Scala語言會(huì)作為課程內(nèi)容進(jìn)行介紹);?
2) 了解Linux系統(tǒng);
?
| 主題 | 內(nèi)容 |
|
Spark大數(shù)據(jù)架構(gòu)概述及案例簡介 |
1. 1介紹Spark大數(shù)據(jù)層級(jí)架構(gòu)及各層軟件設(shè)計(jì)要求,包括數(shù)據(jù)收集,大數(shù)據(jù)存儲(chǔ),大數(shù)據(jù)計(jì)算框架,大數(shù)據(jù)應(yīng)用等 |
|
Spark產(chǎn)生動(dòng)機(jī)與基本概念 |
2.1 Spark產(chǎn)生背景,與MapReduce對(duì)比,其優(yōu)缺點(diǎn)是什么 |
|
Spark安裝部署 |
3.1 Spark運(yùn)行模式簡介、standlone模式、Spark on yarn模式 |
|
Spark程序設(shè)計(jì)實(shí)例 |
4.1 Scala語言基礎(chǔ),常用語法以及庫函數(shù) |
|
Spark內(nèi)部原理 |
5.1 Spark程序運(yùn)行流程概述 |
|
Spark與外部系統(tǒng)整合 |
6.1 Spark與Kafka和flume結(jié)合 |
|
Spark調(diào)優(yōu)方法 |
Spark調(diào)優(yōu)思想、方法 |
|
Spark案例分析 |
基于Spark的商品推薦系統(tǒng),包括:項(xiàng)目背景、項(xiàng)目架構(gòu)、項(xiàng)目實(shí)施 |
|
Spark Streaming應(yīng)用及案例分析 |
8.1 Spark Streaming產(chǎn)生動(dòng)機(jī) |
|
Spark SQL |
9.1 Spark SQL定位 |
|
MLlib |
10. 介紹Spark的數(shù)據(jù)挖掘庫MLlib,重點(diǎn)介紹其內(nèi)部的幾個(gè)分類算法,聚類算法和推薦算法,包括邏輯回歸,K-Means,協(xié)同過濾等 |
|
GraphX |
11. 介紹Spark內(nèi)部的圖計(jì)算框架GraphX,重點(diǎn)介紹它的基本原理及使用方法 |