
曙海教學(xué)優(yōu)勢
課程可定制,線上/線下/上門皆可,報名熱線:4008699035。本課程以項目實戰(zhàn)案例實現(xiàn)為主線,面向企事業(yè)單位項目開發(fā)實際,秉承21年積累的教學(xué)和研發(fā)經(jīng)驗,培訓(xùn)講師將會與您分享設(shè)計的全流程以及工具的綜合使用經(jīng)驗以及技巧。
我們的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。曙海培訓(xùn)的課程在業(yè)內(nèi)有廣泛的美譽度。大批企業(yè)和曙海
建立了良好的合作關(guān)系,20多年來,合作企事業(yè)單位以達30多萬。
主要內(nèi)容:
1.Spark在Ubuntu虛擬機上的分布式集群環(huán)境搭建
2.基于Python的Spark編程基礎(chǔ)
3.Spark MLlib的使用(.py文件):回歸預(yù)測、聚類、關(guān)聯(lián)規(guī)則、神經(jīng)網(wǎng)絡(luò)預(yù)測
4.Spark在阿里云的使用(.py文件)
5.Spark在AWS亞馬遜云的使用
6.預(yù)測算法介紹
課程大綱:
1.Spark入門及生態(tài)體系
概述
Spark生態(tài)
Spark(內(nèi)存計算框架)
SparkSteaming(流式計算框架)
Spark SQL(ad-hoc)
Mllib(Machine Learning)
GraphX(bagel將被取代)
彈性分布式數(shù)據(jù)集(RDD)
2.Python Spark基礎(chǔ)介紹
Spark 編程模型
RDD緩存策略
Spark Python編程入門
PySpark
惰性計算(Lazy Evaluation)
流水線(Pipelines)
3.分布式集群搭建
Spark-1.6.1、Hadoop-2.6.4、VMware Ubuntu分布式集群搭建全過程
Ubuntu基本環(huán)境配置
集群安裝準(zhǔn)備
安裝配置Hadoop
安裝配置Spark
4.基于Python的Spark編程實戰(zhàn)
概述
連接Spark
初始化Spark
使用命令行
彈性分布式數(shù)據(jù)集(RDD)
RDD操作
RDD持久化
在集群上部署
用Python編寫的一個簡單Spark應(yīng)用
5.Spark MLlib的使用
機器學(xué)習(xí)概念
Spark MLlib介紹
Spark MLlib架構(gòu)解析
MLlib的算法庫分析
用Spark Python構(gòu)建分類模型
使用 Spark MLlib 做 K-means 聚類分析
6.Spark在阿里云的使用
阿里云服務(wù)介紹
阿里云搭建Spark集群過程
計算π值和Kmeans實驗
7.spark在AWS亞馬遜云的使用
亞馬遜AWS云服務(wù)的內(nèi)容
亞馬遜的EMR中提供的3種主要組件
Spark on Amazon EMR架構(gòu)解析
應(yīng)用案例:構(gòu)建1000個節(jié)點的Spark集群
Spark應(yīng)用
8.預(yù)測算法介紹
用Spark Python構(gòu)建回歸模型
9.案例介紹
使用 Spark 模塊解析