
曙海教學優(yōu)勢
課程可定制,線上/線下/上門皆可,報名熱線:4008699035。本課程以項目實戰(zhàn)案例實現(xiàn)為主線,面向企事業(yè)單位項目開發(fā)實際,秉承21年積累的教學和研發(fā)經(jīng)驗,培訓講師將會與您分享設計的全流程以及工具的綜合使用經(jīng)驗以及技巧。
  我們的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。曙海培訓的課程在業(yè)內(nèi)有廣泛的美譽度。大批企業(yè)和曙海
     建立了良好的合作關系,20多年來,合作企事業(yè)單位以達30多萬。
Spark及其在機器學習中的應用
?
課程目標:
?
通過該課程的學習,學員應能夠熟練掌握 Spark 并能利用 Spark 解決機器學習的相關問題;?具體的,學員將了解: 1.Spark在Ubuntu虛擬機上的分布式集群環(huán)境搭建; 2.基于Python的Spark編程基礎; 3.Spark MLlib的使用(.py文件)包括回歸預測、聚類、關聯(lián)規(guī)則、神經(jīng)網(wǎng)絡預測; 4.Spark在阿里云的使用(.py文件) ; 5.Spark在AWS亞馬遜云的使用。
?
課程大綱:
?
| 
 時間  | 
 主題  | 
 內(nèi)容  | 
|
| 
 第一天 ?  | 
 上午  | 
 ? ? Spark簡介及環(huán)境搭建  | 
 ? l?Spark 簡介 l?Spark 環(huán)境搭建(Ubuntu , 分布式集群).使用的是 Hadoop 2.7.3 和 Spark 2.0.1 版本 ?  | 
| 
 下午  | 
 ? ? ? 基于Python的Spark 編程 ?  | 
 ? l?基于 Python 的 Spark 常用函數(shù)及其使用方法。map/reduce/groupByKey/reduceByKey/filter/ flatMap/saveAsTextFile/join 等 l?基于 Python 的 Spark 編程樣例。通過基本的統(tǒng)計分析和數(shù)據(jù)處理樣例說明該怎樣進行基于 Python 的 Spark 編程 ?  | 
|
| 
 ? ? 第二天 ?  | 
 上午  | 
 ? ? Spark 和機器學習 ?  | 
 ? l?MLLib 全方位介紹 。MLLib 包含的各種算法函數(shù)的介紹。個別算法根據(jù)情況可以講解源代碼 l?MLLib 編程樣例 (回歸預測 , 聚類 , 關聯(lián)規(guī)則, ?神經(jīng)網(wǎng)絡預測等) ?  | 
| 
 下午  | 
 ? 云環(huán)境下的 Spark 以及預測的簡介  | 
 ? l?Spark 在阿里云的使用 l?Spark 在 AWS 亞馬遜云的使用 l?預測方法簡介:包括時間序列預測,機器學習方法進行預測(GBDT, 邏輯回歸等) ?  | 
|
?