?
一、目標(biāo):學(xué)習(xí)數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的基本理論、方法,學(xué)習(xí)Spark大數(shù)據(jù)平臺有關(guān)使用及MLLib編程應(yīng)用,學(xué)習(xí)大數(shù)據(jù)語言Scala的基礎(chǔ)應(yīng)用,通過若干案例介紹Scala語言在Spark平臺上的應(yīng)用。
通過課程學(xué)習(xí)能讓學(xué)員具備在Spark平臺上進(jìn)行大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)編程的基本技能。
二、主要內(nèi)容:
數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)基本理論:
1、概述
2、數(shù)據(jù)預(yù)處理:數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約
3、數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)算法:分類與預(yù)測、聚類分析、關(guān)聯(lián)規(guī)則、智能推薦、回歸分析
Scala語言編程:
1、Scala簡介
2、類和對象
3、基本類型和操作
4、函數(shù)式對象
5、內(nèi)建控制結(jié)構(gòu)
6、函數(shù)和閉包
7、特質(zhì)
8、樣本類和模式匹配
9、集合類型
10、隱式轉(zhuǎn)換
Spark大數(shù)據(jù)平臺及MLlib
1、Spark概述
2、Spark內(nèi)核RDD
3、Spark資源調(diào)度
4、Spark工作流程
5、Spark編程接口
6、Spark?Machine Learning