大數(shù)據(jù)分析及可視化培訓(xùn)課程
?
培訓(xùn)對象:
1.?大數(shù)據(jù)分析及可視化應(yīng)用開發(fā)工程師
2.大數(shù)據(jù)分析項目的規(guī)劃咨詢管理人員
3.大數(shù)據(jù)分析項目的IT項目高管人員
4.大數(shù)據(jù)分析項目的售前和售后技術(shù)支持服務(wù)人員
培訓(xùn)大綱:
?
| 
 知識模塊 
 | 
 授課內(nèi)容 
 | 
| 
 數(shù)據(jù)處理及復(fù)雜數(shù)據(jù)可視化(一) 
 | 
 第一講 大數(shù)據(jù)挖掘及可視化介紹 
? 數(shù)據(jù)挖掘及可視化背景 
? 數(shù)據(jù)挖掘流程 
? 常用挖掘工具介紹 
? R語言的優(yōu)勢 
? R數(shù)據(jù)挖掘可視化工具-Rattle快速上手 
? R語言對復(fù)雜數(shù)據(jù)可視化的優(yōu)勢 
? R語言快速入門 
? 利用caret包做數(shù)據(jù)抽樣及虛擬化處理 
 | 
| 
 數(shù)據(jù)處理及復(fù)雜數(shù)據(jù)可視化(二) 
 | 
 第二講 數(shù)據(jù)質(zhì)量分析及高級可視化 
? 缺失值處理的高級方法 
? 異常值甄別的高級方法 
? 數(shù)據(jù)可視化進(jìn)階:lattice及ggplot2包介紹 
? 數(shù)據(jù)交互可視化:rCharts、recharts、networkD3、plotly等包介紹 
 | 
| 
 數(shù)據(jù)挖掘模型實戰(zhàn)(一) 
 | 
 第三講 聚類分析及R語言實現(xiàn) 
聚類分析是一種原理簡單、應(yīng)用廣泛的數(shù)據(jù)挖掘技術(shù)。顧名思義,聚類分析即是把若干事物按照某種標(biāo)準(zhǔn)歸為幾個類別,其中較為相近的聚為一類,不那么相近的聚于不同類。 
? 案例一:對著名的鳶尾花數(shù)據(jù)進(jìn)行K均值聚類分析 
? 案例二:對汽車數(shù)據(jù)進(jìn)行K均值聚類分析 
? 案例三:對洛杉磯街區(qū)數(shù)據(jù)進(jìn)行層次聚類 
? 案例四:對汽車數(shù)據(jù)進(jìn)行層次聚類 
第四講 關(guān)聯(lián)規(guī)則及R語言實現(xiàn) 
關(guān)聯(lián)規(guī)則(著名的“啤酒和尿布”)是數(shù)據(jù)挖掘的基礎(chǔ)和核心技術(shù)之一,本講將著重圍繞經(jīng)典的Apriori算法,闡明關(guān)聯(lián)規(guī)則的支持、置信和提升程度與控制,使用R語言快速完成關(guān)聯(lián)規(guī)則分析,并通過arulesViz擴展包對關(guān)聯(lián)規(guī)則進(jìn)行可視化展示。 
案例:利用超市購物籃Groceries數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析 
 | 
| 
 數(shù)據(jù)挖掘模型實戰(zhàn)(二) 
 | 
 第五講 KNN近鄰算法及R語言實現(xiàn) 
KNN(k-Nearest Neighbor)分類算法是數(shù)據(jù)挖掘分類技術(shù)中較簡單的方法之一。所謂k最近鄰,就是k個最近的鄰居的意思,說的是每個樣本都可以用它最接近的k個鄰居來代表。 
? 案例一:對鳶尾花數(shù)據(jù)集進(jìn)行knn分類 
? 案例二:對乳腺癌數(shù)據(jù)進(jìn)行knn分類 
? 案例三:對文本數(shù)據(jù)進(jìn)行knn分類 
第六講 決策樹分類及R語言實現(xiàn) 
決策樹是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。本講主要講授兩種最為普遍的決策樹算法:CART和C5.0算法,使用rpart和C50函數(shù)進(jìn)行R語言分析。 
? 案例一:對鳶尾花數(shù)據(jù)集運用C50算法分類 
? 案例二:對鳶尾花數(shù)據(jù)集運用CART算法進(jìn)行分類 
? 案例三:對汽車數(shù)據(jù)運用CART對汽車重量進(jìn)行預(yù)測 
 | 
| 
 行業(yè)應(yīng)用案例分享(一) 
 | 
 第七講 深度挖掘用戶付費行為及社會網(wǎng)絡(luò)分析 
? 對用戶的購買行為進(jìn)行購物籃分析 
? 智能推薦系統(tǒng)常用算法介紹 
? 對用戶購物行為構(gòu)建智能推薦系統(tǒng) 
? 社會網(wǎng)絡(luò)圖基本知識 
? 利用R語言繪制社會網(wǎng)絡(luò)圖 
? 利用Gephi繪制社會網(wǎng)絡(luò)圖 
? 對用戶購物行為進(jìn)行聚類分析,發(fā)現(xiàn)社群 
 | 
| 
 行業(yè)應(yīng)用案例分享(二) 
 | 
 第八講 客戶價值分析 
? 背景與挖掘目標(biāo) 
? 分析方法及過程 
? 數(shù)據(jù)探索分析 
? 數(shù)據(jù)預(yù)處理 
? 模型構(gòu)建 
? 模型應(yīng)用 
 | 
| 
 ? 
 | 
 第九講 漏斗模型及路徑分析 
? 漏斗模型的主要應(yīng)用場景 
? 路徑分析的主要應(yīng)用場景 
? 漏斗模型與路徑分析的不同點 
? sunburst事件路徑圖的繪制方法 
? 利用基于時序的關(guān)聯(lián)規(guī)則對點擊事件進(jìn)行分析 
 | 
?
?