
曙海教學(xué)優(yōu)勢(shì)
本課程,秉承二十一年積累的教學(xué)品質(zhì),以項(xiàng)目實(shí)現(xiàn)為導(dǎo)向,面向企事業(yè)項(xiàng)目實(shí)際需要,老師將會(huì)與您分享設(shè)計(jì)的全流程以及工具的綜合使用經(jīng)驗(yàn)、技巧。課程可定制,線(xiàn)上/線(xiàn)下/上門(mén)皆可,熱線(xiàn):4008699035。
曙海培訓(xùn)的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。大批企業(yè)和曙海
建立了良好的合作關(guān)系,20多年來(lái),合作企事業(yè)單位以達(dá)30多萬(wàn)。曙海培訓(xùn)的課程在業(yè)內(nèi)有著響亮的知名度。
大數(shù)據(jù)分析與可視化培訓(xùn)課程
?
培訓(xùn)收益?
經(jīng)過(guò)此次課程培訓(xùn),可使學(xué)習(xí)者獲得如下收益:
1.理解數(shù)據(jù)分析及R語(yǔ)言;
2.理解并掌握數(shù)據(jù)結(jié)構(gòu);
3.掌握數(shù)據(jù)導(dǎo)入導(dǎo)出的方法;
4.掌握基本數(shù)據(jù)管理方法;
5.理解并掌握數(shù)據(jù)探索;
6.掌握如何進(jìn)行描述性統(tǒng)計(jì)分析;
7.掌握R語(yǔ)言繪圖基礎(chǔ);
8.掌握聚類(lèi)分析;
9.掌握關(guān)聯(lián)規(guī)則;
10.掌握KNN近鄰分類(lèi);
11.經(jīng)過(guò)案例掌握用戶(hù)行為挖掘算法;
12.掌握C5.0算法原理;
13.掌握CART算法原理;
14.理解并掌握Rattle工具使用及如何搭建數(shù)據(jù)分析平臺(tái)。
?
培訓(xùn)特色
1. 本課程盡量避開(kāi)數(shù)學(xué)公式,按照“講清思想方法原理—結(jié)合具體案例—R語(yǔ)言實(shí)現(xiàn)細(xì)節(jié)”思路,讓即使是幾乎沒(méi)有什么基礎(chǔ)的學(xué)員,掌握數(shù)據(jù)挖掘和可視化的基本思路和模式,打下未來(lái)深入的良好基礎(chǔ),能在工作和學(xué)習(xí)中結(jié)合具體問(wèn)題立馬上手操作解決;
2. 課程注重學(xué)練結(jié)合的方法,會(huì)采取課中練習(xí)的方法,充分調(diào)動(dòng)大家思考的積極性,在做中掌握相關(guān)知識(shí)和技能;
3. 課程緊緊抓住基于R語(yǔ)言的數(shù)據(jù)挖掘和可視化的重點(diǎn)和難點(diǎn),詳細(xì)的分析和講解,在理解難、容易出錯(cuò)的地方反復(fù)提醒,以便學(xué)員在課后容易的進(jìn)行自己復(fù)習(xí)和相關(guān)拓展。
培訓(xùn)大綱
?
|
培訓(xùn)模塊? |
培訓(xùn)內(nèi)容? |
|
數(shù)據(jù)處理及復(fù)雜數(shù)據(jù)可視化(一)? |
R語(yǔ)言入門(mén)及數(shù)據(jù)挖掘基本概念? q?R語(yǔ)言簡(jiǎn)介? 常量、向量、矩陣、數(shù)組、數(shù)據(jù)框、列表、數(shù)據(jù)處理、編寫(xiě)程序、基本統(tǒng)計(jì)計(jì)算、R語(yǔ)言繪圖基礎(chǔ)、幫助及包的用法? q?R語(yǔ)言數(shù)據(jù)處理秘笈? 介紹填、剪、揉太極三式的數(shù)據(jù)處理原理、方法、案例、技巧,以及Dplyr包、Tidyr包、Data.Table包的具體用法和代碼講解? q?數(shù)據(jù)挖掘基礎(chǔ)? 講解數(shù)據(jù)挖掘的基本概念、典型問(wèn)題,經(jīng)過(guò)場(chǎng)景舉例說(shuō)明數(shù)據(jù)挖掘的用途;同時(shí),結(jié)合數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程講解開(kāi)展數(shù)據(jù)挖掘工作的各環(huán)節(jié)及主要技術(shù)。介紹數(shù)據(jù)挖掘常用算法及適合場(chǎng)景,比較不同數(shù)據(jù)挖掘工具的優(yōu)缺點(diǎn)。? |
|
數(shù)據(jù)處理及復(fù)雜數(shù)據(jù)可視化(二)? |
R語(yǔ)言數(shù)據(jù)挖掘與可視化分析? q?數(shù)據(jù)挖掘關(guān)鍵技術(shù)? 詳細(xì)講解抽樣、分區(qū)、樣本平衡、特征選擇、訓(xùn)練模型、評(píng)估模型的技術(shù),并結(jié)合R語(yǔ)言講解其代碼實(shí)現(xiàn)。? q?Rattle數(shù)據(jù)挖掘工具? 介紹Rattle在業(yè)界的使用情況,安裝及具體使用方法,包括數(shù)據(jù)源、數(shù)據(jù)探索、統(tǒng)計(jì)檢驗(yàn)、數(shù)據(jù)變換、聚類(lèi)分析、關(guān)聯(lián)挖掘、建模、評(píng)估模型以及日志功能。經(jīng)過(guò)實(shí)際的數(shù)據(jù)演示各環(huán)節(jié)的具體操作過(guò)程,分析挖掘結(jié)果。? q?可視化分析? 介紹可視化基本概念,可視化設(shè)計(jì)流程以及R語(yǔ)言可視化的優(yōu)勢(shì);其次,介紹24種常見(jiàn)圖表(拆線(xiàn)圖、柱狀圖、散點(diǎn)圖、雷達(dá)圖、詞云圖、玫瑰圖、桑基圖、河流圖等等)的適用場(chǎng)景和使用方法;zui后,重點(diǎn)對(duì)Lattice、Rcharts、Recharts、Ggplot2包進(jìn)行了詳細(xì)講解和案例演示。? |
|
數(shù)據(jù)挖掘模型實(shí)戰(zhàn)(一)? |
關(guān)聯(lián)規(guī)則算法原理與案例分析? q?算法講解? 關(guān)聯(lián)規(guī)則概念、基本術(shù)語(yǔ)、Apriori算法實(shí)現(xiàn)原理、流程及手動(dòng)演算案例;Arules包的介紹等等? q?案例:利用超市購(gòu)物籃Groceries數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析? 介紹Groceries數(shù)據(jù)集、事務(wù)數(shù)據(jù)集以及常見(jiàn)操作;介紹數(shù)據(jù)轉(zhuǎn)換為事務(wù)數(shù)據(jù)集的方法以及使用Apriori算法建立關(guān)聯(lián)規(guī)則模型,同時(shí),對(duì)分析關(guān)聯(lián)規(guī)則結(jié)果的常用技術(shù)進(jìn)行了講解和演示。? 聚類(lèi)算法原理與案例分析? q?Kmeans算法講解? 介紹Kmeans聚類(lèi)基本思路及算法流程;Kmeans函數(shù)介紹;數(shù)據(jù)標(biāo)準(zhǔn)化技術(shù)介紹? q?案例:對(duì)Iris數(shù)據(jù)集進(jìn)行K均值聚類(lèi)分析? 介紹Iris數(shù)據(jù)集,并試圖經(jīng)過(guò)使用基本數(shù)值指標(biāo)建立聚類(lèi)分析模型,驗(yàn)證其與真實(shí)分類(lèi)的區(qū)別? q?案例:對(duì)Mtcars數(shù)據(jù)集進(jìn)行K均值聚類(lèi)分析? 介紹Mtcars數(shù)據(jù)集,并使用Kmeans算法對(duì)其進(jìn)行聚類(lèi)分析,以了解汽車(chē)的類(lèi)別細(xì)分,同時(shí)給出合理解釋并提煉判斷規(guī)則? q?層次聚類(lèi)算法講解? 介紹樣本距離、類(lèi)間距離的概念和計(jì)算方法,介紹層次聚類(lèi)算法流程以及經(jīng)過(guò)手動(dòng)演算詳細(xì)講解層次聚類(lèi)實(shí)現(xiàn)的過(guò)程;Hclust函數(shù)講解? q?案例:對(duì)洛杉機(jī)街區(qū)數(shù)據(jù)進(jìn)行層次聚類(lèi)? 介紹洛杉機(jī)數(shù)據(jù),并使用層次聚類(lèi)算法對(duì)其進(jìn)行細(xì)分;經(jīng)過(guò)細(xì)分進(jìn)一步對(duì)數(shù)據(jù)進(jìn)行了詳細(xì)了解,并給出各類(lèi)的詳細(xì)描述與說(shuō)明? q?案例:對(duì)哺乳動(dòng)物的睡眼數(shù)據(jù)進(jìn)行層次聚類(lèi)? 介紹哺乳動(dòng)物的睡眠數(shù)據(jù),使用層次聚類(lèi)的方法對(duì)其進(jìn)行細(xì)分,并給出各類(lèi)的特點(diǎn),并給出詳細(xì)描述與說(shuō)明? |
|
數(shù)據(jù)挖掘模型實(shí)戰(zhàn)(二)? |
KNN算法原理與案例分析? q?算法原理? 介紹Knn基本概念、原理以及實(shí)現(xiàn)流程,同時(shí)給出Knn算法的優(yōu)缺點(diǎn)和適用場(chǎng)景;詳細(xì)介紹Kknn包? q?案例:對(duì)Iris數(shù)據(jù)集進(jìn)行Knn分類(lèi)? 介紹使用Knn算法對(duì)Iris數(shù)據(jù)進(jìn)行分類(lèi)的方法、流程及代碼演示,并對(duì)分類(lèi)的結(jié)果進(jìn)行分析? q?案例:對(duì)乳腺癌數(shù)據(jù)進(jìn)行Knn分類(lèi)? 介紹乳腺癌數(shù)據(jù)集,并使用Knn算法對(duì)乳腺癌數(shù)據(jù)進(jìn)行分類(lèi),同時(shí)給出實(shí)現(xiàn)的方法、流程及代碼,并對(duì)分類(lèi)效果進(jìn)行分析? q?案例:對(duì)新聞文本數(shù)據(jù)進(jìn)行Knn分類(lèi)? 介紹新聞文本數(shù)據(jù),并使用Knn分類(lèi)算法對(duì)新聞文本數(shù)據(jù)進(jìn)行分類(lèi),同時(shí)給出實(shí)現(xiàn)的方法、流程及代碼,并對(duì)分類(lèi)效果進(jìn)行分析? 決策樹(shù)原理與案例分析? 介紹決策樹(shù)基本概念、分類(lèi)與回歸問(wèn)題的區(qū)別與聯(lián)系、說(shuō)明決策樹(shù)建模的通用過(guò)程。? q?CART算法原理? 介紹分類(lèi)回歸樹(shù)的基本思路、算法實(shí)現(xiàn)流程,并經(jīng)過(guò)案例說(shuō)明其實(shí)現(xiàn)細(xì)節(jié);介紹選擇分割點(diǎn)的方法,拆分規(guī)則,代價(jià)復(fù)雜度以及Rpart包和Prune函數(shù)的介紹? q?案例:對(duì)Iris數(shù)據(jù)集運(yùn)用CART算法進(jìn)行分類(lèi)? 介紹使用CART算法對(duì)Iris數(shù)據(jù)進(jìn)行分類(lèi)的方法、原理和代碼實(shí)現(xiàn)流程,并對(duì)分類(lèi)效果進(jìn)行比較分析? q?案例:對(duì)汽車(chē)數(shù)據(jù)運(yùn)用CART對(duì)汽車(chē)重量進(jìn)行預(yù)測(cè)? 介紹使用CART算法對(duì)Mtcars數(shù)據(jù)中汽車(chē)的重量進(jìn)行預(yù)測(cè)的方法、原理和代碼實(shí)現(xiàn)流程,并對(duì)預(yù)測(cè)效果進(jìn)行分析? q?C5.0算法原理? 介紹ID3算法的算法實(shí)現(xiàn)原理和流程,同時(shí)講解信息熵、后驗(yàn)熵、信息增益等基本概念;經(jīng)過(guò)案例講解ID3算法的具體過(guò)程以及ID3自身的問(wèn)題;介紹C4.5算法的實(shí)現(xiàn)原理和流程,講解增益比例的來(lái)源和優(yōu)點(diǎn),同時(shí)介紹C4.5對(duì)連續(xù)屬性及有缺失樣本的算法辦法,此外,還將會(huì)對(duì)剪枝、規(guī)則的產(chǎn)生、交叉驗(yàn)證等問(wèn)題進(jìn)行講解;C50包的介紹? q?案例:對(duì)Iris數(shù)據(jù)集運(yùn)用C50算法分類(lèi)? 介紹使用C50算法對(duì)Iris數(shù)據(jù)集進(jìn)行分類(lèi)的方法、原理和代碼實(shí)現(xiàn)流程,同時(shí)對(duì)分類(lèi)效果進(jìn)行分析? |
|
行業(yè)應(yīng)用案例分享(一)? |
分析案例剖析? q?購(gòu)物籃分析案例? Onlineretail數(shù)據(jù)集,包含用戶(hù)購(gòu)買(mǎi)商品的交易信息,本案例旨在從中挖掘出用戶(hù)購(gòu)買(mǎi)商品的關(guān)聯(lián)規(guī)則規(guī)律,并分析各模式對(duì)應(yīng)的含義及應(yīng)用可行性。? q?航空公司客戶(hù)價(jià)值分析案例? 面對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng),各航空公司都推出了更優(yōu)惠的營(yíng)銷(xiāo)方式來(lái)吸引更多的客戶(hù),國(guó)內(nèi)某航空公司面臨著旅客流失、競(jìng)爭(zhēng)力下降和航空資源未充分利用等經(jīng)營(yíng)危機(jī)。經(jīng)過(guò)建立合理的客戶(hù)價(jià)值評(píng)估模型,對(duì)客戶(hù)進(jìn)行分群,分析比較不同客戶(hù)群的客戶(hù)價(jià)值,并制定相應(yīng)的營(yíng)銷(xiāo)策略? q?Lending Club信貸違約分析案例? Lending Club 信用貸款違約數(shù)據(jù)是美國(guó)網(wǎng)絡(luò)貸款平臺(tái)?Lendingclub 在2007-2015年間的信用貸款情況數(shù)據(jù),主要包括貸款狀態(tài)和還款信息。本例基于該數(shù)據(jù)對(duì)多維度信息進(jìn)行詳細(xì)的數(shù)據(jù)分析,主要結(jié)合詞云、地圖等分析方法,另外,針對(duì)貸款違約建立了預(yù)測(cè)模型,本節(jié)會(huì)介紹詳細(xì)的建模過(guò)程及預(yù)測(cè)效果分析? |
|
行業(yè)應(yīng)用案例分享(二)? |
用戶(hù)行為挖掘算法及案例? q?推薦系統(tǒng)? 介紹推薦系統(tǒng)的基本概念、以及常見(jiàn)推薦算法(包括基于人口統(tǒng)計(jì)學(xué)的推薦、基于內(nèi)容的推薦、協(xié)同過(guò)濾推薦、基于關(guān)聯(lián)規(guī)則的推薦、基于效用的推薦、基于知識(shí)推薦、基于標(biāo)簽的推薦、基于圖的推薦等等),同時(shí)對(duì)不同的推薦算法進(jìn)行比較;另外,針對(duì)構(gòu)建推薦系統(tǒng),給出了詳細(xì)的說(shuō)明;介紹了推薦系統(tǒng)評(píng)測(cè)的關(guān)鍵指標(biāo)(包括用戶(hù)滿(mǎn)意度、準(zhǔn)確度、覆蓋率、多樣性、驚喜度等等);接著,對(duì)R語(yǔ)言中的Recommenderlab包的用法進(jìn)行詳細(xì)介紹? q?案例:基于Onlineretail數(shù)據(jù)建立推薦系統(tǒng)? 介紹Onlineretail數(shù)據(jù)集,以及開(kāi)展推薦系統(tǒng)搭建過(guò)程的方法及具體實(shí)現(xiàn),案例中使用了RANDOM、UBCF、IBCF三種方法建立了預(yù)測(cè)模型,并給出了比較分析? q?序列模式挖掘? 介紹序列模式挖掘的基本概念、術(shù)語(yǔ)、實(shí)現(xiàn)的思路及具體過(guò)程。主要介紹SPADE算法的原理以及其實(shí)現(xiàn)過(guò)程。針對(duì)具體的實(shí)現(xiàn),詳細(xì)介紹了R語(yǔ)言中的Arulessequences包? q?對(duì)Onlineretail數(shù)據(jù)集進(jìn)行序列模式挖掘? 基于Onlineretail數(shù)據(jù)集,使用Spade算法建立序列模式挖掘算法進(jìn)行序列模式挖掘,并對(duì)挖掘出的結(jié)果進(jìn)行解釋分析? |
|
? |
|
?
?