| 大數(shù)據(jù)挖掘與分析介紹(全面理解大數(shù)據(jù)挖掘概念與分析技術(shù)) | 
- 數(shù)據(jù)分析基本概念
 
- 數(shù)據(jù)分析算法
 
- 數(shù)據(jù)分析工具
 
- 數(shù)據(jù)分析流程
 
- 數(shù)據(jù)分析范疇
 
- 數(shù)據(jù)挖掘基本概念
 
- 數(shù)據(jù)挖掘模型
 
- 數(shù)據(jù)挖掘目標
 
- 數(shù)據(jù)挖掘數(shù)據(jù)質(zhì)量
 
- 數(shù)據(jù)挖掘的9大定律
 
- 數(shù)據(jù)挖掘發(fā)展趨勢
 
 
 | 
| R語言概要(R語言精講) | 
- 什么是R語言,R語言的特點
 
- R語言主要的模塊、語言包
 
- R語言安裝環(huán)境
 
- R語言與與Hadoop、Hive的對接
 
 
 | 
| Spark大數(shù)據(jù)平臺概述(徹底理解Spark) | 
- Spark的速度為什么如此的快?
 
- Spark 生態(tài)系統(tǒng)
 
- Spark的架構(gòu)設(shè)計剖析
 
- RDD計算流程解析
 
- Spark的出色容錯機制
 
- Spark分布式架構(gòu)與單機多核架構(gòu)的異同
 
- Spark的企業(yè)級應(yīng)用
 
 
 | 
| Spark的機器學習   | 
- 機器學習基礎(chǔ)知識
 
- 圖計算基礎(chǔ)知識
 
- Spark,MLlib,以及GraphX的操作示
 
- 廣義線性模型
 
- SVM
 
- 聚類算法
 
- 圖計算模型
 
- 決策樹與組合學習
 
- 器學習算法評測
 
- 評測方法
 
- Cross validation與Grid Search
 
- MLlib中的實現(xiàn)
 
- 在線、離線測評方法
 
 
 | 
| SparkR初見   | 
- SparkR 項目介紹
 
- SparkR HelloWord
 
- SparkR API 介紹
 
- SparkR與DataFrame的架構(gòu)分析
 
- SparkR軟件棧
 
- SparkR編程指南
 
 
 | 
| 使用SparkR 構(gòu)建Logistic回歸與商業(yè)大數(shù)據(jù)建模   | 
- Logistic回歸是商業(yè)建模的常用重要數(shù)據(jù)挖掘方法,本講要講清楚Logistic回歸的建模原理、與多元線性模型的區(qū)別、R語言實現(xiàn)過程及回歸診斷注意事項、預(yù)測方法和結(jié)果解釋,讓學員徹底地掌握Logistic回歸解決問題的R語言方法。
 
- 主要案例:
 
- 案例1:利用Logistic回歸幫助公司分析客戶流失的原因并做好預(yù)測。
 
 
 | 
| 使用SparkR 構(gòu)建關(guān)聯(lián)規(guī)則 
 ? 
 | 
- 關(guān)聯(lián)規(guī)則(著名的“啤酒和尿布”)是數(shù)據(jù)挖掘的基礎(chǔ)和核心技術(shù)之一,本講將著重圍繞經(jīng)典的Apriori算法和eclat算法,闡明關(guān)聯(lián)規(guī)則的支持、置信和提升程度與控制,使用R語言快速完成關(guān)聯(lián)規(guī)則分析。
 
- 主要案例:
 
- 案例1:使用R語言關(guān)聯(lián)規(guī)則方法幫助各個超市實現(xiàn)商品的最佳捆綁銷售方案(即“購物籃”分析);
 
 
 | 
| 使用SparkR 構(gòu)建決策樹(回歸樹)分析   | 
- 決策樹是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。本講主要講授兩種最為普遍的決策樹算法:CART和C4.5算法,使用rpart和J48函數(shù)進行R語言分析。
 
- 主要案例:
 
- 案例2:使用決策樹幫助電信局判斷和預(yù)測客戶辦理寬帶業(yè)務(wù)。
 
 
 | 
| 使用SparkR 構(gòu)建隨機森林(RandomForest)算法   | 
- 在機器學習中,隨機森林是一個包含多個決策樹的分類器,本講講清隨機森林方法的原理,以致在實際中幫助學員判斷適合進行隨機森林分析的情況,最終熟練掌握R語言隨機森林分析的方法。
 
- 主要案例:
 
- 案例1:對皮膚病進行隨機森林的分類和預(yù)測;
 
- 案例2:對酒的品質(zhì)和種類進行分類和評價。
 
 
 | 
| 使用SparkR 構(gòu)建支持向量機    | 
- 本講將分析支持向量機的結(jié)構(gòu)風險最小原理、間隔和核函數(shù),從而幫助學員深刻理解支持向量機的思想和算法,以及使用中注意的問題,從而幫助學員靈活地應(yīng)用于各個領(lǐng)域。
 
- 主要案例:
 
- 案例1:使用支持向量機進行股票指數(shù)預(yù)測。
 
 
 | 
| 使用SparkR 構(gòu)建神經(jīng)網(wǎng)絡(luò)  | 
- 神經(jīng)網(wǎng)絡(luò)由大量的節(jié)點和輸出函數(shù)構(gòu)成邏輯策略,本講介紹其原理,主要通過案例的方式講解R語言實現(xiàn)神經(jīng)網(wǎng)絡(luò)算法的過程和注意的事項。
 
- 主要案例:
 
- 案例1:酒的品質(zhì)和種類的神經(jīng)網(wǎng)絡(luò)的分析和預(yù)測;
 
- 案例2:公司財務(wù)預(yù)警建模。
 
 
 | 
| 使用SparkR 構(gòu)建言結(jié)合KNN算法進行文本挖掘  
   
 | 
- 文本挖掘,特別是對中文的文本挖掘日趨重要。本講介紹文本挖掘的原理和方法,幫助大家使用R語言在大量的非結(jié)構(gòu)化的數(shù)據(jù)中發(fā)現(xiàn)有價值的信息,抽取潛在有用的數(shù)據(jù),發(fā)現(xiàn)適合模式,實現(xiàn)可視化結(jié)果展示。
 
- 主要案例:
 
- 案例:使用R語言結(jié)合KNN算法對網(wǎng)頁(Web)進行文本挖掘(含分詞、分類、可視化等)?
 
 
 |