| 大數(shù)據(jù)挖掘與分析介紹(全面理解大數(shù)據(jù)挖掘概念與分析技術(shù)) | 
- 數(shù)據(jù)分析基本概念
 
- 數(shù)據(jù)分析算法
 
- 數(shù)據(jù)分析工具
 
- 數(shù)據(jù)分析流程
 
- 數(shù)據(jù)分析范疇
 
- 數(shù)據(jù)挖掘基本概念
 
- 數(shù)據(jù)挖掘模型
 
- 數(shù)據(jù)挖掘目標(biāo)
 
- 數(shù)據(jù)挖掘數(shù)據(jù)質(zhì)量
 
- 數(shù)據(jù)挖掘的9大定律
 
- 數(shù)據(jù)挖掘發(fā)展趨勢(shì)
 
 
 | 
| R語(yǔ)言概要(R語(yǔ)言精講) | 
- 什么是R語(yǔ)言,R語(yǔ)言的特點(diǎn)
 
- R語(yǔ)言主要的模塊、語(yǔ)言包
 
- R語(yǔ)言安裝環(huán)境
 
- R語(yǔ)言與與Hadoop、Hive的對(duì)接
 
 
 | 
| Spark大數(shù)據(jù)平臺(tái)概述(徹底理解Spark) | 
- Spark的速度為什么如此的快?
 
- Spark 生態(tài)系統(tǒng)
 
- Spark的架構(gòu)設(shè)計(jì)剖析
 
- RDD計(jì)算流程解析
 
- Spark的出色容錯(cuò)機(jī)制
 
- Spark分布式架構(gòu)與單機(jī)多核架構(gòu)的異同
 
- Spark的企業(yè)級(jí)應(yīng)用
 
 
 | 
| Spark的機(jī)器學(xué)習(xí)   | 
- 機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí)
 
- 圖計(jì)算基礎(chǔ)知識(shí)
 
- Spark,MLlib,以及GraphX的操作示
 
- 廣義線性模型
 
- SVM
 
- 聚類算法
 
- 圖計(jì)算模型
 
- 決策樹(shù)與組合學(xué)習(xí)
 
- 器學(xué)習(xí)算法評(píng)測(cè)
 
- 評(píng)測(cè)方法
 
- Cross validation與Grid Search
 
- MLlib中的實(shí)現(xiàn)
 
- 在線、離線測(cè)評(píng)方法
 
 
 | 
| SparkR初見(jiàn)   | 
- SparkR 項(xiàng)目介紹
 
- SparkR HelloWord
 
- SparkR API 介紹
 
- SparkR與DataFrame的架構(gòu)分析
 
- SparkR軟件棧
 
- SparkR編程指南
 
 
 | 
| 使用SparkR 構(gòu)建Logistic回歸與商業(yè)大數(shù)據(jù)建模   | 
- Logistic回歸是商業(yè)建模的常用重要數(shù)據(jù)挖掘方法,本講要講清楚Logistic回歸的建模原理、與多元線性模型的區(qū)別、R語(yǔ)言實(shí)現(xiàn)過(guò)程及回歸診斷注意事項(xiàng)、預(yù)測(cè)方法和結(jié)果解釋,讓學(xué)員徹底地掌握Logistic回歸解決問(wèn)題的R語(yǔ)言方法。
 
- 主要案例:
 
- 案例1:利用Logistic回歸幫助公司分析客戶流失的原因并做好預(yù)測(cè)。
 
 
 | 
| 使用SparkR 構(gòu)建關(guān)聯(lián)規(guī)則 
 ? 
 | 
- 關(guān)聯(lián)規(guī)則(著名的“啤酒和尿布”)是數(shù)據(jù)挖掘的基礎(chǔ)和核心技術(shù)之一,本講將著重圍繞經(jīng)典的Apriori算法和eclat算法,闡明關(guān)聯(lián)規(guī)則的支持、置信和提升程度與控制,使用R語(yǔ)言快速完成關(guān)聯(lián)規(guī)則分析。
 
- 主要案例:
 
- 案例1:使用R語(yǔ)言關(guān)聯(lián)規(guī)則方法幫助各個(gè)超市實(shí)現(xiàn)商品的最佳捆綁銷售方案(即“購(gòu)物籃”分析);
 
 
 | 
| 使用SparkR 構(gòu)建決策樹(shù)(回歸樹(shù))分析   | 
- 決策樹(shù)是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。本講主要講授兩種最為普遍的決策樹(shù)算法:CART和C4.5算法,使用rpart和J48函數(shù)進(jìn)行R語(yǔ)言分析。
 
- 主要案例:
 
- 案例2:使用決策樹(shù)幫助電信局判斷和預(yù)測(cè)客戶辦理寬帶業(yè)務(wù)。
 
 
 | 
| 使用SparkR 構(gòu)建隨機(jī)森林(RandomForest)算法   | 
- 在機(jī)器學(xué)習(xí)中,隨機(jī)森林是一個(gè)包含多個(gè)決策樹(shù)的分類器,本講講清隨機(jī)森林方法的原理,以致在實(shí)際中幫助學(xué)員判斷適合進(jìn)行隨機(jī)森林分析的情況,最終熟練掌握R語(yǔ)言隨機(jī)森林分析的方法。
 
- 主要案例:
 
- 案例1:對(duì)皮膚病進(jìn)行隨機(jī)森林的分類和預(yù)測(cè);
 
- 案例2:對(duì)酒的品質(zhì)和種類進(jìn)行分類和評(píng)價(jià)。
 
 
 | 
| 使用SparkR 構(gòu)建支持向量機(jī)    | 
- 本講將分析支持向量機(jī)的結(jié)構(gòu)風(fēng)險(xiǎn)最小原理、間隔和核函數(shù),從而幫助學(xué)員深刻理解支持向量機(jī)的思想和算法,以及使用中注意的問(wèn)題,從而幫助學(xué)員靈活地應(yīng)用于各個(gè)領(lǐng)域。
 
- 主要案例:
 
- 案例1:使用支持向量機(jī)進(jìn)行股票指數(shù)預(yù)測(cè)。
 
 
 | 
| 使用SparkR 構(gòu)建神經(jīng)網(wǎng)絡(luò)  | 
- 神經(jīng)網(wǎng)絡(luò)由大量的節(jié)點(diǎn)和輸出函數(shù)構(gòu)成邏輯策略,本講介紹其原理,主要通過(guò)案例的方式講解R語(yǔ)言實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)算法的過(guò)程和注意的事項(xiàng)。
 
- 主要案例:
 
- 案例1:酒的品質(zhì)和種類的神經(jīng)網(wǎng)絡(luò)的分析和預(yù)測(cè);
 
- 案例2:公司財(cái)務(wù)預(yù)警建模。
 
 
 | 
| 使用SparkR 構(gòu)建言結(jié)合KNN算法進(jìn)行文本挖掘  
   
 | 
- 文本挖掘,特別是對(duì)中文的文本挖掘日趨重要。本講介紹文本挖掘的原理和方法,幫助大家使用R語(yǔ)言在大量的非結(jié)構(gòu)化的數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的信息,抽取潛在有用的數(shù)據(jù),發(fā)現(xiàn)適合模式,實(shí)現(xiàn)可視化結(jié)果展示。
 
- 主要案例:
 
- 案例:使用R語(yǔ)言結(jié)合KNN算法對(duì)網(wǎng)頁(yè)(Web)進(jìn)行文本挖掘(含分詞、分類、可視化等)?
 
 
 |