| 
 主題  
 | 
 章節(jié)  
 | 
 詳細(xì)內(nèi)容 
 | 
| 
 大數(shù)據(jù)平臺(tái)概覽 
 | 
 大數(shù)據(jù)處理平臺(tái)架構(gòu)基礎(chǔ) 
 | 
 大數(shù)據(jù)的產(chǎn)生背景、發(fā)展歷程 
大數(shù)據(jù)和云計(jì)算的關(guān)系 
大數(shù)據(jù)應(yīng)用需求以及潛在價(jià)值分析 
業(yè)界最新的大數(shù)據(jù)技術(shù)發(fā)展態(tài)勢(shì)與應(yīng)用趨勢(shì) 
大數(shù)據(jù)項(xiàng)目的技術(shù)選型與大數(shù)據(jù)處理系統(tǒng)架構(gòu)設(shè)計(jì) 
“互聯(lián)網(wǎng)+”時(shí)代下的電子商務(wù)、制造業(yè)、零售批發(fā)業(yè)、電信運(yùn)營(yíng)商、互聯(lián)網(wǎng)金融業(yè)、網(wǎng)上銀行、電子政務(wù)、移動(dòng)互聯(lián)網(wǎng)、教育信息化等行業(yè)應(yīng)用實(shí)踐與應(yīng)用案例剖析  
 | 
| 
 業(yè)界主流的大數(shù)據(jù)技術(shù)產(chǎn)品與項(xiàng)目解決方案 
 | 
 國(guó)內(nèi)外主流的大數(shù)據(jù)解決方案介紹 
當(dāng)前大數(shù)據(jù)解決方案與傳統(tǒng)數(shù)據(jù)庫(kù)方案的剖析比較 
Apache大數(shù)據(jù)平臺(tái)方案剖析  
CDH大數(shù)據(jù)平臺(tái)方案剖析 
HDP大數(shù)據(jù)平臺(tái)方案剖析  
開(kāi)源的大數(shù)據(jù)生態(tài)系統(tǒng)平臺(tái)剖析  
 | 
| 
 Hadoop大數(shù)據(jù)平臺(tái)核心技術(shù)剖析 
 | 
 Hadoop的發(fā)展歷程以及產(chǎn)業(yè)界的實(shí)際應(yīng)用介紹 
Hadoop大數(shù)據(jù)平臺(tái)架構(gòu) 
基于Hadoop平臺(tái)的PB級(jí)大數(shù)據(jù)存儲(chǔ)管理與分析處理的工作原理與機(jī)制 
Hadoop的核心組件剖析  
 | 
| 
 Hadoop的大數(shù)據(jù)體系架構(gòu) 
 | 
 Hadoop的起源 
 | 
 什么是大數(shù)據(jù)? 
專有云上的混搭平臺(tái)設(shè)計(jì) 
OLTP系統(tǒng)和OLAP系統(tǒng)  
數(shù)據(jù)倉(cāng)庫(kù)的基本概念  
Google的基本思想  
 | 
| 
 Hadoop的體系結(jié)構(gòu)和原理 
 | 
 海量數(shù)據(jù)的存儲(chǔ)HDFS 
·??文件上傳的過(guò)程 
·??文件下載的過(guò)程 
·??原信息的合并過(guò)程 
 
海量數(shù)據(jù)的計(jì)算MapReduce  
·??YARN的工作原理 
·??MapReduce作業(yè)執(zhí)行的過(guò)程和原理 
 
HBase的基本架構(gòu)  
 | 
| 
 Hadoop集群模式的安裝和配置  
 | 
 單機(jī)模式的安裝和配置 
偽分布模式的安裝和配置  
免密碼登錄的原理  
配置Hadoop的集群環(huán)境  
配置和使用HUE  
 | 
| 
 Hadoop HA 
 | 
 集群的規(guī)劃 
安裝Zookeeper集群環(huán)境  
安裝配置hadoop集群  
驗(yàn)證HDFS的HA  
驗(yàn)證YARN  
 | 
| 
 Hadoop應(yīng)用案例分析  
 | 
 案例一:互聯(lián)網(wǎng)應(yīng)用架構(gòu) 
案例二:日志分析 
案例三:Hadoop在淘寶的應(yīng)用  
 | 
| 
 分布式文件系統(tǒng)HDFS 
 | 
 訪問(wèn)HDFS  
 | 
 使用命令行訪問(wèn)HDFS文件系統(tǒng) 
使用Java編程接口訪問(wèn)HDFS文件系統(tǒng) 
 | 
| 
 HDFS的高級(jí)特性  
 | 
 什么是HDFS的聯(lián)盟 
HDFS的回收站 
HDFS的配額 
HDFS的權(quán)限  
 | 
| 
 HDFS的底層原理  
 | 
 什么是RPC通信? 
什么是動(dòng)態(tài)代理? 
 | 
| 
 HDFS的優(yōu)化  
 | 
 NameNode的優(yōu)化策略 
SecondaryNameNode的優(yōu)化策略 
文件存儲(chǔ)的優(yōu)化  
HDFS的瓶頸和解決方案  
 | 
| 
 HDFS的NameNode聯(lián)盟  
 | 
 什么是NameNode的聯(lián)盟 
NameNode的體系架構(gòu) 
搭建NameNode的聯(lián)盟架構(gòu) 
 | 
| 
 分布式計(jì)算模型MapReduce和Yan 
 | 
 MapReduce基礎(chǔ)編程  
 | 
 MapReduce的基本概念和原理 
數(shù)據(jù)在MapReduce的流動(dòng)過(guò)程 
第一個(gè)MapReduce程序和運(yùn)行MapReduce程序 
 | 
| 
 MapReduce高級(jí)編程  
 | 
 序列化的基本概念 
編寫MapReduce序列化的程序 
MapReduce的排序 
MapReduce的分區(qū)  
什么是Combiner  
什么是Shuffle  
 | 
| 
 Yarn的優(yōu)化  
 | 
 Yarn的內(nèi)存使用 
Yarn的資源調(diào)度策略 
MapReduce任務(wù)的優(yōu)化 
 | 
| 
 數(shù)據(jù)分析引擎 
 | 
 數(shù)據(jù)分析之Hive  
 | 
 ·??什么是Hive和Hive的體系結(jié)構(gòu) 
·??安裝和配置Hive 
·??使用HQL 
·??Hive的客戶端:CLI客戶端和Java編程 
·??接口 
 
Hive的自定義函數(shù) 
Hive的數(shù)據(jù)模型  
·??內(nèi)部表 
·??分區(qū)表 
·??桶表 
·??視圖 
·??物化視圖 
 | 
| 
 數(shù)據(jù)分析之Pig  
 | 
 什么是Pig和Pig的體系結(jié)構(gòu) 
安裝和配置Pig 
Pig的數(shù)據(jù)模型  
使用Pig Latin語(yǔ)句進(jìn)行數(shù)據(jù)的分析  
Pig的自定義函數(shù)  
 | 
| 
 數(shù)據(jù)交換引擎 
 | 
 Sqoop和Flume  
 | 
 使用Sqoop進(jìn)行數(shù)據(jù)的交換  
·??什么是Sqoop體系結(jié)構(gòu) 
·??使用Sqoop進(jìn)行數(shù)據(jù)的交換 
 
使用Flume進(jìn)行數(shù)據(jù)的采集  
·??什么是Flume體系結(jié)構(gòu) 
·??使用Flume進(jìn)行數(shù)據(jù)的采集 
 | 
| 
 基于HDFS的存儲(chǔ)系統(tǒng) 
 | 
 HBase數(shù)據(jù)庫(kù)  
 | 
 HBase簡(jiǎn)介及其在Hadoop中的位置 
HBASE的偽分布的搭建 
HBASE的底層存儲(chǔ)模型和基本概念  
HBASE的讀寫原理  
HBASE的高級(jí)特性  
HBase的體系結(jié)構(gòu)  
HBASE Shell  
HBASE的批量導(dǎo)入  
HBASE的Java客戶端  
 | 
| 
 分布式協(xié)調(diào)服務(wù) 
 | 
 Zookeeper  
 | 
 什么是Zookeeper?及其功能 
Zookeeper的體系結(jié)構(gòu)和數(shù)據(jù)模型 
Zookeeper安裝及測(cè)試 
Zookeeper的Java接口  
Watcher及內(nèi)部事件  
Zookeeper的工作原理  
基于ZooKeeper的大數(shù)據(jù)的HA架構(gòu)及其實(shí)現(xiàn) 
 | 
| 
 基于Spark的大數(shù)據(jù)分析平臺(tái) 
 | 
 Scala編程語(yǔ)言  
 | 
 Scala語(yǔ)言基礎(chǔ) 
Scala語(yǔ)言的面向?qū)ο?/span> 
Scala語(yǔ)言的函數(shù)式編程  
Scala中的集合  
Scala語(yǔ)言的高級(jí)特性  
 | 
| 
 Spark Core核心  
 | 
 什么是Spark?Spark生態(tài)圈 
Spark的體系結(jié)構(gòu)與安裝部署 
執(zhí)行Spark Demo程序  
Spark運(yùn)行機(jī)制及原理分析  
Spark的算子  
Spark RDD的高級(jí)算子 
Spark基礎(chǔ)編程案例  
 | 
| 
 Spark SQL數(shù)據(jù)分析引擎  
 | 
 Spark SQL基礎(chǔ) 
使用數(shù)據(jù)源 
性能優(yōu)化 
在IDEA中開(kāi)發(fā)Spark SQL程序 
 | 
| 
 Spark Streaming流式計(jì)算框架  
 | 
 Structured Streaming基礎(chǔ) 
Structured Streaming的程序模型 
Datasets 和 DataFrames API 
管理和監(jiān)控流式查詢  
 | 
| 
 基于Hadoop和Spark大數(shù)據(jù)平臺(tái)的機(jī)器學(xué)習(xí) 
 | 
 Mahout和Spark MLlib  
 | 
 在機(jī)器學(xué)習(xí)中的使用,常用算法實(shí)戰(zhàn)(Mahout和spark MLlib)  
·??Mahout與Spark MLLib 
·??基于協(xié)同過(guò)濾算法 
·??基于ALS協(xié)同過(guò)濾算法 
·??基于Spark MLLib的邏輯回歸算法 
 | 
| 
 下一代大數(shù)據(jù)處理引擎 
 | 
 Flink  
 | 
 Flink介紹  
Flink的數(shù)據(jù)集  
Flink兩種執(zhí)行模型  
Flink-流計(jì)算模型-有界數(shù)據(jù)集處理  
Flink的DataSet API 
Flink的DataStream API 
廣播變量、累加器和計(jì)數(shù)器 
狀態(tài)管理和恢復(fù) 
Window和Time 
Flink Table & SQL 
 |