| 主題 | 
內(nèi)容 | 
| 
 數(shù)據(jù)治理范圍 
 | 
 ?	數(shù)據(jù)治理面臨的挑戰(zhàn) 
            ?	數(shù)據(jù)的多元化 
            ?	數(shù)據(jù)的復(fù)雜性 
            ?	數(shù)據(jù)的完整性 
            ?	數(shù)據(jù)生命周期管理 
            ?	統(tǒng)一元數(shù)據(jù)管理 
            ?	數(shù)據(jù)集成方法 
            ?	數(shù)據(jù)安全 
            ?	數(shù)據(jù)湖架構(gòu) 
            ?	基于大數(shù)據(jù)平臺的數(shù)據(jù)建模 
            ?	RMDBS數(shù)據(jù)的增量實時同步采集 
 | 
| 
 大數(shù)據(jù)在國內(nèi)的運(yùn)用 
 | 
 ?	大數(shù)據(jù)在國內(nèi)的使用介紹 
            ?	離線計算框架介紹 
            ?	流式計算框架介紹 
            ?	內(nèi)存計算框架介紹 
            ?	內(nèi)存流式計算介紹 
            ?	大數(shù)據(jù)實時請求框架介紹 
            ?	大數(shù)據(jù)在證券的案例介紹 
            ?	大數(shù)據(jù)在銀行的案例介紹 
 | 
| 
 大數(shù)據(jù)生態(tài)系統(tǒng)介紹 
 | 
 ?	分布式存儲—HDFS 
            ?	分布式并行計算—MapReduce 
            ?	基于Hadoop的數(shù)據(jù)倉庫—Hive 
            ?	統(tǒng)一元數(shù)據(jù)管理—Hcatlog 
            ?	集群管理工具—ambari 
            ?	工作流工具—Oozie 
            ?	數(shù)據(jù)的并行采集—Flume 
            ?	MapReduce腳本工具—Pig 
            ?	與關(guān)系型數(shù)據(jù)庫之間的數(shù)據(jù)遷移—Sqoop 
            ?	資源管理平臺—Yarn 
            ?	數(shù)據(jù)生命周期管理—Falcon 
            ?	數(shù)據(jù)挖掘算法—Mahout 
            ?	分布式統(tǒng)一服務(wù)—Zookeeper 
            ?	Hadoop安全工具—Knox 
            ?	流式計算框架—Storm 
            ?	內(nèi)存計算框架—Spark 
            ?	數(shù)據(jù)挖掘框架—Mahout、Mllib和Graphx 
 | 
| 
 統(tǒng)一元數(shù)據(jù)管理 
 | 
 ?	元數(shù)據(jù)概念 
            ?	Hadoop平臺元數(shù)據(jù)處理面臨的問題 
            ?	Hcatalog介紹? 
            ?	Hcatlog原理和架構(gòu)解析 
            ?	Hive與Hcatlog關(guān)系 
            ?	Hcatlog解決那些問題 
            ?	Hcatlog實戰(zhàn) 
            ?	元數(shù)據(jù)注冊機(jī)制 
            ?	基于Hadoop平臺元數(shù)據(jù)處理方案 
 | 
| 
 數(shù)據(jù)生命周期管理 
 | 
 ?	數(shù)據(jù)質(zhì)量 
            ?	數(shù)據(jù)標(biāo)準(zhǔn) 
            ?	數(shù)據(jù)生命周期管理的重要性 
            ?	數(shù)據(jù)生命周期的概念 
            ?	開源Falcon解決那些問題 
            ?	Falcon架構(gòu)和原理 
            ?	Falcon實戰(zhàn) 
            ?	Falcon+HDFS、Hive實戰(zhàn) 
            ?	Falcon+Oozie實戰(zhàn)? 
 | 
| 
 大數(shù)據(jù)平臺安全 
 | 
 ?	Hadoop平臺安全介紹 
            ?	HDFS2.0的ACLS介紹 
            ?	Hive安全介紹 
            ?	Hbase基于namespace的安全介紹 
            ?	Hadoop訪問安全控制Knox 
            ?	Knox的架構(gòu)和原理 
            ?	Knox與Kerberos介紹 
            ?	Ranger安全工具介紹 
            ?	Knox+Ranger整合控制Hadoop平臺的安全 
            ?	基于Hadoop平臺的數(shù)據(jù)加密 
 | 
| 
 數(shù)據(jù)湖 
 | 
 ?	數(shù)據(jù)湖概念 
            ?	數(shù)據(jù)湖解決那些問題 
            ?	數(shù)據(jù)湖架構(gòu) 
            ?	數(shù)據(jù)的整合 
            ?	數(shù)據(jù)的landing zone功能 
            ?	離線數(shù)據(jù)管理 
            ?	流式數(shù)據(jù)管理 
            ?	RDBMS全量和增量數(shù)據(jù)實時采集 
            ?	Databus框架介紹 
            ?	Databus功能介紹 
            ?	Databus解決那些問題 
 | 
| 
 Think big基于Hadoop平臺實戰(zhàn) 
 | 
 ?	怎么快速迭代在Hadoop平臺開發(fā) 
            ?	Hadoop平臺設(shè)施的方法論 
            ?	2個月快速基于Hadoop平臺開發(fā)步驟 
            ?	Hadoop平臺開發(fā)的難點 
            ?	Hadoop平臺開的注意點 
            ?	Hadoop平臺設(shè)施的流程 
 | 
| 
 互聯(lián)網(wǎng)大數(shù)案例分享 
 | 
 ?	淘寶大數(shù)據(jù)平臺深度解析 
            ?	基于大數(shù)據(jù)平臺的實時營銷架構(gòu) 
            ?	淘寶大數(shù)據(jù)推薦架構(gòu)介紹 
            ?	大數(shù)據(jù)實時分析架構(gòu) 
 |