
曙海教學優(yōu)勢
課程可定制,線上/線下/上門皆可,報名熱線:4008699035。本課程以項目實戰(zhàn)案例實現(xiàn)為主線,面向企事業(yè)單位項目開發(fā)實際,秉承21年積累的教學和研發(fā)經(jīng)驗,培訓講師將會與您分享設(shè)計的全流程以及工具的綜合使用經(jīng)驗以及技巧。
  我們的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。曙海培訓的課程在業(yè)內(nèi)有廣泛的美譽度。大批企業(yè)和曙海
     建立了良好的合作關(guān)系,20多年來,合作企事業(yè)單位以達30多萬。
?云計算分布式大數(shù)據(jù)Hive數(shù)據(jù)倉庫最佳實踐培訓
課程大綱:
第一部分:
第1個主題:云計算的四大核心技術(shù)
HDFS、MapReduce、HBase、Hive
第2個主題:Hive集群與管理
1、Hadoop集群的搭建
2、Hadoop集群的監(jiān)控
3、Hadoop集群的管理
4、集群下運行MapReduce程序
5、安裝并啟動Hive
6、測試Hive
第3主題:Hive的命令、數(shù)據(jù)類型和文件格式
1、Hive的CLI
2、Hive的集合數(shù)據(jù)類型
3、編碼和模式
第4主題:開發(fā)Hive
1.?連接Java調(diào)試器到Hive 
2.?通過Eclipse來開發(fā)Hive代碼
3.?Hive的單元測試
第5題:HQL
1.?HQL的數(shù)據(jù)定義
2.?使用HQL操作數(shù)據(jù)
3.?深入HQL查詢
第6題:HQL的視圖和索引
1、HQL的視圖:降低查詢的復雜度和限定特定的條件
2、HQL的索引:索引的創(chuàng)建和管理、定制索引
第二部分:
第1個主題:Hive中的函數(shù)
1.?使用Hive中已有的函數(shù) 
2.?自定義聚合函數(shù)
3.?自定義表生成函數(shù)
4.?在自定義函數(shù)中訪問緩存
第2個主題:Hive的存儲過程
1、為何需要Hive中的存儲過程
2、?在后臺中運行的存儲過程
3、HiveStorageHandler
4、?存儲過程的具體編寫和使用
第3個主題:Hive架構(gòu)優(yōu)化
1、?降低IO負載
2、?表的分區(qū)、動態(tài)分區(qū)
3、?壓縮
4、分布式緩存
第4個主題:徹底優(yōu)化HQL
1、?HQL優(yōu)化的具體策略和方式
2、?Map和Reduce
3、數(shù)據(jù)傾斜
4,執(zhí)行計劃
第5個主題:在AWS上使用Hive
1.?使用并管理EMR?Hive集群
2.?EMR集群的詳細配置
3.持久層、元數(shù)據(jù)
4.集群中的HDFS和S3(配置、日志等)
第6個主題:Hive的Thrift
1.?配置、啟動、使用Thrift
2.?Thrift的管理
3.?管理Hive?Server
4.ThriftMetaStore