
曙海教學(xué)優(yōu)勢(shì)
本課程,秉承二十一年積累的教學(xué)品質(zhì),以項(xiàng)目實(shí)現(xiàn)為導(dǎo)向,面向企事業(yè)項(xiàng)目實(shí)際需要,老師將會(huì)與您分享設(shè)計(jì)的全流程以及工具的綜合使用經(jīng)驗(yàn)、技巧。課程可定制,線上/線下/上門(mén)皆可,熱線:4008699035。
  曙海培訓(xùn)的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。大批企業(yè)和曙海
     建立了良好的合作關(guān)系,20多年來(lái),合作企事業(yè)單位以達(dá)30多萬(wàn)。曙海培訓(xùn)的課程在業(yè)內(nèi)有著響亮的知名度。
培訓(xùn)內(nèi)容:
第一部分:如何構(gòu)建分布式數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)
1.?怎么樣才算是真正意義的大數(shù)據(jù)平臺(tái)
2.????? 開(kāi)源Hadoop介紹
3.?數(shù)據(jù)采集過(guò)程與分布式存儲(chǔ)
?1)ETL介紹
?2)Sqoop
?3)HDFS
4.?數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)分析
?1)MapReduce
?2)Hive
?3)Pig
?4)HBase
5.?集群監(jiān)控與調(diào)度組件
?1)Ganglia監(jiān)控
?2)Hadoop集群權(quán)限管理
?3)Hbase列數(shù)據(jù)庫(kù)監(jiān)控
?4)Oozie介紹
6.????? Hue介紹
7.????? 運(yùn)營(yíng)商全國(guó)用戶上網(wǎng)記錄案例介紹
8.????? 網(wǎng)上輿情分析
第二部分:大數(shù)據(jù)平臺(tái)部署及案例
1.?我們應(yīng)該選哪種Hadoop?
?1)選哪個(gè)版本?為什么?
?2)選哪種發(fā)行版本?為什么?
2.?集群硬件應(yīng)該如何選配?
?1)內(nèi)存
?2)CPU
?3)硬盤(pán)
3.?部署案例講解
?1)英特爾Hadoop詳解
?2)某省級(jí)通信運(yùn)營(yíng)商清帳單查詢系統(tǒng)介紹
第三部分:Hbase列數(shù)據(jù)庫(kù)及應(yīng)用案例
1.?Hbase感性認(rèn)識(shí)
?1)Hbase簡(jiǎn)介
?2)Hbase特點(diǎn)
?3)HBase與RDBMS對(duì)比
?4)HBase體系結(jié)構(gòu)
?5)Hbase常見(jiàn)概念
?6)性能優(yōu)化
2.?Hbase主要組成
?7)Zookeeper、Hmaster
?8)HRegionServer、Region
?9)HStore存儲(chǔ)、Hfile
?10)Hbase內(nèi)部掃描RowKey的原理
?11)Hbase內(nèi)部讀寫(xiě)原理
?12)HBase設(shè)計(jì)原理、架構(gòu)分析
?13)Hadoop+HBase伸縮性(自動(dòng)擴(kuò)容、熱部署)
?14)HBase相關(guān)表結(jié)構(gòu)設(shè)計(jì)(列族、列詳細(xì)分析)
?15)HBase主HMaster與備用HMaster間的切換原理
?16)HBase基本命令介紹
3.?如何使用Hbase?
?17)Hbase的6種使用方式
?18)HBase Shell方式訪問(wèn);
?19)HBase Java API方式訪問(wèn);
?20)Hive+Hbase方式訪問(wèn);
?21)Pig+Hbase方式訪問(wèn);
4.?Hbase+Zookeeper使用配置
?22)Zookeeper簡(jiǎn)介
?23)Zookeeper與 HBase 的關(guān)系
5.????? Hbase的RowKey設(shè)計(jì)原則
6.?項(xiàng)目案例:
?24)HBase在小米業(yè)務(wù)的應(yīng)用
第四部分:大數(shù)據(jù)挖掘介紹與應(yīng)用案例
1.?大數(shù)據(jù)挖掘和傳統(tǒng)數(shù)據(jù)挖掘區(qū)別?
?1)傳統(tǒng)數(shù)據(jù)挖掘
?2)SPSS Modeler 14.2
?3)SAS簡(jiǎn)介
?4)Mahout簡(jiǎn)介
?5)R語(yǔ)言介紹
?6)R語(yǔ)言連接HIVE
2.?算法介紹和應(yīng)用
?1)關(guān)聯(lián)分析
?2)K-means
?3)決策數(shù)據(jù)C5.0
?4)邏輯線性Logistic回歸
?5)主成分/因子分析
?6)Apriori算法
?7)預(yù)測(cè)算法
?8)神經(jīng)網(wǎng)絡(luò)
?9)協(xié)同過(guò)濾挖掘算法
3.?項(xiàng)目案例詳解
?1)用戶行為編好分析
?2)客戶流失預(yù)測(cè)分析
?3)營(yíng)銷產(chǎn)品推薦系統(tǒng)
?4)TF-IDF與余弦相似性的應(yīng)用
?