| 一、 大數(shù)據(jù)處理平臺(tái)架構(gòu)基礎(chǔ) |
1. 大數(shù)據(jù)的產(chǎn)生背景、發(fā)展歷程
2. 大數(shù)據(jù)和云計(jì)算的關(guān)系
3. 大數(shù)據(jù)應(yīng)用需求以及潛在價(jià)值分析
4. 業(yè)界最新的大數(shù)據(jù)技術(shù)發(fā)展態(tài)勢(shì)與應(yīng)用趨勢(shì)
5. 大數(shù)據(jù)項(xiàng)目的技術(shù)選型與大數(shù)據(jù)處理系統(tǒng)架構(gòu)設(shè)計(jì)
6. “互聯(lián)網(wǎng)+”時(shí)代下的電子商務(wù)、制造業(yè)、零售批發(fā)業(yè)、電信運(yùn)營(yíng)商、互聯(lián)網(wǎng)金融業(yè)、網(wǎng)上銀行、電子政務(wù)、移動(dòng)互聯(lián)網(wǎng)、教育信息化等行業(yè)應(yīng)用實(shí)踐與應(yīng)用案例剖析 |
| 二、 業(yè)界主流的大數(shù)據(jù)技術(shù)產(chǎn)品與項(xiàng)目解決方案 |
7. 國(guó)內(nèi)外主流的大數(shù)據(jù)解決方案介紹
8. 當(dāng)前大數(shù)據(jù)解決方案與傳統(tǒng)數(shù)據(jù)庫(kù)方案的剖析比較
9. Apache大數(shù)據(jù)平臺(tái)方案剖析
10. CDH大數(shù)據(jù)平臺(tái)方案剖析
11. HDP大數(shù)據(jù)平臺(tái)方案剖析
12. 開(kāi)源的大數(shù)據(jù)生態(tài)系統(tǒng)平臺(tái)剖析 |
| 三、 Hadoop大數(shù)據(jù)平臺(tái)核心技術(shù)剖析 |
13. Hadoop的發(fā)展歷程以及產(chǎn)業(yè)界的實(shí)際應(yīng)用介紹
14. Hadoop大數(shù)據(jù)平臺(tái)架構(gòu)
15. 基于Hadoop平臺(tái)的PB級(jí)大數(shù)據(jù)存儲(chǔ)管理與分析處理的工作原理與機(jī)制
16. Hadoop的核心組件剖析 |
| 四、 大數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)原理及其應(yīng)用實(shí)踐 |
17. 分布式文件系統(tǒng)HDFS的簡(jiǎn)介
18. HDFS系統(tǒng)的主從式平臺(tái)架構(gòu)和工作原理
19. HDFS核心組件技術(shù)講解
20. 基于HDFS的大型存儲(chǔ)系統(tǒng)應(yīng)用開(kāi)發(fā)實(shí)戰(zhàn)
21. HDFS集群的安裝、部署、配置與性能優(yōu)化實(shí)踐
22. HDFS與Linux NFS3交互技術(shù)以及本地化掛載部署應(yīng)用實(shí)踐
23. 分布式鍵值存儲(chǔ)系統(tǒng)的平臺(tái)架構(gòu)、核心技術(shù)以及應(yīng)用開(kāi)發(fā)
24. PB及大數(shù)據(jù)存儲(chǔ)系統(tǒng)的項(xiàng)目案例分析 |
| 五、 大數(shù)據(jù)并行處理框架MapReduce與Yarn技術(shù)實(shí)踐 |
25. MapReduce并行計(jì)算模型
26. MapReduce作業(yè)執(zhí)行與調(diào)度技術(shù)
27. 第二代大數(shù)據(jù)處理框架Yarn的工作原理及DAG并行執(zhí)行機(jī)制
28. MapReduce應(yīng)用開(kāi)發(fā)環(huán)境的部署,以及大數(shù)據(jù)并行處理應(yīng)用程序開(kāi)發(fā)
29. MapReduce高級(jí)編程技巧與性能優(yōu)化實(shí)踐
30. MapReduce與Yarn大數(shù)據(jù)分析處理案例分析 |
| 六、 Hadoop大數(shù)據(jù)處理高性能應(yīng)用開(kāi)發(fā)實(shí)踐操作訓(xùn)練 |
31. 部署與配置HDFS,熟練操作HDFS SHELL,HDFS與NFS操作,以及HDFS API開(kāi)發(fā)實(shí)踐
32. 部署與配置MapReduce與Yarn及其開(kāi)發(fā)實(shí)踐
33. Hadoop的Linux二次開(kāi)發(fā)環(huán)境部署與配置 |
| 七、 HBase分布式數(shù)據(jù)庫(kù)管理系統(tǒng) |
34. NoSQL數(shù)據(jù)庫(kù)與NewSQL數(shù)據(jù)庫(kù)技術(shù)介紹,及其在半結(jié)構(gòu)化和非結(jié)構(gòu)化大數(shù)據(jù)方面的應(yīng)用實(shí)踐
35. HBase分布式數(shù)據(jù)庫(kù)簡(jiǎn)介、數(shù)據(jù)模型以及工作原理
36. HBase分布式數(shù)據(jù)庫(kù)集群的平臺(tái)架構(gòu)和關(guān)鍵技術(shù)剖析
37. HBase應(yīng)用項(xiàng)目開(kāi)發(fā)技巧,以及客戶(hù)端開(kāi)發(fā)實(shí)戰(zhàn)
38. HBase表設(shè)計(jì)與數(shù)據(jù)操作以及數(shù)據(jù)庫(kù)管理API調(diào)用
39. HBase集群的安裝部署與配置優(yōu)化
40. ZooKeeper分布式協(xié)調(diào)服務(wù)系統(tǒng)的工作原理、平臺(tái)架構(gòu)、集群部署與配置應(yīng)用實(shí)戰(zhàn)
41. HBase集群的運(yùn)維與監(jiān)控管理
?
|
| 八、 HBase應(yīng)用實(shí)踐操作訓(xùn)練 |
42. 部署與配置HBase集群以及HBase的性能優(yōu)化
43. 部署與配置ZooKeeper分布式集群
44. 構(gòu)建HBase開(kāi)發(fā)環(huán)境
45. HBase數(shù)據(jù)庫(kù)二次開(kāi)發(fā)項(xiàng)目實(shí)踐 |
| 九、 大型數(shù)據(jù)倉(cāng)庫(kù)Hive集群平臺(tái) |
46. 基于Hadoop的大型分布式數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)知識(shí),HIVE在行業(yè)中的數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用案例
47. Hive大數(shù)據(jù)倉(cāng)庫(kù)簡(jiǎn)介以及應(yīng)用介紹
48. Hive數(shù)據(jù)倉(cāng)庫(kù)集群的平臺(tái)體系結(jié)構(gòu)、核心技術(shù)剖析
49. Hive Server的工作原理、機(jī)制與應(yīng)用
50. Hive數(shù)據(jù)倉(cāng)庫(kù)集群的安裝部署與配置優(yōu)化
51. Hive應(yīng)用開(kāi)發(fā)技巧
52. Hive SQL剖析與應(yīng)用實(shí)踐
53. Hive數(shù)據(jù)倉(cāng)庫(kù)表與表分區(qū)、表操作、數(shù)據(jù)導(dǎo)入導(dǎo)出、客戶(hù)端操作技巧
54. Hive數(shù)據(jù)倉(cāng)庫(kù)報(bào)表設(shè)計(jì)
55. Hive JDBC與ODBC的工作原理與實(shí)現(xiàn)機(jī)制
56. Hive HWI、CLI客戶(hù)端操作以及UDF應(yīng)用實(shí)踐
? |
| 十、 Hive應(yīng)用實(shí)踐操作訓(xùn)練 |
57. 部署與配置HIVE集群,以及HIVE性能調(diào)優(yōu)
58. 構(gòu)建HIVE開(kāi)發(fā)環(huán)境
59. HIVE數(shù)據(jù)倉(cāng)庫(kù)操作項(xiàng)目實(shí)踐 |
| 十一、 Spark大數(shù)據(jù)實(shí)時(shí)處理平臺(tái)剖析 |
60. Spark的發(fā)展歷程以及業(yè)界的實(shí)際應(yīng)用介紹
61. Spark實(shí)時(shí)大數(shù)據(jù)處理平臺(tái)架構(gòu)
62. Spark RDD內(nèi)存彈性分布式數(shù)據(jù)集的工作原理與機(jī)制
63. Spark的核心組件剖析
64. 基于Spark的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)與實(shí)時(shí)分析挖掘處理在行業(yè)中的應(yīng)用實(shí)踐案例 |
| 十二、 Spark應(yīng)用實(shí)踐操作訓(xùn)練 |
65. 部署與配置Spark集群,以及Spark性能調(diào)優(yōu)
66. 構(gòu)建Spark開(kāi)發(fā)環(huán)境
67. Spark程序運(yùn)行以及操作 |
| 十三、 基于Spark的實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)和實(shí)時(shí)數(shù)據(jù)分析挖掘處理平臺(tái)的實(shí)現(xiàn)機(jī)制, Spark SQL,Spark Streaming,MLib,GraphX,SparkR的應(yīng)用實(shí)踐 |
68. 內(nèi)存計(jì)算模型和實(shí)時(shí)處理技術(shù)介紹
69. Spark中各個(gè)分布式組件的處理框架及工作原理
70. Spark SQL實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)原理機(jī)制及應(yīng)用實(shí)踐
71. Spark Streaming流式數(shù)據(jù)實(shí)時(shí)處理機(jī)制及應(yīng)用實(shí)踐
72. Spark MLib實(shí)時(shí)機(jī)器學(xué)習(xí)算法應(yīng)用實(shí)踐與案例應(yīng)用
73. Spark GraphX實(shí)時(shí)圖數(shù)據(jù)處理應(yīng)用實(shí)踐與社交網(wǎng)絡(luò)分析應(yīng)用案例
74. SparkR的實(shí)現(xiàn)原理與應(yīng)用實(shí)踐
75. Spark組件的應(yīng)用編程開(kāi)發(fā)實(shí)戰(zhàn)
76. Spark與Hadoop的集成解決方案實(shí)踐 |
| 十四、 Spark核心組件功能運(yùn)用的實(shí)踐操作訓(xùn)練 |
77. Spark SQL應(yīng)用操作實(shí)訓(xùn)
78. Spark Streaming應(yīng)用操作實(shí)訓(xùn)
79. Spark MLib應(yīng)用操作實(shí)訓(xùn)
80. Spark GraphX應(yīng)用操作實(shí)訓(xùn)
81. SparkR應(yīng)用操作實(shí)訓(xùn)
82. Spark與HBase集成數(shù)據(jù)分析實(shí)驗(yàn)實(shí)訓(xùn) |
| 十五、 Mahout大數(shù)據(jù)分析挖掘平臺(tái) |
83. 大數(shù)據(jù)分析挖掘技術(shù)介紹,以及行業(yè)大數(shù)據(jù)挖掘應(yīng)用案例
84 . Mahout大數(shù)據(jù)挖掘平臺(tái)的體系架構(gòu)和核心技術(shù)
85 . 基于Mahout的數(shù)據(jù)分析挖掘算法應(yīng)用,包括分類(lèi)算法、聚類(lèi)算法、關(guān)聯(lián)規(guī)則挖掘算法、推薦與協(xié)同過(guò)濾分析算法、預(yù)測(cè)分析等算法的應(yīng)用及其案例剖析
86 . 基于Mahout的數(shù)據(jù)分析挖掘應(yīng)用程序開(kāi)發(fā)實(shí)戰(zhàn)
87 . 利用Mahout與Hadoop集成大數(shù)據(jù)挖掘平臺(tái)應(yīng)用實(shí)戰(zhàn) |
| 十六、 Mahout大數(shù)據(jù)分析挖掘項(xiàng)目的實(shí)踐操作訓(xùn)練 |
88. Mahout集群的安裝部署與配置優(yōu)化
89. Mahout實(shí)現(xiàn)客戶(hù)分析,廣告分析,日志分析,規(guī)律預(yù)測(cè),關(guān)聯(lián)分析,定向推薦等應(yīng)用程序的開(kāi)發(fā)與應(yīng)用實(shí)戰(zhàn)
90. Mahout性能優(yōu)化與分析挖掘算法參數(shù)的優(yōu)化,并結(jié)合Mahout實(shí)現(xiàn)交互式數(shù)據(jù)查詢(xún)與分析挖掘的項(xiàng)目實(shí)踐 |
| 十七、 Flink分布式數(shù)據(jù)流處理與計(jì)算 |
91.大數(shù)據(jù)處理引擎Flink基礎(chǔ)概念
92.Flink體系架構(gòu)
93.Flink的部署和HA的實(shí)現(xiàn)。
94.如何在Flink中實(shí)現(xiàn)流式處理和批處理的Demo。 |
| 十八、 Storm流式數(shù)據(jù)處理平臺(tái)架構(gòu)及其應(yīng)用實(shí)踐 |
95. Storm流式處理系統(tǒng)的平臺(tái)架構(gòu)和工作原理
96. Storm關(guān)鍵技術(shù)剖析
97. Storm集群安裝部署與配置優(yōu)化
98. Storm日志流數(shù)據(jù)分析項(xiàng)目應(yīng)用實(shí)戰(zhàn)
99. Storm和Hadoop,Spark的應(yīng)用集成項(xiàng)目實(shí)踐 |
| 十九、 大數(shù)據(jù)智能化ETL操作工具以及Hadoop集群運(yùn)維監(jiān)控工具平臺(tái)應(yīng)用 |
100. Hadoop與DBMS之間數(shù)據(jù)交互工具Sqoop導(dǎo)入導(dǎo)出數(shù)據(jù)的工作原理,以及Sqoop集群安裝部署與配置
101. Kettle集群的平臺(tái)架構(gòu)、核心技術(shù)工作原理以及應(yīng)用案例
102. Kettle大數(shù)據(jù)ETL工具的部署與配置,以及應(yīng)用實(shí)戰(zhàn)
103. 利用Sqoop實(shí)現(xiàn)MySQL與Hadoop集群之間的數(shù)據(jù)導(dǎo)入導(dǎo)出交互程序
104. Hadoop大數(shù)據(jù)運(yùn)維監(jiān)控管理系統(tǒng)HUE平臺(tái)的安裝部署與應(yīng)用配置
105. Hadoop運(yùn)維管理監(jiān)控系統(tǒng)Ambari平臺(tái)的安裝部署與應(yīng)用配置
106. Hadoop集群運(yùn)維系統(tǒng)Ganglia, Nagios的安裝部署與應(yīng)用配置 |
| 二十、 大數(shù)據(jù)的信息安全技術(shù)及其應(yīng)用 |
107. “互聯(lián)網(wǎng)+APP”背景下的信息安全遇到的挑戰(zhàn),以及可行的信息安全策略和案例分析
108. 大數(shù)據(jù)隱私保護(hù)技術(shù)及其應(yīng)用
109. 大數(shù)據(jù)加密技術(shù)及其應(yīng)用
110. 大數(shù)據(jù)平臺(tái)的安全認(rèn)證技術(shù)及其應(yīng)用
111. 大數(shù)據(jù)平臺(tái)的實(shí)時(shí)保護(hù)和監(jiān)控、細(xì)粒度的數(shù)據(jù)訪問(wèn)審計(jì)、自動(dòng)化的告警、數(shù)據(jù)級(jí)別的訪問(wèn)控制、數(shù)據(jù)漏洞管理,以及敏感數(shù)據(jù)的自動(dòng)發(fā)現(xiàn)
? |
| 二十一、 大數(shù)據(jù)平臺(tái)項(xiàng)目應(yīng)用完整實(shí)踐與咨詢(xún)討論 |
112. 根據(jù)講師布置的實(shí)際應(yīng)用案例,開(kāi)展大數(shù)據(jù)完整項(xiàng)目部署設(shè)計(jì)和應(yīng)用開(kāi)發(fā)實(shí)踐、大數(shù)據(jù)項(xiàng)目的需求分析、應(yīng)用實(shí)施以及解決方案分享咨詢(xún)與交流討論 |