| 一、 大數(shù)據(jù)處理平臺架構(gòu)基礎(chǔ) |
1. 大數(shù)據(jù)的產(chǎn)生背景、發(fā)展歷程
2. 大數(shù)據(jù)和云計算的關(guān)系
3. 大數(shù)據(jù)應(yīng)用需求以及潛在價值分析
4. 業(yè)界最新的大數(shù)據(jù)技術(shù)發(fā)展態(tài)勢與應(yīng)用趨勢
5. 大數(shù)據(jù)項目的技術(shù)選型與大數(shù)據(jù)處理系統(tǒng)架構(gòu)設(shè)計
6. “互聯(lián)網(wǎng)+”時代下的電子商務(wù)、制造業(yè)、零售批發(fā)業(yè)、電信運營商、互聯(lián)網(wǎng)金融業(yè)、網(wǎng)上銀行、電子政務(wù)、移動互聯(lián)網(wǎng)、教育信息化等行業(yè)應(yīng)用實踐與應(yīng)用案例剖析 |
| 二、 業(yè)界主流的大數(shù)據(jù)技術(shù)產(chǎn)品與項目解決方案 |
7. 國內(nèi)外主流的大數(shù)據(jù)解決方案介紹
8. 當前大數(shù)據(jù)解決方案與傳統(tǒng)數(shù)據(jù)庫方案的剖析比較
9. Apache大數(shù)據(jù)平臺方案剖析
10. CDH大數(shù)據(jù)平臺方案剖析
11. HDP大數(shù)據(jù)平臺方案剖析
12. 開源的大數(shù)據(jù)生態(tài)系統(tǒng)平臺剖析 |
| 三、 Hadoop大數(shù)據(jù)平臺核心技術(shù)剖析 |
13. Hadoop的發(fā)展歷程以及產(chǎn)業(yè)界的實際應(yīng)用介紹
14. Hadoop大數(shù)據(jù)平臺架構(gòu)
15. 基于Hadoop平臺的PB級大數(shù)據(jù)存儲管理與分析處理的工作原理與機制
16. Hadoop的核心組件剖析 |
| 四、 大數(shù)據(jù)分布式存儲系統(tǒng)原理及其應(yīng)用實踐 |
17. 分布式文件系統(tǒng)HDFS的簡介
18. HDFS系統(tǒng)的主從式平臺架構(gòu)和工作原理
19. HDFS核心組件技術(shù)講解
20. 基于HDFS的大型存儲系統(tǒng)應(yīng)用開發(fā)實戰(zhàn)
21. HDFS集群的安裝、部署、配置與性能優(yōu)化實踐
22. HDFS與Linux NFS3交互技術(shù)以及本地化掛載部署應(yīng)用實踐
23. 分布式鍵值存儲系統(tǒng)的平臺架構(gòu)、核心技術(shù)以及應(yīng)用開發(fā)
24. PB及大數(shù)據(jù)存儲系統(tǒng)的項目案例分析 |
| 五、 大數(shù)據(jù)并行處理框架MapReduce與Yarn技術(shù)實踐 |
25. MapReduce并行計算模型
26. MapReduce作業(yè)執(zhí)行與調(diào)度技術(shù)
27. 第二代大數(shù)據(jù)處理框架Yarn的工作原理及DAG并行執(zhí)行機制
28. MapReduce應(yīng)用開發(fā)環(huán)境的部署,以及大數(shù)據(jù)并行處理應(yīng)用程序開發(fā)
29. MapReduce高級編程技巧與性能優(yōu)化實踐
30. MapReduce與Yarn大數(shù)據(jù)分析處理案例分析 |
| 六、 Hadoop大數(shù)據(jù)處理高性能應(yīng)用開發(fā)實踐操作訓練 |
31. 部署與配置HDFS,熟練操作HDFS SHELL,HDFS與NFS操作,以及HDFS API開發(fā)實踐
32. 部署與配置MapReduce與Yarn及其開發(fā)實踐
33. Hadoop的Linux二次開發(fā)環(huán)境部署與配置 |
| 七、 HBase分布式數(shù)據(jù)庫管理系統(tǒng) |
34. NoSQL數(shù)據(jù)庫與NewSQL數(shù)據(jù)庫技術(shù)介紹,及其在半結(jié)構(gòu)化和非結(jié)構(gòu)化大數(shù)據(jù)方面的應(yīng)用實踐
35. HBase分布式數(shù)據(jù)庫簡介、數(shù)據(jù)模型以及工作原理
36. HBase分布式數(shù)據(jù)庫集群的平臺架構(gòu)和關(guān)鍵技術(shù)剖析
37. HBase應(yīng)用項目開發(fā)技巧,以及客戶端開發(fā)實戰(zhàn)
38. HBase表設(shè)計與數(shù)據(jù)操作以及數(shù)據(jù)庫管理API調(diào)用
39. HBase集群的安裝部署與配置優(yōu)化
40. ZooKeeper分布式協(xié)調(diào)服務(wù)系統(tǒng)的工作原理、平臺架構(gòu)、集群部署與配置應(yīng)用實戰(zhàn)
41. HBase集群的運維與監(jiān)控管理
?
|
| 八、 HBase應(yīng)用實踐操作訓練 |
42. 部署與配置HBase集群以及HBase的性能優(yōu)化
43. 部署與配置ZooKeeper分布式集群
44. 構(gòu)建HBase開發(fā)環(huán)境
45. HBase數(shù)據(jù)庫二次開發(fā)項目實踐 |
| 九、 大型數(shù)據(jù)倉庫Hive集群平臺 |
46. 基于Hadoop的大型分布式數(shù)據(jù)倉庫基礎(chǔ)知識,HIVE在行業(yè)中的數(shù)據(jù)倉庫應(yīng)用案例
47. Hive大數(shù)據(jù)倉庫簡介以及應(yīng)用介紹
48. Hive數(shù)據(jù)倉庫集群的平臺體系結(jié)構(gòu)、核心技術(shù)剖析
49. Hive Server的工作原理、機制與應(yīng)用
50. Hive數(shù)據(jù)倉庫集群的安裝部署與配置優(yōu)化
51. Hive應(yīng)用開發(fā)技巧
52. Hive SQL剖析與應(yīng)用實踐
53. Hive數(shù)據(jù)倉庫表與表分區(qū)、表操作、數(shù)據(jù)導入導出、客戶端操作技巧
54. Hive數(shù)據(jù)倉庫報表設(shè)計
55. Hive JDBC與ODBC的工作原理與實現(xiàn)機制
56. Hive HWI、CLI客戶端操作以及UDF應(yīng)用實踐
? |
| 十、 Hive應(yīng)用實踐操作訓練 |
57. 部署與配置HIVE集群,以及HIVE性能調(diào)優(yōu)
58. 構(gòu)建HIVE開發(fā)環(huán)境
59. HIVE數(shù)據(jù)倉庫操作項目實踐 |
| 十一、 Spark大數(shù)據(jù)實時處理平臺剖析 |
60. Spark的發(fā)展歷程以及業(yè)界的實際應(yīng)用介紹
61. Spark實時大數(shù)據(jù)處理平臺架構(gòu)
62. Spark RDD內(nèi)存彈性分布式數(shù)據(jù)集的工作原理與機制
63. Spark的核心組件剖析
64. 基于Spark的實時數(shù)據(jù)倉庫與實時分析挖掘處理在行業(yè)中的應(yīng)用實踐案例 |
| 十二、 Spark應(yīng)用實踐操作訓練 |
65. 部署與配置Spark集群,以及Spark性能調(diào)優(yōu)
66. 構(gòu)建Spark開發(fā)環(huán)境
67. Spark程序運行以及操作 |
| 十三、 基于Spark的實時數(shù)據(jù)倉庫和實時數(shù)據(jù)分析挖掘處理平臺的實現(xiàn)機制, Spark SQL,Spark Streaming,MLib,GraphX,SparkR的應(yīng)用實踐 |
68. 內(nèi)存計算模型和實時處理技術(shù)介紹
69. Spark中各個分布式組件的處理框架及工作原理
70. Spark SQL實時數(shù)據(jù)倉庫的實現(xiàn)原理機制及應(yīng)用實踐
71. Spark Streaming流式數(shù)據(jù)實時處理機制及應(yīng)用實踐
72. Spark MLib實時機器學習算法應(yīng)用實踐與案例應(yīng)用
73. Spark GraphX實時圖數(shù)據(jù)處理應(yīng)用實踐與社交網(wǎng)絡(luò)分析應(yīng)用案例
74. SparkR的實現(xiàn)原理與應(yīng)用實踐
75. Spark組件的應(yīng)用編程開發(fā)實戰(zhàn)
76. Spark與Hadoop的集成解決方案實踐 |
| 十四、 Spark核心組件功能運用的實踐操作訓練 |
77. Spark SQL應(yīng)用操作實訓
78. Spark Streaming應(yīng)用操作實訓
79. Spark MLib應(yīng)用操作實訓
80. Spark GraphX應(yīng)用操作實訓
81. SparkR應(yīng)用操作實訓
82. Spark與HBase集成數(shù)據(jù)分析實驗實訓 |
| 十五、 Mahout大數(shù)據(jù)分析挖掘平臺 |
83. 大數(shù)據(jù)分析挖掘技術(shù)介紹,以及行業(yè)大數(shù)據(jù)挖掘應(yīng)用案例
84 . Mahout大數(shù)據(jù)挖掘平臺的體系架構(gòu)和核心技術(shù)
85 . 基于Mahout的數(shù)據(jù)分析挖掘算法應(yīng)用,包括分類算法、聚類算法、關(guān)聯(lián)規(guī)則挖掘算法、推薦與協(xié)同過濾分析算法、預(yù)測分析等算法的應(yīng)用及其案例剖析
86 . 基于Mahout的數(shù)據(jù)分析挖掘應(yīng)用程序開發(fā)實戰(zhàn)
87 . 利用Mahout與Hadoop集成大數(shù)據(jù)挖掘平臺應(yīng)用實戰(zhàn) |
| 十六、 Mahout大數(shù)據(jù)分析挖掘項目的實踐操作訓練 |
88. Mahout集群的安裝部署與配置優(yōu)化
89. Mahout實現(xiàn)客戶分析,廣告分析,日志分析,規(guī)律預(yù)測,關(guān)聯(lián)分析,定向推薦等應(yīng)用程序的開發(fā)與應(yīng)用實戰(zhàn)
90. Mahout性能優(yōu)化與分析挖掘算法參數(shù)的優(yōu)化,并結(jié)合Mahout實現(xiàn)交互式數(shù)據(jù)查詢與分析挖掘的項目實踐 |
| 十七、 Flink分布式數(shù)據(jù)流處理與計算 |
91.大數(shù)據(jù)處理引擎Flink基礎(chǔ)概念
92.Flink體系架構(gòu)
93.Flink的部署和HA的實現(xiàn)。
94.如何在Flink中實現(xiàn)流式處理和批處理的Demo。 |
| 十八、 Storm流式數(shù)據(jù)處理平臺架構(gòu)及其應(yīng)用實踐 |
95. Storm流式處理系統(tǒng)的平臺架構(gòu)和工作原理
96. Storm關(guān)鍵技術(shù)剖析
97. Storm集群安裝部署與配置優(yōu)化
98. Storm日志流數(shù)據(jù)分析項目應(yīng)用實戰(zhàn)
99. Storm和Hadoop,Spark的應(yīng)用集成項目實踐 |
| 十九、 大數(shù)據(jù)智能化ETL操作工具以及Hadoop集群運維監(jiān)控工具平臺應(yīng)用 |
100. Hadoop與DBMS之間數(shù)據(jù)交互工具Sqoop導入導出數(shù)據(jù)的工作原理,以及Sqoop集群安裝部署與配置
101. Kettle集群的平臺架構(gòu)、核心技術(shù)工作原理以及應(yīng)用案例
102. Kettle大數(shù)據(jù)ETL工具的部署與配置,以及應(yīng)用實戰(zhàn)
103. 利用Sqoop實現(xiàn)MySQL與Hadoop集群之間的數(shù)據(jù)導入導出交互程序
104. Hadoop大數(shù)據(jù)運維監(jiān)控管理系統(tǒng)HUE平臺的安裝部署與應(yīng)用配置
105. Hadoop運維管理監(jiān)控系統(tǒng)Ambari平臺的安裝部署與應(yīng)用配置
106. Hadoop集群運維系統(tǒng)Ganglia, Nagios的安裝部署與應(yīng)用配置 |
| 二十、 大數(shù)據(jù)的信息安全技術(shù)及其應(yīng)用 |
107. “互聯(lián)網(wǎng)+APP”背景下的信息安全遇到的挑戰(zhàn),以及可行的信息安全策略和案例分析
108. 大數(shù)據(jù)隱私保護技術(shù)及其應(yīng)用
109. 大數(shù)據(jù)加密技術(shù)及其應(yīng)用
110. 大數(shù)據(jù)平臺的安全認證技術(shù)及其應(yīng)用
111. 大數(shù)據(jù)平臺的實時保護和監(jiān)控、細粒度的數(shù)據(jù)訪問審計、自動化的告警、數(shù)據(jù)級別的訪問控制、數(shù)據(jù)漏洞管理,以及敏感數(shù)據(jù)的自動發(fā)現(xiàn)
? |
| 二十一、 大數(shù)據(jù)平臺項目應(yīng)用完整實踐與咨詢討論 |
112. 根據(jù)講師布置的實際應(yīng)用案例,開展大數(shù)據(jù)完整項目部署設(shè)計和應(yīng)用開發(fā)實踐、大數(shù)據(jù)項目的需求分析、應(yīng)用實施以及解決方案分享咨詢與交流討論 |