他趴在我两腿中间吸我视频_久久综合色之久久综合_久久久久无码精品国产_欧美丰满大乳高跟鞋_国产精品伦一区二区三级视频_综合色就爱涩涩涩综合婷婷_国产人妻人伦精品熟女_人人妻人人澡人人爽久久AV_欧洲美女与动zooz_国产免费午夜A无码V视频

Ansys和Matlab培訓(xùn)課程班

Spark大數(shù)據(jù)處理案例分析與實踐培訓(xùn)課程

5 (9653人評價)
  • 精品
  • 筆記:(65387)

  • 學(xué)員:(217537)

  • 瀏覽:(277013)

  • 加入課程

課程介紹

 

 
 

曙海教學(xué)優(yōu)勢

  課程可定制,線上/線下/上門皆可,報名熱線:4008699035。本課程以項目實戰(zhàn)案例實現(xiàn)為主線,面向企事業(yè)單位項目開發(fā)實際,秉承21年積累的教學(xué)和研發(fā)經(jīng)驗,培訓(xùn)講師將會與您分享設(shè)計的全流程以及工具的綜合使用經(jīng)驗以及技巧。

  我們的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。曙海培訓(xùn)的課程在業(yè)內(nèi)有廣泛的美譽度。大批企業(yè)和曙海
建立了良好的合作關(guān)系,20多年來,合作企事業(yè)單位以達(dá)30多萬。

 

精品課程班級列表

  •   目標(biāo)收益

      本次Spark培訓(xùn)將為大家全面而又深入的介紹Spark平臺的構(gòu)建流程,涉及Spark系統(tǒng)基礎(chǔ)知識,概念及架構(gòu), Spark實戰(zhàn)技巧,Spark經(jīng)典案例等。

      通過本課程實踐,幫助學(xué)員對Spark生態(tài)系統(tǒng)有一個清晰明了的認(rèn)識;理解Spark系統(tǒng)適用的場景;掌握Spark等初中級應(yīng)用開發(fā)技能;搭建穩(wěn)定可靠的Spark集群,滿足生產(chǎn)環(huán)境的標(biāo)準(zhǔn);了解和清楚大數(shù)據(jù)應(yīng)用的幾個行業(yè)中的經(jīng)典案例,包括阿里巴巴,騰訊,百度等互聯(lián)網(wǎng)行業(yè),中國移動和聯(lián)通等運營商。

      培訓(xùn)特色

      Spark已經(jīng)被不少互聯(lián)網(wǎng)公司采用,大部分?jǐn)?shù)據(jù)挖掘算法和迭代式算法在逐步MapReduce平臺遷移到Spark平臺中,包括阿里巴巴(廣告系統(tǒng)),騰訊(廣點通精準(zhǔn)推薦),百度,優(yōu)酷土豆,360,支付寶等互聯(lián)網(wǎng)公司已經(jīng)在線上產(chǎn)品中使用spark,且取得了令人滿意的效果,另外,部分省份的運營商也正在嘗試使用spark解決數(shù)據(jù)挖掘和分析問題,部分銀行,如工商銀行,也正在嘗試spark平臺。

      培訓(xùn)對象

      各類 IT/軟件企業(yè)和研發(fā)機構(gòu)的軟件架構(gòu)師、軟件設(shè)計師、程序員。對于懷有設(shè)計疑問和問題,需要梳理解答的團隊和個人,效果最佳。

      學(xué)員基礎(chǔ)

      1) 了解Java語言(Scala語言會作為課程內(nèi)容進(jìn)行介紹);

      2) 了解Linux系統(tǒng);

      課程大綱

      Spark大數(shù)據(jù)架構(gòu)概述及案例簡介

      1. 1介紹Spark大數(shù)據(jù)層級架構(gòu)及各層軟件設(shè)計要求,包括數(shù)據(jù)收集,大數(shù)據(jù)存儲,大數(shù)據(jù)計算框架,大數(shù)據(jù)應(yīng)用等

      1.2. Hadoop與Spark區(qū)別與關(guān)系

      1.3. Spark生態(tài)系統(tǒng)概述以及版本演化,并給出spark版本選擇建議

      1.4. Spark典型案例簡介(簡要介紹案例,具體在后面各節(jié)會詳細(xì)介紹)

      Spark商品推薦系統(tǒng)、用戶標(biāo)簽系統(tǒng)

      Spark產(chǎn)生動機與基本概念

      2.1 Spark產(chǎn)生背景,與MapReduce對比,其優(yōu)缺點是什么

      2.2 Spark核心概念

      (1)RDD

      (2)基本操作:transformation與 action

      2.2 Spark程序架構(gòu)

      (1)Driver/executor

      (2)容錯機制

      Spark安裝部署

      3.1 Spark運行模式簡介、standlone模式、Spark on yarn模式

      3.2 搭建一個spark on yarn集群、搭建yarn集群、運行第一個spark程序

      Spark程序設(shè)計實例

      4.1 Scala語言基礎(chǔ),常用語法以及庫函數(shù)

      4.2 Spark程序設(shè)計方法

      1.Spark程序基本構(gòu)成,SparkContext,RDD,transformation/action

      2.Spark API介紹

      (1) 如何創(chuàng)建RDD(scala集合,HDFS文件,HBase文件等)

      (2)如何基于RDD進(jìn)行數(shù)據(jù)處理,介紹常見的分布式算子

      (3)如何保存處理結(jié)果(返回到driver端,寫入hdfs等)

      (4)廣播變量與累加器

      4.3 Spark程序設(shè)計實例

      (1)分布式Pi估算程序

      (2)K-means分類算法實現(xiàn)

      (3)邏輯回歸算法實現(xiàn)

      Spark內(nèi)部原理

      5.1 Spark程序運行流程概述

      介紹Spark從提交,到調(diào)度,到最后執(zhí)行完成整個過程

      5.2 Spark內(nèi)部執(zhí)行流程

      介紹Spark程序內(nèi)部的邏輯查詢計劃,物理查詢計劃,調(diào)度等幾個環(huán)節(jié)

      5.3 Spark shuffle實現(xiàn)

      介紹Spark shuffle發(fā)展史及實現(xiàn)邏輯

      5.4 Spark算子的內(nèi)部機制

      以reduce By Key和group By Key為例介紹spark算子的內(nèi)部實現(xiàn)原理

      Spark與外部系統(tǒng)整合

      6.1 Spark與Kafka和flume結(jié)合

      介紹如何使用kafka和flume將數(shù)據(jù)導(dǎo)入hadoop中,以便使用spark處理

      6.2 Spark與Storm結(jié)合

      介紹如何使用spark實時處理數(shù)據(jù)

      6.3 Spark與HBase和HDFS結(jié)合

      介紹Spark如何與HBase和HDFS實現(xiàn)數(shù)據(jù)的讀寫交互

      6.4 Spark與關(guān)系型數(shù)據(jù)庫和hive結(jié)合

      介紹如何使用spark與關(guān)系型數(shù)據(jù)庫和hive結(jié)合

      Spark調(diào)優(yōu)方法

      Spark調(diào)優(yōu)思想、方法

      Spark案例分析

      基于Spark的商品推薦系統(tǒng),包括:項目背景、項目架構(gòu)、項目實施

      Spark Streaming應(yīng)用及案例分析

      8.1 Spark Streaming產(chǎn)生動機

      8.2 Spark Streaming程序設(shè)計

      (1)創(chuàng)建DStream

      (2)基于DStream進(jìn)行流式處理

      8.3 Spark Streaming容錯與性能優(yōu)化

      (1)Spark Streaming容錯機制

      (2)如何對spark Streaming進(jìn)行優(yōu)化

      8.4 Spark Streaming案例分析

      基于Spark Streaming的用戶標(biāo)簽系統(tǒng),內(nèi)容包括項目背景,項目架構(gòu)以及實施方法

      Spark SQL

      9.1 Spark SQL定位

      9.2 如何使用SparkSQL處理數(shù)據(jù)

      (1)使用SparkSQL處理HDFS上數(shù)據(jù)

      (2)使用SparkSQL處理Hive中的數(shù)據(jù)

      9.3 Spark SQL與Spark及Spark Streaming結(jié)合

      MLlib

      10. 介紹Spark的數(shù)據(jù)挖掘庫MLlib,重點介紹其內(nèi)部的幾個分類算法,聚類算法和推薦算法,包括邏輯回歸,K-Means,協(xié)同過濾等

      GraphX

      11. 介紹Spark內(nèi)部的圖計算框架GraphX,重點介紹它的基本原理及使用方法




  • 垂詢曙海客服