?
課程目標(biāo):
通過該課程的學(xué)習(xí),學(xué)員應(yīng)能夠?qū)?/span>CUDA開發(fā)以及性能優(yōu)化有所了解;對(duì)于使用CUDA開發(fā)中常用的調(diào)試工具有很好的了解和把握;理解并能實(shí)現(xiàn)CUDA的深度優(yōu)化。課程會(huì)通過矩陣乘法和卷積計(jì)算兩種最常用的實(shí)例來充分展示優(yōu)化過程中的技巧和方法。
課程大綱:
|
主題
|
內(nèi)容
|
|
?CUDA入門
|
一:GPU并行計(jì)算
二:深度學(xué)習(xí)與GPU
三:CUDA環(huán)境搭建
|
|
CUDA架構(gòu)
|
一:CUDA架構(gòu)演變歷史
二:SM計(jì)算架構(gòu)
三:存儲(chǔ)架構(gòu)
|
|
CUDA編程
|
一:CUDA C 編程
二:OPENMP介紹
三:CUDA調(diào)試方法
|
|
編程實(shí)例
|
一:矩陣乘法
二:卷積計(jì)算
|
|
CUDA優(yōu)化
|
一:CUDA通信
二:多卡編程
三:內(nèi)核優(yōu)化
四:調(diào)優(yōu)工具使用
|
|
CUDA常用優(yōu)化手段
|
一:并發(fā)優(yōu)化
二:流優(yōu)化
三:訪存優(yōu)化
四:矩陣乘法實(shí)例
五:卷積計(jì)算實(shí)例
|
|
CUDA的高級(jí)優(yōu)化手段
|
一:指令流效率
二:指令集優(yōu)化
三:循環(huán)展開
四:cache利用率
|
以上課程可以根據(jù)客戶實(shí)際情況進(jìn)行靈活調(diào)整。