?
課程目標(biāo):
通過該課程的學(xué)習(xí),學(xué)員應(yīng)能夠?qū)?/span>CUDA開發(fā)以及性能優(yōu)化有所了解;對于使用CUDA開發(fā)中常用的調(diào)試工具有很好的了解和把握;理解并能實(shí)現(xiàn)CUDA的深度優(yōu)化。課程會通過矩陣乘法和卷積計算兩種最常用的實(shí)例來充分展示優(yōu)化過程中的技巧和方法。
課程大綱:
| 
 主題 
 | 
 內(nèi)容 
 | 
| 
 ?CUDA入門 
 | 
 一:GPU并行計算 
二:深度學(xué)習(xí)與GPU 
三:CUDA環(huán)境搭建 
 | 
| 
 CUDA架構(gòu) 
 | 
 一:CUDA架構(gòu)演變歷史 
二:SM計算架構(gòu) 
三:存儲架構(gòu) 
 | 
| 
 CUDA編程 
 | 
 一:CUDA C 編程 
二:OPENMP介紹 
三:CUDA調(diào)試方法 
 | 
| 
 編程實(shí)例 
 | 
 一:矩陣乘法 
二:卷積計算 
 | 
| 
 CUDA優(yōu)化 
 | 
 一:CUDA通信 
二:多卡編程 
三:內(nèi)核優(yōu)化 
四:調(diào)優(yōu)工具使用 
 | 
| 
 CUDA常用優(yōu)化手段 
 | 
 一:并發(fā)優(yōu)化 
二:流優(yōu)化 
三:訪存優(yōu)化 
四:矩陣乘法實(shí)例 
五:卷積計算實(shí)例 
 | 
| 
 CUDA的高級優(yōu)化手段 
 | 
 一:指令流效率 
二:指令集優(yōu)化 
三:循環(huán)展開 
四:cache利用率 
 | 
以上課程可以根據(jù)客戶實(shí)際情況進(jìn)行靈活調(diào)整。