培訓內容:
?
一、?作為數據分析程序員,有必要掌握python這門語言;
a)?介紹python支持庫;
b)?Python對機器學習的重要推動作用。
二、?使用Jupyter notebook進行交互式計算和開發(fā)環(huán)境;
a)?配置、使用、運行和調試。
三、?Numpy數組和矢量計算;
a)?通用函數;
b)?線性代數運算操作;
c)?Numpy張量的文件輸入和輸出。
四、?Pandas數據結構
a)?匯總和統(tǒng)計計算;
b)?處理殘缺數據;
c)?層次化索引;
五、?數據的加載、存儲與文件格式;
a)?匯總和統(tǒng)計計算;
b)?處理殘缺數據;
c)?層次化索引;
六、?數據的加載、存儲與文件格式;
a)?讀取文本格式的數據;
b)?讀寫二進制數據;
c)?使用關系型數據庫;
七、?數據的去噪、轉換、合并、重塑
a)?合并數據集;
b)?重塑;
c)?數據矩陣變換;
d)?數據軸向旋轉;
e)?數據轉換;
f)?字符串操作。
八、?數據可視化;
a)?Matplotlib使用
b)?Pandas中的繪圖函數使用
c)?繪制地圖類表達數據
九、?數據的聚合和分組運算
a)?GroupBy技術
b)?數據聚合
c)?分組級運算和轉換
d)?透視表和交叉表
十、?時間序列
a)?日期和時間數據類型及工具;
b)?日期的范圍、頻率和移動;
c)?時期及算法運算;
d)?重采樣及頻率轉換;
e)?時間序列繪圖;
f)?移動窗口函數;
g)?性能和內存的優(yōu)化;
十一、?金融和經濟數據應用
a)?舉一個分組變換應用
十二、?Numpy高級應用
a)?Numpy內部工作機理;
b)?高級數組操作;
c)?結構化和記錄式數組;
d)?Numpy的matrix類;
e)?高級數組的輸入輸出。
十三、?通過神經網絡進行相關因素預測分析;
a)?CNN和RNN初識;
b)?相關因素時間序列預測分析示例。