Python及數(shù)據(jù)分析培訓(xùn)大綱
1.Python概覽
1.1為什么使用Python
1.2重要的Python庫
NumPy
Pandas
SciPy
Matplotlib
1.3IPython
1.4 Python IDE的下載與安裝
2.Python語言快速入門
2.1Python解釋器
2.2語言設(shè)計特點
2.3對象的調(diào)用和屬性
2.4import引入
2.5數(shù)據(jù)類型
2.6控制流
2.7數(shù)據(jù)結(jié)構(gòu)和序列
2.8函數(shù)
2.9 文件和操作系統(tǒng)
3.IPython使用
3.1啟動和運行
3.2對象內(nèi)省
3.3異常和跟蹤
3.4與操作系統(tǒng)交互
3.5測試代碼執(zhí)行時間
3.6IPython HTML Notebook
3.7利用IPython提高代碼效率的幾點提示
4.NumPy 4.1ndarray多維數(shù)組對象處理與運算
4.2元素級數(shù)組函數(shù)
4.3利用數(shù)組進(jìn)行數(shù)據(jù)處理
4.4利用數(shù)組進(jìn)行輸入和輸出
4.5線性代數(shù)
4.6隨機(jī)數(shù)生成
5.Pandas 5.1Pandas數(shù)據(jù)結(jié)構(gòu)介紹
5.2基本功能
5.3匯總和計算描述統(tǒng)計
5.4處理缺失數(shù)據(jù)
6.Pandas數(shù)據(jù)加載和存儲
6.1讀寫結(jié)構(gòu)化數(shù)據(jù)
6.2讀寫非結(jié)構(gòu)化數(shù)據(jù)
6.3使用HTML和Web API
6.4使用數(shù)據(jù)庫
7.Pandas數(shù)據(jù)預(yù)處理
7.1合并數(shù)據(jù)集(以merge和append為主)
7.2重塑和軸向旋轉(zhuǎn)
7.3數(shù)據(jù)清洗
7.4字符串操作
8.Pandas數(shù)據(jù)聚合與分組運算 8.1GroupBy技術(shù)
8.2數(shù)據(jù)聚合
8.3分組運算和轉(zhuǎn)換
8.4透視表和交叉表
9.繪圖與可視化 9.1Matplotlib基本操作
9.2Pandas中的繪圖函數(shù)
10.時間序列
10.1日期和時間數(shù)據(jù)類型及工具
10.2 時間數(shù)據(jù)處理
10.3 時期及其算術(shù)運算
10.4 時間序列繪圖
10.5 移動窗口函數(shù)
11.Python在金融數(shù)據(jù)中的應(yīng)用
11.1常見的金融數(shù)據(jù)處理與分析
11.2 Pyfolio資產(chǎn)組合表現(xiàn)與風(fēng)險分析
11.3 Zipline歷史數(shù)據(jù)回溯分析
12.大數(shù)據(jù)平臺的搭建和應(yīng)用
12.1Hadoop和MapReduce
12.2 Spark
12.3 PySpark及MLlib
12.4【案例與演示】
13.Scikit-Learn機(jī)器學(xué)習(xí)
13.1數(shù)據(jù)預(yù)處理
13.2 變量升維和降維
13.3 模型訓(xùn)練
13.4模型選擇和調(diào)參
13.5 模型評估指標(biāo) |