
python數據分析入門與實戰培訓
(一)numpy庫
NumPy庫是Python的一種開源的數值計算擴展。NumPy的學習對于數據分析、數據建模、機器學習具有重要的意義。
(二)pandas庫
pandas 是基于NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型,提供了高效地操作大型數據集所需的工具。
(三)數據分析繪圖
本課程通過基于matplotlib的pandas繪圖,講解常見的線圖、直方圖、柱狀圖、散點圖、餅圖等的畫法。
(四)Jupyter Notebook
Jupyter Notebook是一個數據分析和編寫代碼的好工具。
【實踐案例】
本課程講解以下實踐案例:
(一)全球空難數據的分析
(二)共享單車騎行數據的分析
(三)谷歌股票趨勢技術分析
(四)人力資源數據分析
第1節
數據分析1-搭建和使用科學計算環境
搭建和使用科學計算環境
第2節
Numpy的數據結構和數據索引
第3節
Numpy的運算和通用函數
第4節
Pandas的數據結構 - Series簡介
第5節
Pandas的數據結構 - DataFrame的創建和索引
第6節
DataFrame的數據觀察、排序及缺失值的處理
第7節
DataFrame的數據匯總統計方法
第8節
數據的加載與存儲
第9節
數據的合并
第10節
數據的轉換、重復數據處理、字符串操作和數據的離散化
第11節
數據的聚合與分組運算
第12節
實踐案例 - 1908年以來空難數據的分析
第13節
實踐案例 - 人力資源數據分析
第14節
數據分析繪圖
第15節
實踐案例 - 共享單車騎行數據分析
第16節
時間序列基礎
第17節
時間序列的重采樣
第18節
實踐案例 - 谷歌股票趨勢分析