香港二樓書店 > 東京大學資料科學家養成全書：使用Python動手學習資料分析

序言

【Chapter 1 ?本書的概要與Python的基礎】

▌1-1 ?資料科學家的工作

1-1-1 資料科學家的工作

1-1-2 資料分析的流程

1-1-3 本書的架構

1-1-4 對閱讀本書有幫助的文獻

1-1-5 動手來學習吧

▌1-2 ?Python的基礎

1-2-1 Jupyter Notebook的使用方法

1-2-2 Python的基礎

1-2-3 串列型別與字典型別

1-2-4 條件分歧與迴圈

1-2-5 函式

1-2-6 類別與實例

【Chapter 2 ?科學計算、資料加工、圖形描繪函式庫的使用方法基礎】

▌2-1 ?用於資料分析的函式庫

2-1-1 函式庫的匯入

2-1-2 Magic Command

2-1-3 匯入用於本章的函式庫

▌2-2 ?Numpy的基礎

2-2-1 Numpy的匯入

2-2-2 陣列的操作

2-2-3 亂數

2-2-4 矩陣

▌2-3 ?Scipy的基礎

2-3-1 Scipy的函式庫匯入

2-3-2 矩陣運算

2-3-3 牛頓法

▌2-4 ?Pandas的基礎

2-4-1 Pandas的函式庫匯入

2-4-2 Series的使用方法

2-4-3 DataFrame的使用方法

2-4-4 行列的操作

2-4-5 資料的抽出

2-4-6 資料的刪除與結合

2-4-7 統計

2-4-8 值的排序

2-4-9 nan (null)的判斷

▌2-5 ?Matplotlib的基礎

2-5-1 使用Matplotlib的準備工作

2-5-2 散佈圖

2-5-3 圖形的分割

2-5-4 函數圖形的描繪

2-5-5 直方圖

【Chapter 3? 敘述統計與簡單迴歸分析】

▌3-1 ?統計分析的種類

3-1-1 敘述統計與推論統計

3-1-2 匯入用於本章的函式庫

▌3-2 ?資料的讀取與對話

3-2-1 讀取網路等處公開的對象資料

3-2-2 資料的讀取與確認

3-2-3 確認資料的性質

3-2-4 量的資料與質的資料

▌3-3 ?敘述統計

3-3-1 直方圖

3-3-2 平均、中位數、眾數

3-3-3 變異數、標準差

3-3-4 摘要統計量與百分位數

3-3-5 箱型圖

3-3-6 變異係數

3-3-7 散佈圖與相關係數

3-3-8 描繪所有變數的直方圖與散佈圖

▌3-4 ?簡單迴歸分析

3-4-1 簡單線性迴歸分析

3-4-2 決定係數

【Chapter 4 ?機率與統計的基礎】

▌4-1 ?學習機率與統計的準備工作

4-1-1 本章的背景知識

4-1-2 匯入用於本章的函式庫

▌4-2 ?機率

4-2-1 數學機率

4-2-2 統計機率

4-2-3 條件機率與乘法定理

4-2-4 獨立與相關

4-2-5 貝氏定理

▌4-3 ?機率變數與機率分布

4-3-1 機率變數、機率函數、分布函數、期望值

4-3-2 各種分布函數

4-3-3 核密度函數

▌4-4 ?應用：多元機率分布

4-4-1 聯合機率函數與邊際機率函數

4-4-2 條件機率函數與條件期望值

4-4-3 獨立的定義與連續分布

▌4-5 ?推論統計學

4-5-1 大數法則

4-5-2 中央極限定理

4-5-3 樣本分布

▌4-6 ?統計推論

4-6-1 估計量與點估計

4-6-2 無偏性與一致性

4-6-3 區間估計

4-6-4 計算估計量

▌4-7 ?統計檢驗

4-7-1 檢驗

4-7-2 第一型錯誤與第二型錯誤

4-7-3 檢驗大數據的注意事項

【Chapter 5 ?使用Python進行科學計算（Numpy與Scipy）】

▌5-1 ?概要與事前準備

5-1-1 本章的概要

5-1-2 匯入用於本章的函式庫

▌5-2 ?使用Numpy計算之應用

5-2-1 索引的參照

5-2-2 Numpy的運算處理

5-2-3 ?陣列操作與廣播

▌5-3 ?使用Scipy計算之應用

5-3-1 內插

5-3-2 線性代數：矩陣分解

5-3-3 積分與微分方程式

5-3-4 最佳化

【Chapter 6 ?使用Pandas進行資料加工處理】

▌6-1 ?概要與事前準備

6-1-1 匯入用於本章的函式庫

▌6-2 ?Pandas的基本資料操作

6-2-1 階層型索引

6-2-2 資料的結合

6-2-3 資料的操作與變換

6-2-4 資料的聚合與群組運算

▌6-3 ?遺漏資料與異常值處理的基礎

6-3-1 遺漏資料的處理方法

6-3-2 異常資料的處理方法

▌6-4 ?時間序列資料處理的基礎

6-4-1 時間序列資料的處理與變換

6-4-2 移動平均

【Chapter 7 ?使用Matplotlib進行資料視覺化】

▌7-1 ?資料的視覺化

7-1-1 關於資料的視覺化

7-1-2 匯入用於本章的函式庫

▌7-2 ?資料視覺化的基礎

7-2-1 長條圖

7-2-2 圓形圖

▌7-3 ?應用：金融資料的視覺化

7-3-1 將金融資料視覺化

7-3-2 顯示K線的函式庫

▌7-4 ?應用：思考分析結果的表現方式

7-4-1 關於資料製作的重點

【Chapter 8 ?機器學習的基礎（監督式學習）】

▌8-1 ?機器學習概觀

8-1-1 何謂機器學習？

8-1-2 監督式學習

8-1-3 非監督式學習

8-1-4 強化學習

8-1-5 匯入用於本章的函式庫

▌8-2 ?多元線性迴歸

8-2-1 讀取汽車售價資料

8-2-2 資料的整理

8-2-3 模型建構與評估

8-2-4 模型建構與模型評估流程總結

▌8-3 ?邏輯迴歸

8-3-1 邏輯迴歸的範例

8-3-2 資料的整理

8-3-3 模型建構與評估

8-3-4 藉由縮放來提高預測準確度

▌8-4 ?具正則化項的迴歸：Lasso迴歸、Ridge迴歸

8-4-1 Lasso迴歸、Ridge迴歸的特徵

8-4-2 多元線性迴歸與Ridge迴歸的比較

▌8-5 ?決策樹

8-5-1 蕈類資料集

8-5-2 資料的整理

8-5-3 熵：不純度的指標

8-5-4 資訊獲利：測量分歧條件的有用性

8-5-5 決策樹的模型建構

▌8-6 ?k-NN（K最近鄰演算法）

8-6-1 k-NN的模型建構

▌8-7 ?支援向量機

8-7-1 支援向量機的模型建構

【Chapter 9 ?機器學習的基礎（非監督式學習）】

▌9-1 ?非監督式學習

9-1-1 非監督式模型的種類

9-1-2 匯入用於本章的函式庫

▌9-2 ?聚類分析

9-2-1 k-means法

9-2-2 使用k-means法進行聚類分析

9-2-3 將金融市場行銷資料進行聚類分析

9-2-4 使用手肘法判斷群數

9-2-5 聚類分析結果的解釋

9-2-6 k-means法以外的手法

▌9-3 ?主成分分析

9-3-1 嘗試主成分分析

9-3-2 主成分分析的實例

▌9-4 ?購物籃分析與關聯規則

9-4-1 何謂購物籃分析？

9-4-2 讀取用來進行購物籃分析的樣本資料

9-4-3 關聯規則

【Chapter 10 ?模型的驗證方法與性能調校方法】

▌10-1 ?模型的評估與提高精確度的方法

10-1-1 機器學習的問題與手法

10-1-2 匯入用於本章的函式庫

▌10-2 ?模型的評估與性能調校

10-2-1 Holdout法與交叉驗證法

10-2-2 性能調校：超參數的調校

10-2-3 性能調校：特徵的處理

10-2-4 模型的種類

▌10-3 ?模型的評估指標

10-3-1 分類模型的評估：混淆矩陣與關聯指標

10-3-2 分類模型的評估：ROC曲線與AUC

10-3-3 迴歸模型的評估指標

▌10-4 ?集成學習

10-4-1 Bagging

10-4-2 Boosting

10-4-3 隨機森林、梯度Boosting

10-4-4 進一步了解

【Chapter 11 ?綜合練習問題】

▌11-1 ?綜合練習問題

11-1-1 綜合練習問題(1)

11-1-2 綜合練習問題(2)

11-1-3 綜合練習問題(3)

11-1-4 綜合練習問題(4)

11-1-5 綜合練習問題(5)

11-1-6 綜合練習問題(6)

11-1-7 參考：今後進行資料分析

【Appendix】

▌A-1 ?關於本書的環境建置

A-1-1 關於Anaconda

A-1-2 下載Anaconda的套件

A-1-3 安裝Anaconda

A-1-4 安裝pandas-datareader與Plotly

▌A-2 ?練習問題解答

A-2-1 Chapter1練習問題

A-2-2 Chapter2練習問題

A-2-3 Chapter3練習問題

A-2-4 Chapter4練習問題

A-2-5 Chapter5練習問題

A-2-6 Chapter6練習問題

A-2-7 Chapter7練習問題

A-2-8 Chapter8練習問題

A-2-9 Chapter9練習問題

A-2-10 Chapter10練習問題

A-2-11 Chapter11綜合練習問題

▌A-3 ?參考文獻、參考URL

A-3-1 參考文獻

A-3-2 參考URL

結語

?