2026-05-18

📊 邏輯回歸 (Logistic Regression)

邏輯回歸是一種用於二元分類問題的統計模型,透過對輸入變數進行線性組合後,利用邏輯斯函數(sigmoid函數)將結果映射到介於0與1之間的機率值。

重要概念

其中 為線性組合。

其中 。

程式設計實作要點

步驟 說明
數據預處理 特徵標準化、缺失值處理
初始化參數 初始權重和偏差設為零或小的隨機值
計算預測值 使用邏輯斯函數將線性組合映射成機率
計算損失 使用交叉熵損失函數
參數更新 使用梯度下降或其他優化法則調整參數
迭代訓練 重複計算預測和更新參數直到收斂
預測分類 根據機率閾值(通常為0.5)判斷分類結果

📉 殘差分析 (Residual Analysis)

殘差是指模型預測值與實際觀察值之間的差異,用於評估模型的擬合程度與診斷潛在問題。

重要定義與計算

其中 是第 筆觀測值, 是模型預測值。

比喻說明

殘差就像是射箭時箭矢與靶心的偏差,透過分析偏差大小與方向,了解射箭技術的準確度與穩定性。


🌲 隨機森林樹 (Random Forest)

隨機森林是一種集成學習方法,透過建造多棵決策樹(Decision Trees)並進行投票或平均,提升預測的穩定性與準確性。

主要特點

重要參數

參數名稱 功能說明
樹的數量 決定森林中決策樹的數量,影響模型穩定性與效能
最大深度 控制每棵樹的最大深度,避免過度擬合
特徵選擇數目 每個節點分裂時考慮的特徵數量,增強隨機性
節點最小樣本數 控制葉節點包含的最小樣本數,避免過細分裂

程式設計實作要點

  1. 實作Bootstrap抽樣,建立多個不同訓練子集。

  2. 實作決策樹生成過程,且在分裂時隨機選取部分特徵。

  3. 對多棵樹結果進行集成(投票或平均)。

  4. 評估模型準確率及過擬合狀況。


🔍 奇異值分解 (Singular Value Decomposition, SVD)

奇異值分解是一種矩陣分解技術,將任意矩陣分解為三個矩陣的乘積,用於降維、特徵提取和資料壓縮。

定義與公式

給定一個矩陣 ,其奇異值分解為:

重要應用

程式設計實作要點


🧑‍💻 術科考試程式設計建議

主題 重要考點 程式設計要點說明
邏輯回歸 損失函數計算、梯度下降更新、機率輸出 實作邏輯斯函數,交叉熵損失計算,迭代更新參數
殘差分析 殘差計算與繪製 計算預測值與實際值差異,繪製殘差圖檢視模型擬合
隨機森林 Bootstrap抽樣、決策樹生成、特徵隨機選擇、投票集成結果 程式實現多棵樹訓練,隨機子集特徵分裂,集成最終預測
奇異值分解 (SVD) 矩陣分解公式、降維、奇異值排序 調用SVD函數,選取主要奇異值及向量,重建近似矩陣

例:邏輯回歸核心程式流程

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

def compute_loss(X, y, theta):
    m = len(y)
    h = sigmoid(np.dot(X, theta))
    loss = - (1/m) * (np.dot(y, np.log(h)) + np.dot((1-y), np.log(1-h)))
    return loss

def gradient_descent(X, y, theta, lr, iterations):
    m = len(y)
    for _ in range(iterations):
        h = sigmoid(np.dot(X, theta))
        gradient = np.dot(X.T, (h - y)) / m
        theta -= lr * gradient
    return theta
Powered by Forestry.md