2025年12月31日 星期三

一個鬼故事,聊聊假設檢定、ANOVA、DOE與田口

這不是討論統計,更不是七月中聊鬼故事,而是聊一個使用者問題,就是應該怎樣選,應該怎樣用。

 前陣子,有人問了一個很經典的問題,讓小編寫了這篇鬼故事:

「HI,我怎麼知道這個問題用ANOVA就好,還是要做DOE呢?那田口方法又是什麼時候出場?」

一、先從假設檢定開始:先問清楚「要不要」調整

在談DOE和田口之前,其實多數問題都可以先收斂成一個簡單的統計問題:

「現在這幾組之間,有沒有差異?」

這就是假設檢定在做的事。

H₀ 虛無假設:大家都一樣(例如:三家供應商螺絲強度平均值相等)。
H₁ 對立假設:至少有一組不一樣。

典型流程可以濃縮成五步:

設定H₀、H₁,選定顯著水準α(例如0.05)。
選擇檢定法(t檢定、F檢定、卡方等)。
用樣本資料算出檢定統計量。

算出p值或查表,決定是否落在拒絕域。

若p < α,就拒絕H₀,判定「有差異」。
這一層的目的只有一個:先回答「要不要動」,還不急著討論「怎麼動」。

二、為什麼三組以上必須用ANOVA,而不是一直t檢定?

當只有兩組的時候,t檢定很好用:A vs B 一次搞定。

但如果有三家供應商 A、B、C,你若硬要用t檢定:

A vs B

A vs C

B vs C

三次下來,整體錯判機率會被放大,這就是所謂的Type I誤差膨脹。
**ANOVA(變異數分析)**做的事,是一次把所有組別一起看:

H₀:所有組的平均都相同

H₁:至少有一組平均不同

用 F 統計量來比較「組間變異」與「組內變異」的大小。

舉個簡化的例子:比較三家螺絲供應商的抗拉強度,每家各量5支:

供應商強度平均值 (kgf)
A121.8
B130.0
C114.8
ANOVA做完的結論可能長這樣:

F 值很大

p = 0.002 < 0.05 → 拒絕H₀

結論:三家供應商的平均強度「並不相同」。
到這裡,其實還在「判斷有沒有差」的階段,還沒進入DOE。

三、當因子變成很多個因子水準組合時,就自然走到DOE

上一段只有一個因子:「供應商」。
但真實現場多半長這樣:

射出成型:溫度、壓力、保壓時間、射速

塗佈製程:黏度、轉速、溫度、時間

封裝製程:壓力、時間、壓頭形狀、溫度

當你問的是:

「這幾個參數要怎麼搭配,才能讓品質最好?」

這就從單一因子的ANOVA,變成多因子問題,會自然走向:多因子ANOVA:同時看主效應與交互作用。
因子實驗 / DOE(Design of Experiments):設計一組有系統的實驗組合,再用ANOVA分析結果。
這時候的心態從「判斷有沒有差」,變成:「這幾個因子水準要怎麼設計,效果最好?」

四、DOE vs 田口方法:同家族的兩個小孩

很多工程師會問:「DOE 跟田口到底差在哪?用哪個才對?」

從實務角度看,可以把它們當成是「同一個實驗設計家族裡的兩個風格」:

1. 從目標來看:結構性 vs 穩健性

傳統DOE(全因子/部分因子) 比較適合:想看清楚主效應+交互作用。

想建立迴歸模型、做響應曲面(RSM)、做精細調參。

常用在研發前期,要理解機理、建模型。

田口方法 比較適合:目標是讓產品「對環境變動不敏感」,走穩健設計。

強調SN比、品質損失函數,在意的是「變異小、不NG」。
常見於量產製程改善、TPM專案等。

一句話:

想看清楚發生什麼事 → 傳統DOE。

不想怕環境亂七八糟、還要產品穩 → 田口方法。
2. 從因子數與實驗成本來看

判斷面向傳統DOE較適合田口方法較適合
因子數因子少(例如 ≤ 4–5 個)因子多(6–10 個)
實驗次數願意做多一些(2⁴ = 16 次)必須大幅壓縮(L8 / L16 約 8–16 次)
交互作用解析想要看清楚主效應+交互作用接受只看主要趨勢,部分交互被犧牲
成本考量成本中等,可接受重複試驗成本壓力大,每次試驗都很貴


五、再把「灰色地帶」說白:ANOVA之後怎麼選?

真正棘手的,是 ANOVA 已經幫你找出幾個重要因子後,你手上有 3–8 個可控因子,

這時候:「要用傳統DOE,還是直接上田口?」

這裡提供一個實務上很好用的三步判斷:

步驟1:你有多在意「交互作用的細節」?

若你一定要知道 A×B、B×C 的交互型態(例如之後要做RSM、建模型),
→ 傳統全因子DOE或解析度較高的部分因子設計,比較適合。
若你只在意「哪一組條件最穩定」,不太在意每個交互作用的精細解釋,
→ 田口直交表可以接受,用較少實驗找到比較好的參數組合。
步驟2:實驗成本、時間、樣品限制
若試驗成本不算太高(例如模擬、實驗室尺寸小樣本):
→ 可以偏向傳統DOE,多做一些實驗,換來更多資訊。
若每次試產都很貴(換模、停線、報廢成本驚人):
→ 用田口直交表大幅降實驗次數,會更合理。
步驟3:你的KPI語言是什麼?
KPI是「平均值達標、建立預測公式」
→ 傳統DOE / RSM語言:關心的是迴歸式、最佳化點。
KPI是「NG率下降、對環境/批次變動不敏感」
→ 田口語言:SN比、損失函數、穩健性設計。
這三點,用來教學生或帶工程師專案都很好用。
你甚至可以叫大家自己把目前專案寫上去,套這三個步驟當練習。

六、什麼時候「一定要」考慮田口參數設計?
如果你的問題符合下面幾項,就非常適合導入田口參數設計:

已經用DOE/ANOVA找出幾個關鍵可控因子(例如3–5個)。
現場品質變異多來自不可控雜訊(批次、溫溼度、機台差異、操作員)。
希望設計參數時,就把雜訊「刻意加入」來測試穩健性(內外陣列)。
在意的是「即使環境變動,產品也還穩」,而不是只在實驗室條件好看的平均值。
田口方法的典型做法是:

把因子分成「控制因子」與「雜訊因子」。

控制因子放在內陣列,雜訊因子放在外陣列。

計算不同控制因子組合在各種雜訊條件下的SN比,找出最穩的一組。

最後再微調平均值到目標規格中心。
這其實就是在做「參數設計」:讓設計一開始就考慮變異,而不是事後補救。

七、給工程師或學生的一句話總結
如果要用一句話送給現場工程師或學生,可以這樣說:
「想看清楚發生什麼事,用傳統DOE;不想怕環境亂七八糟,還要產品穩健,用田口方法。」
你可以先用 ANOVA 把問題收斂,再用這套判斷準則去選擇:這次專案到底是要走
結構導向」還是「穩健導向」。

職場毒癌:證照有沒有用,舉手提問

 小編鄭幾天被晚輩提問,考證照有用嗎? 小編整理三個面向 1.口糧 2.貴族 3.加值 這三個面向,作思考發想: 1.口糧:怎說是口糧呢!!!!!直接切入,這寫在履歷上有亮點?ai能否取代?? 最好例子就是駕照,人人會開車,這算技能;太直白會檔到很多人財路,但回到自我發展與規劃,...