實驗設計 (Design Of Experiment, 簡稱 DOE) ,是研究和處理多因數與回應變數關係的一種方法。它通過合理地挑選試驗條件,安排試驗,並通過對試驗資料的分析,從而建立回應與因數之間的函數關係,或者找出總體最優的改進方案。最基本的試驗設計方法是全因數試驗法,需要的試驗次數最多,其它試驗設計方法均以“減少試驗次數”為目的,例如部分因數試驗、正交試驗、均勻試驗等。
從上個世紀 20 年代育種科學家費雪 (RonaldFisher) 在農業試驗中首次提出 DOE 的概念, DOE 已經歷了 90 多年的發展歷程,在學術界和企業界均獲得了崇高的聲譽。然而,由於專業統計分析的複雜性和各行各業的差異性, DOE 在很多人眼中逐漸演變為可望而不可及的空中樓閣。其實, DOE 絕不是少數統計學家的專屬工具,它很容易成為各類工程技術人員的好朋友、好幫手。
一、為何要進行試驗設計
在進行6西格瑪項目的改進階段時,我們經常需要面對的一個問題是:在相當多的可能影響輸出Y的引數X中,確定哪些引數確實顯著地影響著輸出,如何改變或設置這些引數的取值會使輸出達到最佳值?
我們傳統使用的方法:將影響輸出的眾多輸入變數在同一次試驗中只變化一個變數,其他變數固定。
傳統方法的缺點:試驗週期長,浪費時間,試驗成本高;試驗方法粗糙,不能有效評估輸入間的相互影響。
可以有效克服上述缺點的試驗方法是:DOE
DOE取得的是突破性改善
試驗策劃時,研究如何以最有效的方式安排試驗,能有效識別多個輸入因素對輸出的影響;
試驗進行時,通過對選定的輸入因素進行精確、系統的人為調整來觀察輸出的變化情況;
試驗後通過對試驗結果的分析以獲取最多的資訊,得出“哪些引數X顯著地影響著輸出Y,這些X取什麼值時會使Y達到最佳值”的結論。
我們在分析階段使用回歸分析方法對歷史資料進行分析,獲得了相應的回歸方程,得到Y與各個X間的關係式。但這種關係的獲得是“被動”的,因為我們使用的是已有的現成的資料,幾乎無法控制適用範圍,無法控制方程的精確度,只能是處於“有什麼算什麼”的狀況。
我們採用DOE的方法,引數常取一些過去未曾取過的數值,並且進行精確的控制,對要研究的問題進行更廣泛的探索,目的是要取得突破性改善。
二、DOE的基本術語
2.1 因數:
影響輸出變數Y的輸入變數X稱為DOE中的因數。
可控因數:在實驗過程中可以精確控制的因數,可做為DOE的因數。
非可控因數:在實驗過程中不可以精確控制的因數,亦稱雜訊因數,不能作為DOE的因數。只能通過方法將其穩定在一定的水準上,並通過對整體試驗結果的分析,確定雜訊因數對試驗結果的影響程度。
可控因數對Y的影響愈大,則潛在的改善機會愈大。
在DOE的策劃階段,首先要識別可控因數和雜訊因數。
2.2 水準:
因數的不同取值,稱為因數的“水準”。
2.3 處理:
各因數按照設定的水準的一個組合,按照此組合能夠進行一次或多次試驗並獲得輸出變數的觀察值。
2.4 模型與誤差:
按照可控因數x1、X2、。。。XK建立的數學模型。
Y=F( x1、X2、。。。XK )+ε
誤差ε包含:由非可控因數所造成的試驗誤差。
失擬誤差(lack of fit):所採用的模型函數F與真實函數間的差異。
2.5 望大、望小、望目:
望大:希望輸出Y越大越好。
望小:希望輸出Y越小越好。
望目:希望輸出Y與目標值越接近越好。
2.6 主效應:
一個因數在不同水準下的變化導致輸出變數的平均變化。
因數的主效應=因數為高水準時輸出的平均值-因數為低水準時輸出的平均值。
交互效應:如果一個因數的效應依賴於其它因數所處的水準時,則稱兩個因數間有交互效應。
因數AB的交互效應=(B為高水準時A的效應- B為低水準時A的效應)/2。
三、試驗設計的基本原則
完全重複進行試驗的目的就是比較不同處理之間是否有顯著差異,而顯著性檢驗是拿不同總體間形成的差別與隨機誤差相比較,只有當各總體間的差別比隨機誤差顯著地大時,才說“總體間的差別是顯著的”,沒有隨機誤差的估計就無法進行任何統計推斷。
因此,在試驗的安排中,在處理相同的條件下一定要進行完全重複試驗,以獲得試驗誤差的估計。
注意:
一定要進行不同單元的完全重複,不能僅進行同單元的重複取樣
例如:在研究熱處理問題時,不能僅從同一次試驗中抽取不同的樣品進行性能測試,而應該對同一組試驗條件進行重新重複試驗;否則將會造成試驗誤差的低估。
隨機化
以完全隨機的方式安排各次試驗的順序和所有試驗單元。目的是防止那些試驗者未知的但可能會對響應變數產生某種影響的變數干擾對實驗結果的分析。
隨機化並沒有減少試驗誤差本身,但隨機化可以使不可控因素對實驗結果的影響隨機地分佈於各次試驗中。
區組化
實際工作中,各試驗單元間難免會有某些差異,如果可以按照某種方式進行分組,每組內可以保證差異較小,而允許區組間差異較大,可以很大程度上消除由於較大試驗誤差所帶來的分析上的不利。
能分區組者則分區組,不能分區組者則隨機化。
四、DOE的一般步驟
通過歷史資料或現場資料確定目前的過程能力;
確立試驗目標並確定衡量試驗輸出結果的變數;
重新評估優化後的過程能力;
確定可控因素和雜訊因素;
確定每個試驗因素的水準數和各水準的實際取值;並確定試驗計畫表;
驗證測量系統;
按照試驗計畫表進行試驗;並測量試驗單元的輸出;
分析資料,進行方差分析和回歸分析,找出主要因素並確定輸入和輸出 的關係式;
確認取得最好的輸出結果的因素水準的組合;
在此優化組合的因素水準上進行重複試驗以確認效果;
通過標準作業程式固定優化的條件,並進行控制;
五、DOE所用到到的最主要的工具
測量系統分析(MSA)
假設檢驗:看檢驗結果的P值,P值小於設定的顯著性水準(例如0.05)時判定要檢驗的兩總體間有顯著差異; P值大於設定的顯著性水準(例如0.05)時判定要檢驗的兩總體間沒有有顯著差異;
方差分析:看檢驗結果的P值,P值小於設定的顯著性水準(例如0.05)時判定要檢驗的多總體間有顯著差異; P值大於設定的顯著性水準(例如0.05)時判定要檢驗的多總體間沒有有顯著差異;
回歸分析:看檢驗結果的P值,P值小於設定的顯著性水準(例如0.05)時判定要檢驗的回歸項或回歸方程顯著(有效); P值大於設定的顯著性水準(例如0.05)時判定要檢驗的回歸項或回歸方程不顯著(無效);
六、DOE的類型
因數篩選設計:試驗目的是為了確定在相當多的引數中,哪些引數並不顯著地影響輸出並予以刪除,而保留那些顯著影響輸出的引數。
回歸設計:試驗目的是為了確定輸入與輸出之間的關係式,找出回歸方程。
七、DOE試驗7大步驟
第一步 確定目標
我們通過控制圖、故障分析、因果分析、失效分析、能力分析等工具的運用,或者是直接實際工作的反映,會得出一些關鍵的問題點,它反映了某個指標或參數不能滿足我們的需求,但是針對這樣的問題,我們可能運用一些簡單的方法根本就無法解決,這時候我們可能就會想到試驗設計。對於運用試驗設計解決的問題,我們首先要定義好試驗的目的,也就是解決一個什麼樣的問題,問題給我們帶來了什麼樣的危害,是否有足夠的理由支持試驗設計方法的運作,我們知道試驗設計必須花費較多的資源才能進行,而且對於生產型企業,試驗設計的進行會打亂原有的生產穩定次序,所以確定試驗目的和試驗必要性是首要的任務。隨著試驗目標的確定,我們還必須定義試驗的指標和接受的規格,這樣我們的試驗才有方向和檢驗試驗成功的度量指標。這裡的指標和規格是試驗目的的延伸和具體化,也就是對問題解決的著眼點,指標的達成就能夠意味著問題的解決。
第二步 剖析流程
關注流程,使我們應該具備的習慣,就像我們的很多企業做水準對比一樣,經常會有一個誤區,就是只講關注點放在利益點上,而忽略了對流程特色的對比,試驗設計的展開同樣必須建立在流程的深層剖析基礎之上。任何一個問題的產生,都有它的原因,事物的好壞、參數的變異、特性的欠缺等等都有這個特點,而諸多原因一般就存在於產生問題的流程當中。流程的定義非常的關鍵,過短的流程可能會拋棄掉顯著的原因,過長的流程必將導致資源的浪費。我們有很多的方式來展開流程,但有一點必須做到,那就是盡可能詳盡的列出可能的因素,詳盡的因素來自於對每個步驟地詳細分解,確認其輸入和輸出。其實對於流程的剖析和認識,就是改善人員瞭解問題的開始,因為並不是每個人都能掌握好我們所關注的問題。這一步的輸出,使我們的改善人員能夠瞭解問題的可能因素在哪裡,雖然不能確定哪個是重要的,但我們至少確定一個總的方向。
第三步 篩選因素
流程的充分分析,是我們有了非常寶貴的資料,那就是可能影響我們關注指標的因素,但是到底哪個是重要的呢?我們知道,對一些根本就不或微小影響因素的全面試驗分析,其實就是一種浪費,而且還可能導致試驗的誤差。因此將可能的因素的篩選就有必要性,這時,我們不需要確認交互作用、高階效應等問題,我們的目的是確認哪個因素的影響是顯著的。我們可以使用一些低解析度的兩水準試驗或者專門的篩選試驗來完成這個任務,這時的試驗成本也將最小處理。而且對於這一步任務的完成,我們可以應用一些歷史資料,或者完全可靠的經驗理論分析,來減少我們的試驗因數,當然要注意一點就是,只要對這些資料或分析有很小的懷疑,為了試驗結果的可靠,你可以放棄。篩選因素的結果,使得我們掌握了影響指標的主要因素,這一步尤為關鍵,往往我們在現實中是通過完全的經驗分析得出,甚至抱著可能是的態度。
第四步 快速接近
我們通過篩選試驗找到了關鍵的因素,同時篩選試驗還包含一些很重要的資訊,那就是主要因素對指標的影響趨勢,這是我們必須充分利用的資訊,它可以説明我們快速的找到試驗目的的可能區域,雖然不是很確定,但我們縮小了包圍圈。這時我們一般使用試驗設計中的快速上升(下降)方法,它是根據篩選試驗所揭示的主要因素的影響趨勢來確定一些水準,進行試驗,試驗的目的就像我們在尋找罪犯一樣的縮小嫌疑範圍,我們得出的一個結論就是,我們的改善最優點就在因素的最終反映的水準範圍內,我們離成功更近了一步。
第五步 析因試驗
在篩選試驗時我們沒有強調因素間的交互作用等的影響,但給出了主要的影響因素,而且快速接近的方法,使我們確定了主要因素的大致取值水準,這時我們就可以進一步的度量因素的主效應、交互作用以及高階效應,這些試驗是在快速接近的水準區間內選取得,所以對於最終的優化有顯著的成效,析因試驗主要選擇各因素構造的幾何體的頂點以及中心點來完成,這樣的試驗構造,可以幫助我們確定對於指標的影響,是否存在交互作用或者那些交互作用,是否存在高階效應或者哪些高階效應,試驗的最終是通過方差分析來檢定這些效應是否顯著,同時對以往的篩選、快速接近試驗也是一個驗證,但我們不宜就在這樣的試驗基礎上就來描述指標與諸主效應的詳細關係,因為對於3個水準點的選取,試驗功效會有不足的可能性。
第六步 回歸試驗
我們在析因試驗中,確定了所有因素與指標間的主要影響項,但是考慮到功效問題,我們需要進一步的安排一些試驗來最終確定因素的最佳影響水準,這時的試驗只是一個對析因試驗的試驗點的補充,也就是還可以利用析因試驗的試驗資料,只是為了最終能夠優化我們的指標,或者說有效全面的構建因素與水準的相應曲面和等高線,我們增加一些試驗點來完成這個任務。試驗點一般根據回歸試驗的旋轉性來選取,而且它的水準應該根據功效、因數數、中心點數等方面的合理設置,以確保回歸模型的可靠性和有效性。這些試驗的完成,我們就可以分析和建立起因素和指標間的回歸模型,而且可以通過優化的手段來確定最終的因數水準設定。當然為了保險起見,我們最後在得到最佳參數水準組合後進行一些驗證試驗來檢驗我們的結果。
第七步 穩健設計
我們知道,試驗設計的目的就是希望通過設置我們可以調控的一些關鍵因素來達到控制指標的目的,因為對於指標來講我們是無法直接控制的,試驗設計提供了這種可能和途徑,但是在現實中卻還存在一類這樣的因素,它對指標影響同樣的顯著,但是它很難通過人為的控制來確保其影響最優,這類因素我們一般稱為雜訊因素,它的存在往往會使我們的試驗成果功虧一簣,所以對待它的方法,除了儘量的控制之外可以選用穩健設計的方法,目的是這些因素的影響降低至最小,從而保證指標的高優性能。事實上這些因素是普遍存在的,例如我們的汽車行駛的路面,不可能保證都是在高級公路上,那麼對於一些差的路面,我們怎樣來設計出高性能呢?這時我們會選擇出一些抗干擾的因素來緩解干擾因素的影響,這就是穩健設計的意圖和途徑。通常我們會經常使用在設計和研發階段,但有時也會隨著問題的產生而暴露出來,但我們會提出一個問題了,重新選定主要因素的水準會不會帶來指標的振盪和劣化,這是完全有可能的,但我們可以通過EVOP等途徑來重新設定以保證因素更改後的輸出效果。
小結:
1.試驗設計需要成本的投入,我們必須確定試驗進行的必要性,以及選取最優的設計方案。
2.水準的選取可能直接影響試驗設計的結果,要謹慎的選取,最後有專業知識和歷史資料的支援。
3.盡可能的利用一些歷史資料,在確認可靠後提取對我們試驗有用的資訊,來儘量減少試驗投資和縮短試驗週期。
4.試驗設計並不能提供解決所有問題的途徑,現實當中的局限驗證了這一點,我們要全面考慮解決問題的方式,選取最有效、最經濟的解決途徑。
5.注意充分的分析流程,不要遺漏關鍵的因素,不要被一些經驗論的不可能結論左右。
6.除了試驗設計涉及的因素外,要儘量確定所有的環境因素是穩定和符合現實的,往往會做不到這一點,我們可以用隨機化、區組化來儘量避免。
7.注意結果的驗證和控制,不要輕信結果。
8.儘量保證試驗的模擬性,避免一些理想的試驗環境,比如試驗室,理想不現實的環境是的試驗可能根本就沒有作用。
9.試驗設計者要關注試驗過程,保證試驗意圖和方案的徹底執行。
10.如果實現一步到位的試驗設計是可能的,那就不要猶豫的開展吧,上面的七步只是針對普通的情況。
八、案例分享
案例一:
主要因數: 1 )加工爆玉米花的時間(介於 3 至 5 分鐘之間); 2 )微波爐使用的火力(介於 5 至 10 檔之間); 3 )使用的玉米品牌( A 或 B )。
回應:玉米的 " 爆開個數 " 或“爆開率”。
在爆玉米花時,我們希望所有(或幾乎所有)的玉米粒都爆開了,沒有(或很少)玉米粒未爆開,這是最終關注的重點。
試驗設計的主線是根據因數的取值範圍,進行多種參數組合,如下圖為兩水準試驗組合,形成多次試驗的方案,依次進行試驗後,通過試驗結果分析,確定哪一種參數組合是最優的。
利用最小二乘法等擬合方法,建立響應與多個因數之間的數學模型,亦稱響應面模型。
最終通過試驗設計確定:使用 A 品牌,加工 5 分鐘,並將火力調為 6.96 級。試驗預測在此種設置下加工,產出的玉米粒 445 個全部都爆開了。
本文的試驗既可以是實物試驗,也可以是模擬,在可靠性設計分析中,試驗設計常用于解決無法建立顯式的可靠性模型等問題,起到事半功倍的作用。
案例二:
DOE在生活中如何應用?
之前在網上看過一個叫《三個羅密歐與一個茱麗葉》的DOE案例,摘錄下來跟大家分享,通過這個案例,我們能很容易地理解什麼是DOE,瞭解到其遵循的三項基本原則: 均衡性(Balanced)、隨機性(Randomization)和重複性(Replication) 。同時也能體會到使用DOE其實並不需要什麼高深的技術,人人都可掌握,甚至在日常生活中也可以運用。
這個案例是Symphony Technologies公司執行總監Ravi與他兩位朋友Naren和Deepak的真實故事,他們當年通過試驗設計的方法發現了女孩Renu對Deepak情有獨鍾,最後他倆真的喜結連理,成就一世佳緣。
聰聰、明明和帥帥在大學時每天都一塊上學。一個陽光明媚的早上,他們經過一家別墅時,一個叫麗麗的女孩沖出了家門,留給了他們一個含情脈脈的微笑。哇!真漂亮啊!他們驚呆了,三個年輕人很慶倖他們的重大發現,相約每天同一時間經過這棟別墅。他們都喜歡上了麗麗,並且想追求她,但理性告訴他們,麗麗只是喜歡他們中的某一位。他們很想知道這個女孩到底喜歡誰?但都不好意思直接去問。於是,他們發揮聰明才智,設計並實施了一系列實驗來確定麗麗所鍾情的物件……
他們按設定的方式單獨、兩兩或三人同時經過麗麗的家門口,測試麗麗的反應,以便確認麗麗到底喜歡誰。
DOE是研究如何制定試驗方案,以提高試驗效率,縮小隨機誤差的影響,並使試驗結果能有效地進行統計分析的理論與方法。在這個案例中有 三個因數(Factor) :聰聰、明明和帥帥,在試驗中所有因數都有計劃地被故意改變,並測量每次試驗組合時的回應;當事人有兩種狀態:在場和不在場,這種因數被故意改變的狀態就稱為 水準(Level) 。一個有效的試驗設計可以在同一次試驗中改變多個因數,這將大大降低試驗的次數,而且能夠獲得足夠的資訊使結果可信。
測量的目標變數叫 響應(Response) ,它被表達為麗麗是否出現。而回應的不同稱為 效應(Effect) ,可以用上述的分析圖來表示。這個案例中所進行的試驗是 均衡的(Balanced) ,因為每個人在每種狀態下被測試的次數是一樣的,這樣有助於其公平性。
而不同人員組合的出場順序是通過擲骰子 隨機的(Randomization) 決定的,非隨機性的試驗中外部因素會以系統性的方式影響到回應的結果,這種風險就是 噪音(Noise) 。試驗進行了兩周,是為了滿足其 重複性(Replication) 的要求,這樣可以得到更多的資訊,有利於提高評估結果的可信度,但過多的重複次數顯然會增加試驗過程的成本。
回頭再看看兩個周日的試驗出了什麼差錯呢?為什麼麗麗對帥帥的出現沒有作出回應呢?原來,在第一個周日,麗麗的父親因為瑣事將她關在了屋子裡。麗麗的父親是這次試驗中不可控制的外部因素,它會隨機地突然出現,影響麗麗的回應從而混淆試驗結果。看來用 潛在變數(Lurking Variable) 定義麗麗的父親最合適不過了。在第二個周日,麗麗因為心情不好而沒有如期出現。畢竟她是人,不能期望她的行為總是保持與統計的規律一致,這就是在試驗中經常會遇到的 試驗誤差(Experimental Error) 。
DOE固然是一種高級的品質工具,也的確有著非常複雜和龐大的理論系統和統計知識,要說懂,絕非易事。但我們沒有必要去崇拜或者懼怕它,在品質管理的過程中,我們的目的是為了解決問題,而不是做學問搞研究,只要結合實際的需求,把握住其應用本質,在荊棘叢生的路,也終究會豁然開朗,柳暗花明。
課程介紹: http://www.musigmagroup.com/tw/showser-123.html