AI 驅動文件
您想了解什麼?
第四步:訓練您的 AI 模型
您的感興趣區域 (ROI) 已經設定完畢。現在該教 AI 識別什麼是"良好"和"不良"了。
訓練的三條基本準則
在開始任何工作之前,請牢記這三條準則。無論您是訓練分類器還是分割器,無論使用 5 張還是 500 張影象,這些準則都適用。
準則 1:僅從影象進行標註
絕不透過檢視實際零件(或將其放在顯微鏡下)來判斷它是好還是壞。如果您無法在相機影象中看到缺陷,AI 就無法學習它。
AI 並非魔法。它只能基於相機所見進行工作。如果您因為透過觸控零件或在放大鏡下放大觀察發現了某個特徵而將其標註為"缺陷",但相機影象看起來正常,那麼您是在教 AI 識別根本不存在的東西。
如果您無法僅從影象標註它,請返回安裝步驟,修復物理設定:更好的鏡頭、更好的光照、更近的安裝位置或不同的角度。
準則 2:反覆檢查您的標籤
每個人都會出現標籤錯誤;即使是經驗豐富的工程師也不例外。但在小資料集中,一個錯誤的標籤就可能毀掉您的結果。
如果只有 5 張訓練影象,一個標籤錯誤就會汙染**20%**的訓練資料。這是災難性的。
在每次訓練執行之前: 點選 View All ROIs,驗證每一個標註。這是最容易修復且影響最大的事情。
準則 3:從小處著手,快速迭代
不要標註 50 張影象後就直接開始訓練。相反,建立一個緊密的迴圈:每個類別標註 10-15 張影象,訓練(約 30 秒),測試並嘗試找出失敗案例,然後在失敗的地方新增針對性的資料。重複此迴圈 2-4 次。
這個迴圈是您獲得良好模型的最快路徑。
分步訓練工作流程
1. 捕獲初始訓練影象
在程式處於活動狀態、零件流動(或手動放置)的情況下,捕獲影象。開始時每個類別至少需要 10-15 張影象。
對於簡單的透過/失敗檢測:
- 10-15 張良好零件的影象
- 10-15 張缺陷零件的影象
2. 定義您的類別
選擇您要訓練的模型型別,然後閱讀相應的說明。下方的切換按鈕在第 2 步和第 3 步之間保持同步,您的選擇會儲存在 URL 中,因此即使重新整理或分享也能保留。
- Classifier
- Segmenter
在標註介面中,新增每種檢測型別所需的類別。常見的分類器類別集:
- Pass / Fail
- Present / Absent
- Good / Scratched / Cracked
一開始保持簡單。您隨時可以稍後新增類別。
在標註介面中,為您希望 AI 進行掩膜的缺陷(或特徵)新增類別。常見的分割器類別集:
- Defect / Background
- Scratch / Crack / Stain
- Foreground / Background
開始時保持類別列表簡短。每個類別都需要自己的畫筆顏色和自己的標註示例,因此預先新增更多類別會成倍增加您的標註工作量。
3. 標註影象
- Classifier
- Segmenter

每個 ROI 都有自己的分類類別——選擇能描述該影象中該 ROI 的類別(例如"pass"或"fail")。
如果您不確定使用分類還是分割,請從分類開始。它的標註速度快得多,適合大多數透過/失敗的場景。請參閱Classifier vs. Segmenter以獲取指導。

對於每個影象中的每個 ROI,使用畫筆工具逐畫素塗繪缺陷區域。塗繪的區域就是 AI 學習檢測的內容——任何未塗繪的部分都將被視為背景。
分割器標籤需要畫素級的畫筆操作,比分類器下拉選擇慢,但能為您提供包含位置和形狀的精確缺陷圖。先從一小組定義清晰的缺陷開始,待第一個模型可以工作後再新增更多類別。
4. 訓練模型
- Classifier
- Segmenter
點選 訓練。分類器提供兩種訓練模式:
- Fast mode — 大約 30 秒到 1 分鐘。最適合在設定過程中快速迭代、檢查標籤合理性,以及簡單/易區分的零件。準確率低於生產模式,但可以讓您快速看到效果。
- Production mode — 耗時較長,但產出的模型明顯更準確。在部署到產線之前請務必使用 Production 模式。對於棘手的零件、難以區分的缺陷,或任何您將在生產中信賴的內容,Production 模式是正確的選擇。
一個良好的節奏:在清理標籤和新增資料時使用 Fast 模式迭代,結果看起來不錯時執行一次 Production 模式——並在部署前再執行一次。
點選 訓練。分割只有一種訓練模式——Production——因為畫素級掩碼需要更徹底的訓練過程才能可靠。訓練時間隨影象數量和已標註 ROI 數量而增加,因此小型初始集(每類 10-15 張影象)只需幾分鐘即可完成訓練;更大的資料集則需要更長時間。
這裡沒有"快速"合理性檢查選項,因此在訓練前請確保您的標籤是乾淨的(使用 View All ROIs 來檢查每個掩碼)。
5. 使用實時預覽進行測試
點選 Live Preview Mode 並讓零件透過。觀察結果:
- 它是否正確處理了簡單情況?
- 它在哪裡遇到困難?
- 邊緣情況有哪些?
嘗試讓它出錯。 找出它失敗的情況。這些失敗就是您改進的路線圖。
- Classifier
- Segmenter

測試面板顯示每個 ROI 的預測類別和置信度分數。執行幾次捕獲,查詢低置信度判定(通常低於 70%)——這些就是您的邊緣情況,也是最值得在下一輪標註的零件。

實時預覽會將預測的缺陷掩碼直接疊加在影象上。注意那些過小、過大或出現在沒有真實缺陷處的掩碼——這些就是您將在下一輪標註資料中要針對的失敗模式。
6. 新增針對性的資料
不要隨意新增新影象。應針對您發現的失敗模式有針對性地新增影象:
- 如果模型混淆劃痕與反光,應新增更多兩者的樣本
- 如果模型漏檢小缺陷,應新增更多小缺陷影象
- 如果模型在角落部位的零件上失敗,應新增更多角落部位的樣本
7. 重新訓練並重新測試
重複步驟 4-6 兩到四次。每次迭代都應提升準確率。如需更深入的指引——包括如何在不丟失之前訓練成果的情況下向現有模型新增新影象——請參閱 新增資料與重新訓練。
資料增強:教會 AI 應對變化
資料增強會在訓練過程中隨機修改您的訓練影象——調整亮度、新增旋轉、微調對比度等。每張影象會以略有差異的增強方式被多次送入 AI 進行訓練,但標籤保持不變。這樣您無需為每種可能的變化都採集樣本,就能使模型對真實世界條件具有魯棒性。
預設應開啟的項
少量的亮度變化幾乎總是值得開啟的——即便是控制最嚴格的工廠也有會閃爍的頂燈、隨班次變化的陰影,以及隨時間推移產生的輕微 LED 漂移。亮度增強幾乎不需要任何代價就能讓模型應對這些情況。
旋轉:有用,但要注意 ROI 形狀
如果您的零件實際上可能以不同角度到達(如傳送帶上鬆散的螺絲、手工放置的零件,或任何未被夾具固定的物體),旋轉增強非常有用。但它與 ROI 形狀有互動影響:
- 方形 ROI: 旋轉增強能夠乾淨地工作——旋轉後的影象仍能完整放入 ROI 框內。
- 分類器上的非方形 ROI: 旋轉可能會裁切影象。當一個高而窄的 ROI 被旋轉 45° 時,旋轉後內容的角部會落在框外,模型將在不完整的影象上進行訓練。如果您的零件可能旋轉,請將 ROI 設為方形,或依靠對齊器在上游處理旋轉,這樣這裡就不需要旋轉增強。
- 分割器: 同樣存在裁切問題,但分割器對此較不敏感,因為它從畫素掩碼學習,而非整個 ROI 形狀。
何時不應使用特定的資料增強
一般規則是:不要對您正在檢測的屬性進行增強。 如果您要檢測方向,旋轉增強會讓模型認為顛倒的零件仍然是"良品"。
- 檢測顏色一致性? 不要使用飽和度增強。
- 檢測模糊/對焦? 不要使用運動模糊增強。
- 檢測方向? 不要使用旋轉增強(可能也不應使用對齊器)。
資料多樣性很重要
您的訓練資料應代表 AI 在生產環境中將會看到的全部範圍:
- 一天中的不同時段(如果光照有變化)
- 不同批次的零件(表面處理可能略有差異)
- 零件在畫面中的不同位置
- 簡單和困難的案例都要包含
重點關注最困難的案例。 如果您的訓練資料包含了 10 個最難分類的零件,那麼剩下 90% 的簡單零件對 AI 來說將不在話下。
高學習能力
OV 攝像頭的 AI 設計為可隨著資料量的增加而持續改進。與許多在 20 張影象後就達到瓶頸的 AI 系統不同,該模型在 50 張、100 張甚至 500 張以上影象的情況下仍能持續改進。大多數檢測在 5-10 張影象下就能很好地工作,但如果您面對的是複雜的多缺陷問題,請不要猶豫,繼續新增資料。
使用合成資料加速:Defect Studio
如果您需要為很少見到的缺陷進行訓練怎麼辦?比如必須故意拆除的缺失螺絲、必須人為製造的劃痕、千分之一機率才出現的裂紋?等待數月才能收集到足夠樣本並不現實。
位於 tools.overview.ai 的 OV Auto-Defect Creator Studio 可以解決這個問題。它能生成逼真的合成缺陷影象,速度比等待生產線上出現真實缺陷快 10,000 倍。
工作原理:5 個簡單步驟
- 上傳 一張零件的良品影象
- 標記 缺陷應該出現的區域
- 描述 缺陷(使用簡單的英語,例如 "deep scratch across the surface" 或 "missing solder joint")
- 生成 缺陷變體(AI 會建立逼真的結果)
- 匯出 合成影象,直接放入您的訓練集
為什麼合成資料有效
生成的影象不只是"貼上去"的偽影。它們是與您實際的光照、相機角度和零件表面相匹配的逼真變體。AI 理解在您特定成像條件下缺陷外觀的物理原理。
使用場景:
- 罕見缺陷: 針對您從未(或很少)見過的失效模式進行訓練
- 新產品釋出: 在第一個不良品下線之前就建立檢測
- 邊界案例: 生成臨界樣本以改進 AI 的決策邊界
- 資料增強: 用合成的多樣化樣本補充小型資料集
實際演示
最佳方法是:先用最初的 3-5 張真實影象進行訓練,識別 AI 表現不佳之處,然後使用 Defect Studio 針對這些特定的失效模式生成有針對性的合成樣本。真實資料教會基線;合成資料填補空白。
訓練檢查清單
在繼續之前,請確認:
- 已捕獲初始影象,每個類別至少 10-15 張
- 所有標籤已仔細複核(View All ROIs)
- 已透過實時預覽完成訓練和測試
- 已識別失效模式並新增針對性資料
- 已完成 2-4 輪 標籤 → 訓練 → 測試 迭代
- 結果符合預期
模型訓練完成且表現良好?請轉至第 5 步:設定輸出。