AI 驅動文件
您想了解什麼?
第四步:訓練您的 AI 模型
您的感興趣區域 (ROI) 已設定完畢。現在是時候教 AI 識別"好"與"壞"了。
訓練的三條基本規則
在做其他事情之前,請牢記這三條規則。無論您訓練的是分類器還是分割器,使用 5 張影象還是 500 張影象,它們都適用。
規則 1:僅從影象進行標註
切勿透過檢視實物零件(或將其放在顯微鏡下)來判斷其好壞。如果您無法在相機影象中看到缺陷,AI 就無法學習它。
AI 不是魔法。它只能基於相機所看到的內容進行工作。如果您因為透過觸控或在放大鏡下放大檢視而發現某些問題,從而將零件標記為"有缺陷",但相機影象看起來正常,那麼您就是在教 AI 看到並不存在的東西。
如果您無法僅憑影象進行標註,請返回安裝步驟並修復物理設定:更好的鏡頭、更好的照明、更近的安裝位置、不同的角度。
規則 2:反覆檢查您的標籤
錯誤標註每個人都會發生;經驗豐富的工程師也會犯錯。但在小型資料集中,一個錯誤標籤就可能毀掉您的結果。
對於 5 張訓練影象,一個錯誤標籤會汙染**20%**的訓練資料。這是災難性的。
在每次訓練執行之前:點選View All ROIs並驗證每一個標註。這是最容易修復且影響最大的事情。
規則 3:從小處著手,快速迭代
不要標註 50 張影象然後就開始訓練。相反,建立一個緊湊的迴圈:每個類別標註 10-15 張影象,訓練(大約 30 秒),測試並嘗試找出問題,然後在失敗的地方新增針對性資料。重複這個迴圈 2-4 次。
這個迴圈是您獲得良好模型的最快路徑。
分步訓練工作流程
1. 捕獲初始訓練影象
在程式處於活動狀態且零件正在流轉(或手動放置)的情況下,捕獲影象。每個類別至少需要10-15 張影象才能開始。
對於簡單的透過/失敗檢測:
- 10-15 張良品零件的影象
- 10-15 張缺陷零件的影象
2. 定義您的類別
選擇您要訓練的模型型別,然後閱讀相應的說明。下面的切換在第 2 步和第 3 步之間保持同步,您的選擇會儲存在 URL 中,因此即使重新整理或分享也不會丟失。
- Classifier
- Segmenter
在標註介面中,新增每種檢測型別所需的類別。常見的分類器類別集:
- Pass / Fail
- Present / Absent
- Good / Scratched / Cracked
一開始保持簡單。您隨時可以稍後新增類別。
在標註介面中,為您希望 AI 進行掩膜處理的缺陷(或特徵)新增類別。常見的分割器類別集:
- Defect / Background
- Scratch / Crack / Stain
- Foreground / Background
一開始儘量保持類別列表簡短。每個類別都需要自己的畫筆顏色和自己的標註示例,因此一開始新增更多類別會成倍增加您的標註工作量。
3. 標註影象
- Classifier
- Segmenter

每個 ROI 都有自己的分類類別 — 選擇描述該影象中該 ROI 的類別(例如 "pass" 或 "fail")。
如果您不確定使用分類還是分割,請從分類開始。它的標註速度快得多,並且適用於大多數 pass/fail 場景。請參閱 Classifier vs. Segmenter 獲取指導。

對於每個影象中的每個 ROI,使用畫筆工具逐畫素繪製缺陷區域。繪製的區域是 AI 學習檢測的內容 — 您未繪製的任何區域都被視為背景。
分割器標籤需要畫素級的畫筆操作,比分類器下拉選擇慢,但可以為您提供具有位置和形狀的精確缺陷圖。從一小組明確定義的缺陷開始,僅在您的第一個模型可用後再新增更多類別。
4. 訓練模型
- Classifier
- Segmenter
點選 Train。分類器提供兩種訓練模式:
- Fast 模式 — 大約 30 秒到 1 分鐘。最適合在設定過程中進行快速迭代、檢查標籤的合理性以及處理簡單/可明顯區分的部件。準確率低於生產模式,但能讓您快速看到結果。
- Production 模式 — 耗時較長,但生成的模型明顯更準確。在部署到產線之前,請始終使用 Production 模式。對於棘手的部件、難以區分的缺陷或您將在生產中信任的任何內容,Production 模式是正確的選擇。
一個良好的節奏:在清理標籤和新增資料時使用 Fast 模式迭代,當結果看起來不錯時執行一次 Production —— 並在部署前再執行一次。
點選 Train。分割只有一種訓練模式 — Production — 因為畫素級掩碼需要更徹底的訓練過程才能可靠。訓練時間隨影象數量和已標註的 ROI 數量而變化,因此一個小的初始集(每類 10-15 張影象)只需幾分鐘即可訓練完成;較大的資料集則需要更長時間。
這裡沒有"快速"合理性檢查選項,因此請確保在訓練前您的標籤是乾淨的(使用 View All ROIs 來檢查每個掩碼)。
分割器僅學習它們被展示過的缺陷的大小和紋理。如果您的訓練集僅包含小型汙染物,而生產中出現同一缺陷類別的大塊汙染物,模型將只勾勒出大缺陷中與小樣本相似的部分 — 而將其大部分割槽域忽略。掩碼看起來不連貫,或僅標記真實缺陷的邊緣和角落。
解決方法: 包含涵蓋您預期在產線上看到的全部缺陷尺寸範圍的訓練樣本。少量大型汙染物的捕獲影象與小型樣本一起,通常就足夠了。同樣的原則適用於紋理和顏色變化 — 在您將會看到的多樣性上進行訓練。
沒有大缺陷樣本? 使用 Defect Creator Studio 生成相同缺陷在不同尺寸、位置和方向下的合成訓練影象 — 無需等待真實的大型汙染物從產線上經過。
5. 使用實時預覽進行測試
點選 Live Preview Mode 並讓零件透過。觀察結果:
- 它是否能正確處理簡單情況?
- 它在哪些方面會遇到困難?
- 哪些是臨界情況?
嘗試讓它失效。 找出它失敗的案例。這些失敗就是你改進的路線圖。
- Classifier
- Segmenter

測試面板會顯示每個 ROI 的預測 類別 和 置信度分數。執行幾次捕獲,找出低置信度的判定(通常低於 70%)——這些就是你的臨界案例,也是接下來最值得標註的零件。

實時預覽會將預測的缺陷掩碼直接疊加在影象上。注意那些過小、過大,或者出現在沒有實際缺陷處的掩碼——這些就是下一輪標註資料需要重點關注的失敗模式。
6. 新增針對性的資料
不要隨意新增新影象。要專門針對你發現的失敗模式新增影象:
- 如果它將劃痕與反光混淆,請新增更多這兩類的示例
- 如果它漏檢小缺陷,請新增更多小缺陷的影象
- 如果它在邊角處的零件上失敗,請新增更多邊角處的示例
7. 重新訓練和重新測試
重複步驟 4-6 兩到四次。每次迭代都應該提升準確率。如需更深入的指導——包括如何在不丟失之前訓練的情況下向現有模型新增新影象——請參閱 新增資料與重新訓練。
資料增強:教 AI 處理變化
資料增強會在訓練過程中隨機修改你的訓練影象——調整亮度、新增旋轉、調整對比度等。每張影象會以略有不同的資料增強方式被反覆送入 AI 數百次,但標籤保持不變。這就是讓模型在不必為每種可能的變化都採集示例的情況下,對真實環境保持魯棒性的方法。
預設應該開啟哪些
少量的亮度變化幾乎總是值得開啟的——即使是控制最嚴格的工廠,也會有頂燈閃爍、班次中陰影變化以及 LED 隨時間的輕微漂移。亮度增強基本上可以免費地讓模型對這些變化具有魯棒性。
旋轉:有用,但要注意 ROI 形狀
如果你的零件確實可能以不同角度到達(傳送帶上鬆動的螺絲、手工放置的零件、任何未固定的物件),旋轉增強非常有用。但它與 ROI 形狀有相互影響:
- 方形 ROI: 旋轉增強可以正常工作——旋轉後的影象仍然能容納在 ROI 框內。
- 分類器上的非方形 ROI: 旋轉可能會裁剪影象。當一個高而窄的 ROI 旋轉 45° 時,旋轉後內容的角會落在框外,模型就會基於不完整的影象進行訓練。如果你的零件可能旋轉,要麼將 ROI 設為方形,要麼依靠 對齊器 在上游處理旋轉,這樣此處就不需要旋轉增強了。
- 分割器: 同樣存在裁剪問題,但分割對此不太敏感,因為它是從畫素掩碼而非整體 ROI 形狀中學習的。
何時不應使用特定的資料增強
通用規則:不要對正在檢測的屬性進行資料增強。 如果您想檢測方向,旋轉資料增強會讓模型認為顛倒的零件依然是"良好"的。
- 檢測顏色一致性? 不要使用飽和度資料增強。
- 檢測模糊/對焦? 不要使用運動模糊資料增強。
- 檢測方向? 不要使用旋轉資料增強(也很可能不應使用對齊器)。
資料多樣性很重要
您的訓練資料應涵蓋 AI 在生產環境中將看到的全部範圍:
- 不同的時間段(如果光照會變化)
- 不同的零件批次(表面處理可能略有差異)
- 在畫面中處於不同位置的零件
- 簡單和困難的情況都要有
重點關注最困難的情況。 如果您的訓練資料包含了 10 個最難分類的零件,那麼剩下 90% 的簡單零件對 AI 來說將易如反掌。
高學習能力
OV 相機的 AI 設計為可以隨著資料增多而持續改進。不像許多 AI 系統在 20 張影象後就遇到瓶頸,此模型可以在 50 張、100 張甚至 500 張以上的影象下繼續提升。大多數檢測在 5-10 張影象下就能很好地執行,但如果您面對的是複雜的多缺陷問題,請不要猶豫,繼續新增資料。
使用合成資料加速:Defect Studio
如果您需要為很少見到的缺陷進行訓練,該怎麼辦?比如必須刻意拆除才能產生的缺失螺釘、必須人為製造的劃痕、或每千個零件才出現一次的裂紋?等待數月以收集足夠樣本並不現實。
位於 tools.overview.ai 的 OV Auto-Defect Creator Studio 解決了這個問題。它可以生成逼真的合成缺陷影象,比等待真實缺陷在生產線上出現快多達 10,000 倍。
工作原理:5 個簡單步驟
- 上傳 您零件的良品影象
- 標記 缺陷應出現的區域
- 用簡明英語描述 缺陷(例如,"表面上的深劃痕"或"缺失的焊點")
- 生成 缺陷變化(AI 會建立逼真的結果)
- 匯出 合成影象,直接進入您的訓練集
為什麼合成資料有效
生成的影象並非簡單"貼上去"的偽影。它們是與您的實際光照、相機角度和零件表面相匹配的逼真變化。AI 理解在您特定成像條件下缺陷外觀的物理規律。
使用場景:
- 稀有缺陷: 訓練您從未(或極少)見過的失效模式
- 新產品釋出: 在第一個不良品下線之前就建立好檢測
- 邊緣案例: 生成臨界樣本以改進 AI 的決策邊界
- 資料增強: 使用合成的多樣性補充小型資料集
實際演示
最佳做法:首先使用最初的 3-5 張真實影象進行訓練,找出 AI 表現不佳之處,然後使用 Defect Studio 針對那些特定失效模式生成有針對性的合成樣本。真實資料建立基線;合成資料填補空缺。
訓練檢查清單
在繼續之前,請確認:
- 已捕獲初始影象,每個類別至少 10-15 張
- 所有標籤均已複核(View All ROIs)
- 已透過實時預覽完成訓練和測試
- 已識別故障模式並新增針對性資料
- 已完成 2-4 輪 標註 → 訓練 → 測試 迭代
- 結果符合預期
模型已訓練完成且表現良好?請前往 第 5 步:設定輸出。