AI 驅動文件
您想了解什麼?
第 4 步:訓練您的 AI 模型
您的檢測區域已設定完成。現在是時候教會 AI 識別"合格"與"不合格"的樣子了。
訓練的三大黃金法則
在開始之前,請牢記以下三條規則。無論您是訓練 classifier 還是 segmenter,無論使用 5 張還是 500 張影象,這些規則都適用。
法則 1:只根據影象進行標註
切勿透過觀察實物部件(或將其放在顯微鏡下)來判斷其是否合格。如果您在相機影象中看不到缺陷,AI 也就無法學習它。
AI 並非魔法。它只能處理相機所看到的內容。如果您因為觸控或用放大鏡放大後發現了某些問題而將部件標註為"缺陷",但相機影象看起來完好無損,那麼您就是在教 AI 識別並不存在的東西。
如果您無法僅憑影象進行標註,請返回 Install 步驟並修正物理設定:更好的鏡頭、更好的光照、更近的安裝位置或不同的角度。
法則 2:反覆檢查您的標註
每個人都會出現標註錯誤;即使是經驗豐富的工程師也不例外。但在小資料集中,一個錯誤標註就可能毀掉您的結果。
在 5 張訓練影象中,一個錯誤標註會汙染 20% 的訓練資料。這是災難性的。
**每次訓練前:**點選 View All ROIs 並核實每一個標註。這是最容易修正的事,也是影響最大的事。
法則 3:從小處著手,快速迭代
不要一次標註 50 張影象就開始訓練。而是建立一個緊密的迴圈:每個類別標註 3-5 張影象,在 development 模式下訓練(約 30 秒),進行測試並嘗試找出問題,然後針對失敗的地方補充有針對性的資料。在 development 模式下重複此迴圈 2-4 次,然後切換到 production 模式。
這個迴圈是通向優質模型的最快路徑。在 development 模式下執行 2-4 次,然後切換到 production 模式。
分步訓練工作流程
1. 採集初始訓練影象
在 recipe 啟用且部件正在流動(或手動放置)的狀態下,採集影象。開始時每個類別至少需要 3-5 張影象。
對於簡單的 pass/fail 檢測:
- 3-5 張合格部件影象
- 3-5 張缺陷部件影象
2. 定義類別
在標註介面中,為每種檢測型別新增所需的類別。對於 classifier,可能包括:
- Pass / Fail
- Present / Absent
- Good / Scratched / Cracked
一開始保持簡單。您可以隨時新增更多類別。
3. 標註影象

對於每張影象中的每個 ROI,指定正確的類別標籤:
- **Classifier:**從下拉選單中選擇類別(例如 "pass" 或 "fail")
- **Segmenter:**使用畫筆工具逐畫素繪製缺陷區域
如果您不確定應使用 classification 還是 segmentation,請從 classification 開始。它的標註速度快得多,且適用於大多數 pass/fail 場景。請參閱 Classifier vs. Segmenter 獲取指導。
4. 在 Development 模式下訓練
點選 Train 並選擇 Development Mode。此過程大約需要 30 秒,產生的模型精度約為 production 模式的 1/20,但足以用於檢查訊號。
**"檢查訊號"的含義:**AI 是否開始學習合格與不合格之間的區別?還是完全搞錯了?
- 如果大部分正確 → 訊號良好,繼續推進
- 如果完全錯誤 → 存在問題。檢查是否有錯誤標註、檢查 ROI 大小、檢查影象質量
5. 使用實時預覽進行測試

點選 Live Preview Mode 並讓零件透過。觀察結果:
- 它是否正確處理了簡單的情況?
- 它在哪些情況下遇到困難?
- 哪些是邊界情況?
嘗試讓它失敗。 找出它失敗的情況。這些失敗就是您改進的路線圖。
6. 新增針對性資料
不要隨意新增新影象。新增專門針對您發現的失敗模式的影象:
- 如果它將劃痕與反光混淆,請新增更多兩者的示例
- 如果它漏檢小缺陷,請新增更多小缺陷的影象
- 如果它在角落的零件上失敗,請新增更多角落示例
7. 重新訓練並重新測試
重複步驟 4-6 兩到四次。每次迭代都應提高準確性。
8. 切換到 Production Mode
當 development mode 執行得相當不錯時,切換到 Production Mode。這需要 5-10 分鐘,但會產生一個比 development mode 準確度高約 20 倍 的模型。
如果 development mode 能正確處理 80% 的情況,production mode 可能會達到 95% 以上的正確率。
Augmentations(資料增強):教 AI 處理變化
Augmentations 會在訓練過程中隨機修改您的訓練影象,調整亮度、新增旋轉、調整對比度等。每張影象會以略有不同的增強方式被輸入到 AI 數百次,但標籤保持不變。
這對於構建魯棒性非常強大。 如果您的照明在不同班次之間有變化,亮度增強會教 AI 處理這種情況。如果零件可以以任何角度到達,旋轉增強會使方向變得無關緊要。
何時使用 augmentations
| 增強型別 | 使用時機... | 示例場景 |
|---|---|---|
| Brightness(亮度) | 照明變化(白天/夜晚、陰影) | 工廠頂燈在一天中會發生變化 |
| Rotation(旋轉) | 零件可以以任何角度到達 | 螺絲孔,方向無關緊要 |
| Motion blur(運動模糊) | 零件快速移動或相機震動 | 高速傳送帶 |
| Saturation(飽和度) | 顏色不是檢測的一部分 | 不同顏色的同一零件應同等透過 |
| Contrast(對比度) | 環境照明波動 | 透過窗戶的季節性光線變化 |
何時不要使用 augmentations
這是一把雙刃劍。如果您新增了旋轉增強,但您正在檢測 零件方向是否正確,您將會教 AI 認為倒置的零件仍然是"合格的"。
- 檢測顏色一致性?不要使用飽和度增強
- 檢測模糊/對焦?不要使用運動模糊增強
- 檢測方向?不要使用旋轉增強
規則: 對除了您正在檢測的特定屬性之外的所有內容進行增強。
資料多樣性很重要
您的訓練資料應涵蓋 AI 在生產中將看到的全部範圍:
- 一天中的不同時間(如果照明變化)
- 不同的零件批次(表面處理可能略有不同)
- 零件在畫面中的不同位置
- 簡單和困難的情況都要包括
聚焦於最困難的情況。 如果您的訓練資料包含了最難分類的 10 個零件,那麼 90% 的簡單零件對 AI 來說將是輕而易舉的。
高學習容量
OV 相機的 AI 旨在隨著資料增加而持續改進。不同於許多在 20 張影象後便達到瓶頸的 AI 系統,該模型在 50、100 甚至 500+ 張影象下仍能持續提升。大多數檢測任務使用 5-10 張影象即可取得良好效果,但如果遇到複雜的多缺陷問題,請放心繼續新增資料。
使用合成資料加速:Defect Studio
如果需要訓練一種極少出現的缺陷該怎麼辦?比如需要故意移除才能獲得的缺失螺絲、需要人為製造的劃痕、每千件產品才出現一次的裂紋?等待數月來收集足夠樣本並不現實。
OV Auto-Defect Creator Studio(tools.overview.ai)解決了這一問題。它能生成照片級真實感的合成缺陷影象,比等待生產線上出現真實缺陷快 10,000 倍。
工作原理:5 個簡單步驟
- 上傳一張良品零件的影象
- 標記缺陷應出現的區域
- 用簡單的英文描述缺陷(例如:"deep scratch across the surface" 或 "missing solder joint")
- 生成缺陷變體(AI 將建立照片級真實感的結果)
- 將合成影象直接匯出到您的訓練集中
為什麼合成資料有效
生成的影象並非簡單"貼上"的偽影,而是與您的實際光照、相機角度和零件表面相匹配的照片級真實感變體。AI 理解在您特定的成像條件下缺陷外觀的物理規律。
使用場景:
- **罕見缺陷:**針對從未(或極少)出現過的失效模式進行訓練
- **新產品釋出:**在第一件不良品下線前即建立檢測
- **邊緣案例:**生成臨界樣本以改進 AI 的決策邊界
- **資料增強:**透過合成多樣性補充小資料集
實際演示
最佳方法:先用最初的 3-5 張真實影象進行訓練,找出 AI 表現不佳的地方,然後使用 Defect Studio 針對這些特定失效模式生成有針對性的合成樣本。真實資料建立基線,合成資料填補空白。
訓練檢查清單
在繼續之前,請確認:
- 已採集初始影象,每個類別至少 3-5 張
- 所有標籤已複核(View All ROIs)
- 已在開發模式下訓練並使用 Live Preview 測試
- 已識別失效模式並新增針對性資料
- 已完成 2-4 輪 標註 → 訓練 → 測試 的迭代
- 已在生產模式下訓練;結果達到預期
模型已訓練完成且表現良好?請前往 第 5 步:設定輸出。