跳到主要內容

AI 驅動文件

您想了解什麼?

第 4 步:訓練您的 AI 模型

您的檢測區域已設定完成。現在是時候教會 AI 識別"合格"與"不合格"的樣子了。

訓練的三大黃金法則

在開始之前,請牢記以下三條規則。無論您是訓練 classifier 還是 segmenter,無論使用 5 張還是 500 張影象,這些規則都適用。

法則 1:只根據影象進行標註

切勿透過觀察實物部件(或將其放在顯微鏡下)來判斷其是否合格。如果您在相機影象中看不到缺陷,AI 也就無法學習它。

AI 並非魔法。它只能處理相機所看到的內容。如果您因為觸控或用放大鏡放大後發現了某些問題而將部件標註為"缺陷",但相機影象看起來完好無損,那麼您就是在教 AI 識別並不存在的東西。

如果您無法僅憑影象進行標註,請返回 Install 步驟並修正物理設定:更好的鏡頭、更好的光照、更近的安裝位置或不同的角度。

法則 2:反覆檢查您的標註

每個人都會出現標註錯誤;即使是經驗豐富的工程師也不例外。但在小資料集中,一個錯誤標註就可能毀掉您的結果。

在 5 張訓練影象中,一個錯誤標註會汙染 20% 的訓練資料。這是災難性的。

**每次訓練前:**點選 View All ROIs 並核實每一個標註。這是最容易修正的事,也是影響最大的事。

法則 3:從小處著手,快速迭代

不要一次標註 50 張影象就開始訓練。而是建立一個緊密的迴圈:每個類別標註 3-5 張影象,在 development 模式下訓練(約 30 秒),進行測試並嘗試找出問題,然後針對失敗的地方補充有針對性的資料。在 development 模式下重複此迴圈 2-4 次,然後切換到 production 模式。

這個迴圈是通向優質模型的最快路徑。在 development 模式下執行 2-4 次,然後切換到 production 模式。

分步訓練工作流程

1. 採集初始訓練影象

在 recipe 啟用且部件正在流動(或手動放置)的狀態下,採集影象。開始時每個類別至少需要 3-5 張影象

對於簡單的 pass/fail 檢測:

  • 3-5 張合格部件影象
  • 3-5 張缺陷部件影象

2. 定義類別

在標註介面中,為每種檢測型別新增所需的類別。對於 classifier,可能包括:

  • Pass / Fail
  • Present / Absent
  • Good / Scratched / Cracked

一開始保持簡單。您可以隨時新增更多類別。

3. 標註影象

標註與訓練介面

對於每張影象中的每個 ROI,指定正確的類別標籤:

  • **Classifier:**從下拉選單中選擇類別(例如 "pass" 或 "fail")
  • **Segmenter:**使用畫筆工具逐畫素繪製缺陷區域
Classification 標註更快

如果您不確定應使用 classification 還是 segmentation,請從 classification 開始。它的標註速度快得多,且適用於大多數 pass/fail 場景。請參閱 Classifier vs. Segmenter 獲取指導。

4. 在 Development 模式下訓練

點選 Train 並選擇 Development Mode。此過程大約需要 30 秒,產生的模型精度約為 production 模式的 1/20,但足以用於檢查訊號。

**"檢查訊號"的含義:**AI 是否開始學習合格與不合格之間的區別?還是完全搞錯了?

  • 如果大部分正確 → 訊號良好,繼續推進
  • 如果完全錯誤 → 存在問題。檢查是否有錯誤標註、檢查 ROI 大小、檢查影象質量

5. 使用實時預覽進行測試

實時預覽模式:實時測試您的模型

點選 Live Preview Mode 並讓零件透過。觀察結果:

  • 它是否正確處理了簡單的情況?
  • 它在哪些情況下遇到困難?
  • 哪些是邊界情況?

嘗試讓它失敗。 找出它失敗的情況。這些失敗就是您改進的路線圖。

6. 新增針對性資料

不要隨意新增新影象。新增專門針對您發現的失敗模式的影象:

  • 如果它將劃痕與反光混淆,請新增更多兩者的示例
  • 如果它漏檢小缺陷,請新增更多小缺陷的影象
  • 如果它在角落的零件上失敗,請新增更多角落示例

7. 重新訓練並重新測試

重複步驟 4-6 兩到四次。每次迭代都應提高準確性。

8. 切換到 Production Mode

當 development mode 執行得相當不錯時,切換到 Production Mode。這需要 5-10 分鐘,但會產生一個比 development mode 準確度高約 20 倍 的模型。

如果 development mode 能正確處理 80% 的情況,production mode 可能會達到 95% 以上的正確率。

Augmentations(資料增強):教 AI 處理變化

Augmentations 會在訓練過程中隨機修改您的訓練影象,調整亮度、新增旋轉、調整對比度等。每張影象會以略有不同的增強方式被輸入到 AI 數百次,但標籤保持不變。

這對於構建魯棒性非常強大。 如果您的照明在不同班次之間有變化,亮度增強會教 AI 處理這種情況。如果零件可以以任何角度到達,旋轉增強會使方向變得無關緊要。

何時使用 augmentations

增強型別使用時機...示例場景
Brightness(亮度)照明變化(白天/夜晚、陰影)工廠頂燈在一天中會發生變化
Rotation(旋轉)零件可以以任何角度到達螺絲孔,方向無關緊要
Motion blur(運動模糊)零件快速移動或相機震動高速傳送帶
Saturation(飽和度)顏色不是檢測的一部分不同顏色的同一零件應同等透過
Contrast(對比度)環境照明波動透過窗戶的季節性光線變化

何時不要使用 augmentations

不要對您正在檢測的物件進行增強

這是一把雙刃劍。如果您新增了旋轉增強,但您正在檢測 零件方向是否正確,您將會教 AI 認為倒置的零件仍然是"合格的"。

  • 檢測顏色一致性?不要使用飽和度增強
  • 檢測模糊/對焦?不要使用運動模糊增強
  • 檢測方向?不要使用旋轉增強

規則: 對除了您正在檢測的特定屬性之外的所有內容進行增強。

資料多樣性很重要

您的訓練資料應涵蓋 AI 在生產中將看到的全部範圍:

  • 一天中的不同時間(如果照明變化)
  • 不同的零件批次(表面處理可能略有不同)
  • 零件在畫面中的不同位置
  • 簡單和困難的情況都要包括

聚焦於最困難的情況。 如果您的訓練資料包含了最難分類的 10 個零件,那麼 90% 的簡單零件對 AI 來說將是輕而易舉的。

高學習容量

OV 相機的 AI 旨在隨著資料增加而持續改進。不同於許多在 20 張影象後便達到瓶頸的 AI 系統,該模型在 50、100 甚至 500+ 張影象下仍能持續提升。大多數檢測任務使用 5-10 張影象即可取得良好效果,但如果遇到複雜的多缺陷問題,請放心繼續新增資料。

使用合成資料加速:Defect Studio

如果需要訓練一種極少出現的缺陷該怎麼辦?比如需要故意移除才能獲得的缺失螺絲、需要人為製造的劃痕、每千件產品才出現一次的裂紋?等待數月來收集足夠樣本並不現實。

OV Auto-Defect Creator Studiotools.overview.ai)解決了這一問題。它能生成照片級真實感的合成缺陷影象,比等待生產線上出現真實缺陷快 10,000 倍

工作原理:5 個簡單步驟

  1. 上傳一張良品零件的影象
  2. 標記缺陷應出現的區域
  3. 用簡單的英文描述缺陷(例如:"deep scratch across the surface" 或 "missing solder joint")
  4. 生成缺陷變體(AI 將建立照片級真實感的結果)
  5. 將合成影象直接匯出到您的訓練集中

為什麼合成資料有效

生成的影象並非簡單"貼上"的偽影,而是與您的實際光照、相機角度和零件表面相匹配的照片級真實感變體。AI 理解在您特定的成像條件下缺陷外觀的物理規律。

使用場景:

  • **罕見缺陷:**針對從未(或極少)出現過的失效模式進行訓練
  • **新產品釋出:**在第一件不良品下線前即建立檢測
  • **邊緣案例:**生成臨界樣本以改進 AI 的決策邊界
  • **資料增強:**透過合成多樣性補充小資料集

實際演示

從真實資料開始,用合成資料加速

最佳方法:先用最初的 3-5 張真實影象進行訓練,找出 AI 表現不佳的地方,然後使用 Defect Studio 針對這些特定失效模式生成有針對性的合成樣本。真實資料建立基線,合成資料填補空白。

訓練檢查清單

在繼續之前,請確認:

  • 已採集初始影象,每個類別至少 3-5 張
  • 所有標籤已複核(View All ROIs)
  • 已在開發模式下訓練並使用 Live Preview 測試
  • 已識別失效模式並新增針對性資料
  • 已完成 2-4 輪 標註 → 訓練 → 測試 的迭代
  • 已在生產模式下訓練;結果達到預期

模型已訓練完成且表現良好?請前往 第 5 步:設定輸出