跳到主要內容

AI 驅動文件

您想了解什麼?

第四步:訓練您的 AI 模型

您的感興趣區域 (ROI) 已設定完畢。現在是時候教 AI 識別"好"與"壞"了。

訓練的三條基本規則

在做其他事情之前,請牢記這三條規則。無論您訓練的是分類器還是分割器,使用 5 張影象還是 500 張影象,它們都適用。

規則 1:僅從影象進行標註

切勿透過檢視實物零件(或將其放在顯微鏡下)來判斷其好壞。如果您無法在相機影象中看到缺陷,AI 就無法學習它。

AI 不是魔法。它只能基於相機所看到的內容進行工作。如果您因為透過觸控或在放大鏡下放大檢視而發現某些問題,從而將零件標記為"有缺陷",但相機影象看起來正常,那麼您就是在教 AI 看到並不存在的東西。

如果您無法僅憑影象進行標註,請返回安裝步驟並修復物理設定:更好的鏡頭、更好的照明、更近的安裝位置、不同的角度。

規則 2:反覆檢查您的標籤

錯誤標註每個人都會發生;經驗豐富的工程師也會犯錯。但在小型資料集中,一個錯誤標籤就可能毀掉您的結果。

對於 5 張訓練影象,一個錯誤標籤會汙染**20%**的訓練資料。這是災難性的。

在每次訓練執行之前:點選View All ROIs並驗證每一個標註。這是最容易修復且影響最大的事情。

規則 3:從小處著手,快速迭代

不要標註 50 張影象然後就開始訓練。相反,建立一個緊湊的迴圈:每個類別標註 10-15 張影象,訓練(大約 30 秒),測試並嘗試找出問題,然後在失敗的地方新增針對性資料。重複這個迴圈 2-4 次。

這個迴圈是您獲得良好模型的最快路徑。

分步訓練工作流程

1. 捕獲初始訓練影象

在程式處於活動狀態且零件正在流轉(或手動放置)的情況下,捕獲影象。每個類別至少需要10-15 張影象才能開始。

對於簡單的透過/失敗檢測:

  • 10-15 張良品零件的影象
  • 10-15 張缺陷零件的影象

2. 定義您的類別

選擇您要訓練的模型型別,然後閱讀相應的說明。下面的切換在第 2 步和第 3 步之間保持同步,您的選擇會儲存在 URL 中,因此即使重新整理或分享也不會丟失。

在標註介面中,新增每種檢測型別所需的類別。常見的分類器類別集:

  • Pass / Fail
  • Present / Absent
  • Good / Scratched / Cracked

一開始保持簡單。您隨時可以稍後新增類別。

3. 標註影象

分類器標註:從下拉選單中為每個 ROI 選擇一個類別

每個 ROI 都有自己的分類類別 — 選擇描述該影象中該 ROI 的類別(例如 "pass" 或 "fail")。

分類標註更快

如果您不確定使用分類還是分割,請從分類開始。它的標註速度快得多,並且適用於大多數 pass/fail 場景。請參閱 Classifier vs. Segmenter 獲取指導。

4. 訓練模型

點選 Train。分類器提供兩種訓練模式:

  • Fast 模式 — 大約 30 秒到 1 分鐘。最適合在設定過程中進行快速迭代、檢查標籤的合理性以及處理簡單/可明顯區分的部件。準確率低於生產模式,但能讓您快速看到結果。
  • Production 模式 — 耗時較長,但生成的模型明顯更準確。在部署到產線之前,請始終使用 Production 模式。對於棘手的部件、難以區分的缺陷或您將在生產中信任的任何內容,Production 模式是正確的選擇。

一個良好的節奏:在清理標籤和新增資料時使用 Fast 模式迭代,當結果看起來不錯時執行一次 Production —— 並在部署前再執行一次。

5. 使用實時預覽進行測試

點選 Live Preview Mode 並讓零件透過。觀察結果:

  • 它是否能正確處理簡單情況?
  • 它在哪些方面會遇到困難?
  • 哪些是臨界情況?

嘗試讓它失效。 找出它失敗的案例。這些失敗就是你改進的路線圖。

分類器實時預覽:每個 ROI 的判定結果和置信度分數

測試面板會顯示每個 ROI 的預測 類別置信度分數。執行幾次捕獲,找出低置信度的判定(通常低於 70%)——這些就是你的臨界案例,也是接下來最值得標註的零件。

6. 新增針對性的資料

不要隨意新增新影象。要專門針對你發現的失敗模式新增影象:

  • 如果它將劃痕與反光混淆,請新增更多這兩類的示例
  • 如果它漏檢小缺陷,請新增更多小缺陷的影象
  • 如果它在邊角處的零件上失敗,請新增更多邊角處的示例

7. 重新訓練和重新測試

重複步驟 4-6 兩到四次。每次迭代都應該提升準確率。如需更深入的指導——包括如何在不丟失之前訓練的情況下向現有模型新增新影象——請參閱 新增資料與重新訓練

資料增強:教 AI 處理變化

資料增強會在訓練過程中隨機修改你的訓練影象——調整亮度、新增旋轉、調整對比度等。每張影象會以略有不同的資料增強方式被反覆送入 AI 數百次,但標籤保持不變。這就是讓模型在不必為每種可能的變化都採集示例的情況下,對真實環境保持魯棒性的方法。

預設應該開啟哪些

少量的亮度變化幾乎總是值得開啟的——即使是控制最嚴格的工廠,也會有頂燈閃爍、班次中陰影變化以及 LED 隨時間的輕微漂移。亮度增強基本上可以免費地讓模型對這些變化具有魯棒性。

旋轉:有用,但要注意 ROI 形狀

如果你的零件確實可能以不同角度到達(傳送帶上鬆動的螺絲、手工放置的零件、任何未固定的物件),旋轉增強非常有用。但它與 ROI 形狀有相互影響:

  • 方形 ROI: 旋轉增強可以正常工作——旋轉後的影象仍然能容納在 ROI 框內。
  • 分類器上的非方形 ROI: 旋轉可能會裁剪影象。當一個高而窄的 ROI 旋轉 45° 時,旋轉後內容的角會落在框外,模型就會基於不完整的影象進行訓練。如果你的零件可能旋轉,要麼將 ROI 設為方形,要麼依靠 對齊器 在上游處理旋轉,這樣此處就不需要旋轉增強了。
  • 分割器: 同樣存在裁剪問題,但分割對此不太敏感,因為它是從畫素掩碼而非整體 ROI 形狀中學習的。

何時不應使用特定的資料增強

通用規則:不要對正在檢測的屬性進行資料增強。 如果您想檢測方向,旋轉資料增強會讓模型認為顛倒的零件依然是"良好"的。

  • 檢測顏色一致性? 不要使用飽和度資料增強。
  • 檢測模糊/對焦? 不要使用運動模糊資料增強。
  • 檢測方向? 不要使用旋轉資料增強(也很可能不應使用對齊器)。

資料多樣性很重要

您的訓練資料應涵蓋 AI 在生產環境中將看到的全部範圍:

  • 不同的時間段(如果光照會變化)
  • 不同的零件批次(表面處理可能略有差異)
  • 在畫面中處於不同位置的零件
  • 簡單和困難的情況都要有

重點關注最困難的情況。 如果您的訓練資料包含了 10 個最難分類的零件,那麼剩下 90% 的簡單零件對 AI 來說將易如反掌。

高學習能力

OV 相機的 AI 設計為可以隨著資料增多而持續改進。不像許多 AI 系統在 20 張影象後就遇到瓶頸,此模型可以在 50 張、100 張甚至 500 張以上的影象下繼續提升。大多數檢測在 5-10 張影象下就能很好地執行,但如果您面對的是複雜的多缺陷問題,請不要猶豫,繼續新增資料。

使用合成資料加速:Defect Studio

如果您需要為很少見到的缺陷進行訓練,該怎麼辦?比如必須刻意拆除才能產生的缺失螺釘、必須人為製造的劃痕、或每千個零件才出現一次的裂紋?等待數月以收集足夠樣本並不現實。

位於 tools.overview.aiOV Auto-Defect Creator Studio 解決了這個問題。它可以生成逼真的合成缺陷影象,比等待真實缺陷在生產線上出現快多達 10,000 倍

工作原理:5 個簡單步驟

  1. 上傳 您零件的良品影象
  2. 標記 缺陷應出現的區域
  3. 用簡明英語描述 缺陷(例如,"表面上的深劃痕"或"缺失的焊點")
  4. 生成 缺陷變化(AI 會建立逼真的結果)
  5. 匯出 合成影象,直接進入您的訓練集

為什麼合成資料有效

生成的影象並非簡單"貼上去"的偽影。它們是與您的實際光照、相機角度和零件表面相匹配的逼真變化。AI 理解在您特定成像條件下缺陷外觀的物理規律。

使用場景:

  • 稀有缺陷: 訓練您從未(或極少)見過的失效模式
  • 新產品釋出: 在第一個不良品下線之前就建立好檢測
  • 邊緣案例: 生成臨界樣本以改進 AI 的決策邊界
  • 資料增強: 使用合成的多樣性補充小型資料集

實際演示

從真實資料開始,用合成資料加速

最佳做法:首先使用最初的 3-5 張真實影象進行訓練,找出 AI 表現不佳之處,然後使用 Defect Studio 針對那些特定失效模式生成有針對性的合成樣本。真實資料建立基線;合成資料填補空缺。

訓練檢查清單

在繼續之前,請確認:

  • 已捕獲初始影象,每個類別至少 10-15 張
  • 所有標籤均已複核(View All ROIs)
  • 已透過實時預覽完成訓練和測試
  • 已識別故障模式並新增針對性資料
  • 已完成 2-4 輪 標註 → 訓練 → 測試 迭代
  • 結果符合預期

模型已訓練完成且表現良好?請前往 第 5 步:設定輸出