AI 驅動文件
您想了解什麼?
第四步:訓練您的AI模型
您的感興趣區域 (ROI) 已設定完畢。現在是時候教AI識別什麼是"好"什麼是"壞"了。
訓練的三大基本原則
在開始之前,請牢記這三條規則。無論您是訓練分類器還是分割器,無論使用5張還是500張影象,它們都適用。
規則 1:僅從影象進行標註
絕不要透過觀察實物零件(或將其置於顯微鏡下)來判斷它是好是壞。如果您無法在相機影象中看到缺陷,AI就無法學習它。
AI並非魔法。它只能處理相機看到的內容。如果您因為透過觸控或在放大鏡下放大才注意到的某些情況而將零件標註為"有缺陷",但相機影象看起來正常,那麼您就是在教AI看到不存在的東西。
如果您無法僅從影象進行標註,請返回安裝步驟並修復物理設定:更好的鏡頭、更好的照明、更近的安裝距離或不同的角度。
規則 2:反覆檢查您的標籤
錯誤標註每個人都會遇到;經驗豐富的工程師也不例外。但在小資料集中,一個錯誤的標籤可能會毀掉您的結果。
對於5張訓練影象,一個錯誤標註會損壞**20%**的訓練資料。這是災難性的。
每次訓練執行前: 點選 View All ROIs(檢視所有 ROI)並驗證每一個標註。這是最容易修復也是最有影響力的事情。
規則 3:從小規模開始,快速迭代
不要標註50張影象然後點選訓練。相反,建立一個緊湊的迴圈:每個類別標註10-15張影象,訓練(約30秒),測試並嘗試找出問題,然後在失敗的地方有針對性地新增資料。重複此迴圈2-4次。
這個迴圈是您獲得優秀模型的最快路徑。
分步訓練工作流
1. 捕獲初始訓練影象
在您的程式處於活動狀態且零件正在流動(或手動放置)時,捕獲影象。您需要至少每個類別10-15張影象才能開始。
對於簡單的透過/失敗檢測:
- 10-15 張良品影象
- 10-15 張缺陷品影象
2. 定義您的類別
選擇您要訓練的模型型別,然後閱讀相應的說明。下方的切換在第2步和第3步之間保持同步,您的選擇會儲存在URL中,因此重新整理或分享後仍然有效。
- Classifier
- Segmenter
在標註介面中,新增每種檢測型別所需的類別。常見的分類器類別集:
- Pass / Fail
- Present / Absent
- Good / Scratched / Cracked
一開始保持簡單。您之後隨時可以新增類別。
在標註介面中,為您希望AI遮罩的缺陷(或特徵)新增類別。常見的分割器類別集:
- Defect / Background
- Scratch / Crack / Stain
- Foreground / Background
一開始保持類別列表簡短。每個類別都需要自己的畫筆顏色和自己的標註示例,因此預先新增更多類別會成倍增加您的標註工作量。
3. 標註影象
- Classifier
- Segmenter

每個 ROI 都有自己的分類類別——選擇能描述該影象中該 ROI 的類別(例如 "pass" 或 "fail")。
如果您不確定使用分類還是分割,請從分類開始。它的標註速度快得多,並且適用於大多數透過/失敗場景。請參閱分類器與分割器對比獲取指導。

對於每張影象中的每個 ROI,使用畫筆工具逐畫素塗繪缺陷區域。塗繪的區域就是 AI 要學習檢測的內容——未塗繪的部分將被視為背景。
分割器標籤需要畫素級的畫筆操作,比分類器下拉選擇慢,但能為您提供具有位置和形狀的精確缺陷圖。請從一小組定義明確的缺陷開始,只有在您的第一個模型生效後再新增更多類別。
4. 訓練模型
- Classifier
- Segmenter
點選 訓練。分類器提供兩種訓練模式:
- Fast 模式 — 大約需要 30 秒到 1 分鐘。最適合在設定階段進行快速迭代、對標籤進行合理性檢查,以及處理簡單/區分明顯的零件。準確率低於生產模式,但能讓您快速看到結果訊號。
- Production 模式 — 耗時較長,但生成的模型準確率明顯更高。在部署到產線之前,請始終使用 Production 模式。對於棘手的零件、難以區分的缺陷,或任何要在生產中信賴的場景,Production 模式才是正確選擇。
一個好的節奏是:在清理標籤和新增資料時使用 Fast 模式迭代,結果看起來不錯時執行一次 Production——並在部署前再執行一次。
點選 訓練。分割只有一種訓練模式——Production——因為畫素級掩碼需要更徹底的訓練過程才能可靠。訓練時間隨影象數量和已標註的 ROI 數量而變化,因此小型初始集(每類 10-15 張影象)只需幾分鐘;較大的資料集則需要更長時間。
這裡沒有"fast"合理性檢查選項,因此請在訓練之前確保您的標籤是乾淨的(使用 View All ROIs 檢視每個掩碼)。
5. 使用實時預覽進行測試
點選 實時預覽模式 並將零件輸入。觀察結果:
- 它能正確處理簡單的情況嗎?
- 在哪裡遇到困難?
- 哪些是臨界情況?
嘗試讓它出錯。 找出它失敗的情況。這些失敗正是您改進的路線圖。
- Classifier
- Segmenter

測試面板顯示每個 ROI 的預測類別和置信度分數。執行幾次捕獲,查詢低置信度的判定(通常低於 70%)——這些就是您的臨界情況,也是接下來最值得標註的零件。

實時預覽將預測的缺陷掩碼直接疊加在影象上。注意觀察過小、過大或出現在沒有真實缺陷處的掩碼——這些就是您將透過下一輪標註資料來針對的失敗模式。
6. 新增針對性資料
不要隨意新增新影象。應針對您發現的失敗模式新增影象:
- 如果模型將劃痕與反光混淆,請新增更多兩者的示例
- 如果模型遺漏小型缺陷,請新增更多小型缺陷的影象
- 如果模型在角落處的零件上失敗,請新增更多角落示例
7. 重新訓練並重新測試
重複步驟 4-6 兩到四次。每次迭代都應提高準確度。如需更深入的操作指南——包括如何在不丟失先前訓練的情況下向現有模型新增新影象——請參閱 新增資料與重新訓練。
資料增強:教 AI 處理變化
資料增強會在訓練過程中隨機修改訓練影象——調整亮度、新增旋轉、微調對比度等。每張影象都會以略有不同的資料增強形式被送入 AI 數百次,但標籤保持不變。這就是讓模型在無需捕獲每種可能變化樣本的情況下,仍能穩健應對真實世界條件的方法。
預設應開啟的項
少量的亮度變化幾乎總是值得開啟的——即使是控制最嚴格的工廠,也會有頂燈閃爍、班次中陰影變化以及隨時間推移的輕微 LED 漂移。亮度資料增強能讓模型對這一切幾乎免費地保持穩健。
旋轉:有用,但要注意 ROI 形狀
如果您的零件確實可能以不同角度到達(傳送帶上鬆散的螺絲、手動放置的零件、任何未固定在夾具中的物品),旋轉資料增強非常有用。但它與 ROI 形狀相互影響:
- 方形 ROI: 旋轉資料增強可以乾淨利落地工作——旋轉後的影象仍能裝入 ROI 框內。
- 分類器上的非方形 ROI: 旋轉可能會裁剪影象。當一個高而窄的 ROI 被旋轉 45° 時,旋轉內容的角落會落在框外,模型將基於部分影象進行訓練。如果您的零件可能旋轉,要麼使 ROI 為方形,要麼依靠對齊器在上游處理旋轉,這樣此處就不需要旋轉資料增強。
- 分割器: 同樣存在裁剪問題,但分割對此不太敏感,因為它從畫素掩膜而非整個 ROI 形狀中學習。
何時不應使用特定的資料增強
一般規則:不要對您正在檢測的屬性進行資料增強。 如果您試圖檢測方向,旋轉資料增強會教會模型顛倒的零件仍然是"良品"。
- 檢測顏色一致性? 不要使用飽和度資料增強。
- 檢測模糊/對焦? 不要使用運動模糊資料增強。
- 檢測方向? 不要使用旋轉資料增強(也可能不應使用對齊器)。
資料多樣性很重要
您的訓練資料應代表 AI 在生產環境中將看到的全部範圍:
- 一天中不同的時間(如果光照有變化)
- 不同批次的零件(表面處理可能略有差異)
- 零件在畫面中的不同位置
- 簡單和困難的案例都要包含
重點關注最困難的案例。 如果您的訓練資料包含 10 個最難分類的零件,那麼對 AI 來說,90% 的簡單零件將不在話下。
高學習能力
OV 相機的 AI 設計為隨著資料增加而持續改進。與許多在 20 張影象後達到瓶頸的 AI 系統不同,該模型在 50、100 甚至 500+ 張影象下仍能持續改進。大多數檢測使用 5-10 張影象即可獲得良好效果,但如果您面臨複雜的多缺陷問題,請放心地繼續新增資料。
使用合成資料加速:Defect Studio
如果您需要訓練一個很少見到的缺陷怎麼辦?一顆您必須故意拆除的螺絲、一道您必須人為製造的劃痕、千分之一機率才出現的裂紋?等待數月才能收集足夠的樣本並不現實。
OV Auto-Defect Creator Studio (tools.overview.ai) 解決了這個問題。它能生成逼真的合成缺陷影象,比等待真實缺陷在產線上出現快達 10,000 倍。
工作原理:5 個簡單步驟
- 上傳一張零件的良品影象
- 標記缺陷應出現的區域
- 用通俗的英文描述缺陷(例如,"deep scratch across the surface" 或 "missing solder joint")
- 生成缺陷變化(AI 會建立逼真的結果)
- 將合成影象直接匯出到您的訓練集中
合成資料為何有效
生成的影象不僅僅是"貼上上去"的偽影。它們是與您實際的光照、相機角度和零件表面相匹配的逼真變化。AI 理解在您特定的成像條件下缺陷外觀的物理特性。
應用場景:
- 罕見缺陷: 針對從未(或很少)見過的失效模式進行訓練
- 新產品釋出: 在首件不良品下線之前就構建好檢測
- 邊緣案例: 生成臨界樣本以改進 AI 的決策邊界
- 資料增強: 用合成的多樣性補充小資料集
實際演示
最佳方法:先用最初的 3-5 張真實影象進行訓練,識別 AI 表現不佳的地方,然後使用 Defect Studio 針對這些特定的失效模式生成有針對性的合成樣本。真實資料建立基線;合成資料填補空白。
訓練檢查清單
繼續之前,請確認:
- 已捕獲初始影象,每個類別至少 10-15 張
- 所有標籤已仔細複核(View All ROIs)
- 已使用實時預覽進行訓練和測試
- 已識別失效模式並新增針對性資料
- 已完成 2-4 輪 標記 → 訓練 → 測試 迭代
- 結果符合預期
模型已訓練且效果良好?請前往 第 5 步:設定輸出。