AI 驅動文件
您想了解什麼?
隨著時間改進您的模型
您的檢測系統已部署。隨著條件變化、出現新的缺陷型別,或規格演變,如何保持其高效執行?
庫:您的持續改進工具
攝像頭拍攝的每張畫面都會儲存在 Library 中,並附帶 AI 的預測和置信度分數。這是您用於改進的金礦。

找出 AI 出錯的地方
- 轉到 Library
- 瀏覽最近的捕獲
- 查詢兩項內容:
- Misses: AI 的預測明顯錯誤的影象(每個縮圖左上角的覈取方塊)
- Low-confidence predictions: 在任意影象向下滾動以檢視置信度值。置信度低表示 AI 不確定
在小型資料集中,單個錯誤標籤會產生過大的影響。僅有 5 張訓練影象時,1 個錯誤標籤就會汙染約 20% 的資料。重新訓練前請始終仔細核對每個標籤,尤其是在資料集較小時。
使用定向資料重新訓練
- 選擇 AI 出錯或不確定的影象
- 點選 "Add to Active Recipe Train Set"
- 如有需要,修正標籤
- 點選 Retrain
聚焦 misses 與 low-confidence 捕獲,而非隨機的新資料。這是提高效率的最有效方法。
如果您需要檢視 AI 對特定影象的確切預測,請將儲存的 JPEG 上傳到 Metadata Viewer. OV 相機會將預測結果、置信度分數和相機設定直接嵌入到每張捕獲的影象中。
隨著資料集規模的增長,逐一核對每個標籤變得不切實際。Haystack 讓您視覺化地瀏覽訓練資料、將相似影象聚集在一起,並能快速發現看起來不對勁的標籤。請定期執行以保持資料集清潔。
分類器改進工作流
- 稽覈 Library 影象 → 找出錯誤和低置信度預測
- 將它們新增到訓練集
- 如有需要,重新標註
- 重新訓練
- 使用 Haystack 以視覺化方式瀏覽資料並在大規模資料中發現錯誤標註的影象
分割器改進工作流
Segmenters take longer to label (pixel-level annotation), so there's a shortcut:
分割器需要更長時間進行標註(畫素級註釋),因此有一個快捷方式:
- 將問題影象匯入分割配方
- 點選 Generate Predictions,讓模型儘可能地對新影象進行預標註
- Fix the predictions,而不是從頭開始標註(快得多)
- 重新訓練
在分割中減少假陽性
如果您的分割器檢測到大量不應存在的小隨機斑點,您有兩種強大工具:從透過/失敗邏輯中過濾掉小斑點,以及訓練模型以更好地理解“正常”看起來應是怎樣的。
使用最小尺寸閾值濾除小斑點
最快的修復方法是讓系統忽略低於某個畫素面積的斑點。相對於真實缺陷,微小的噪點斑點幾乎總是很小,因此尺寸過濾器可以將它們排除,同時不影響實際檢測。
在 Basic Mode (IO Logic): 在透過/不透過設定中設定 minimum blob area 閾值。任何小於此畫素數的斑點將完全被忽略。先從 50 畫素開始,逐步調整,直到噪聲消失但真實缺陷仍被觸發為止。
在 Advanced Mode (Node-RED): 透過在您的函式節點中按 blob.pixel_count 過濾斑點。例如,要忽略小於 50 畫素的任意斑點:
const minBlobSize = 50;
const allBlobs = msg.payload.segmentation.blobs;
const realBlobs = allBlobs.filter(blob => blob.pixel_count >= minBlobSize);
const results = realBlobs.length <1; // Pass if no real blobs remain
msg.payload = results;
return msg;
根據您的應用調整 minBlobSize 值。檢視除錯輸出中噪聲斑點與真實缺陷的畫素計數,以找到合適的閾值。
向訓練集新增良品影象
這是減少假陽性檢測的最有效、也是人們最常忽略的單一方法。
問題在於:如果你只用包含缺陷的影象進行訓練,模型從未學習過乾淨零件的外觀。它開始把正常表面紋理、光照漸變和細小變異——所有你在對抗的小隨機斑點——誤認為“缺陷”。
解決方法:
- 進入 Library,尋找 良品影象——表面乾淨、無缺陷
- 將這些影象新增到訓練集 (Add to Active Recipe Train Set)
- 在標註檢視中,選擇 ROI,但 不要新增任何缺陷註釋。如原樣包含,不做上色標記
- 重新訓練模型
透過向模型展示“正常”樣子的示例,你是在教它不要把普通表面變化誤判為缺陷。這會顯著降低噪聲。
指導原則:
- 從 3-5 張良品影象開始並重新訓練。測試結果
- 如果噪聲仍然存在,新增更多。目標是在缺陷影象中混合至少 20-30 張良品影象
- 這點尤為重要,如果你的初始訓練集僅包含帶缺陷的影象
- 確保良品影象覆蓋生產中看到的正常變異範圍(不同光照、輕微色差、表面紋理)
九成以上,當有人抱怨到處出現隨機小斑點時,根本原因是訓練集中沒有良品影象。新增它們並重新訓練——改進通常是即時且顯著的。
降低噪聲的其他技巧
- 提升光照一致性。 不一致的光照會產生陰影和高光,模型可能將其誤認為缺陷。請確保內建 LEDs 配置正確,外部光源不會造成眩光或陰影的偏移
- 檢查模板對齊。 如果對齊器工作不佳,ROI 在拍攝之間會發生偏移。模型每次看到的背景區域不同,導致噪聲增加。請驗證對齊穩定性
- 使用 Accurate(production)訓練模式。 開發模式速度快但精度較低。在判斷分割質量之前,請始終在 production 模式下重新訓練
- 分步迭代。 新增 3-5 張良品影象,重新訓練,測試。重複直到結果乾淨。這比一次性匯入 50 張影象並寄希望於最佳結果要快。
哲學
- 持續迭代。 AI 具有高學習能力,隨著 50、100,甚至 500+ 張影象的增加會持續改進
- 有針對性地定位失敗。 不要隨意新增資料。加入 AI 執行困難的情形
- 定期檢查誤標。 隨著資料集增長,誤標更難發現,但仍會損害準確性
使用 GenAI 工具加速
三款 AI 驅動的工具位於 tools.overview.ai,可以顯著加速你的改進迴圈:
- Defect Studio -- 生成高保真合成缺陷影象,速度比等待真實缺陷快多達 10,000x
- Integration Builder -- 根據簡單英文描述構建生產就緒的 Node-RED 流
- AI Expert Helper -- 對任何相機問題提供 24/7 專家指導
這些工具合力可將部署時間從數日縮短到數小時。生成合成訓練資料以替代等待真實缺陷、按需求描述即可構建整合、並隨時獲得專家指導,無需等待支援工單。