跳到主要内容

AI 驱动文档

您想了解什么?

随着时间改进您的模型

您的检测系统已部署。随着条件变化、出现新的缺陷类型,或规格演变,如何保持其高效运行?

库:您的持续改进工具

摄像头拍摄的每张画面都会保存在 Library 中,并附带 AI 的预测和置信度分数。这是您用于改进的金矿。

Library 视图:浏览捕获、按预测和置信度筛选

找出 AI 出错的地方

  1. 转到 Library
  2. 浏览最近的捕获
  3. 查找两项内容:
    • Misses: AI 的预测明显错误的图像(每个缩略图左上角的复选框)
    • Low-confidence predictions: 在任意图像向下滚动以查看置信度值。置信度低表示 AI 不确定
一张标注错误的图像可能显著降低准确性

在小型数据集中,单个错误标签会产生过大的影响。仅有 5 张训练图像时,1 个错误标签就会污染约 20% 的数据。重新训练前请始终仔细核对每个标签,尤其是在数据集较小时。

使用定向数据重新训练

  1. 选择 AI 出错或不确定的图像
  2. 点击 "Add to Active Recipe Train Set"
  3. 如有需要,修正标签
  4. 点击 Retrain

将 Library 图像添加到训练集

聚焦 misses 与 low-confidence 捕获,而非随机的新数据。这是提高效率的最有效方法。

使用 Metadata Viewer 查看保存的图像

如果您需要查看 AI 对特定图像的确切预测,请将保存的 JPEG 上传到 Metadata Viewer. OV 相机会将预测结果、置信度分数和相机设置直接嵌入到每张捕获的图像中。

使用 Haystack 在大规模数据中发现错误标签

随着数据集规模的增长,逐一核对每个标签变得不切实际。Haystack 让您可视化地浏览训练数据、将相似图像聚集在一起,并能快速发现看起来不对劲的标签。请定期运行以保持数据集清洁。

分类器改进工作流

  1. 审核 Library 图像 → 找出错误和低置信度预测
  2. 将它们添加到训练集
  3. 如有需要,重新标注
  4. 重新训练
  5. 使用 Haystack 以可视化方式浏览数据并在大规模数据中发现错误标注的图像

分割器改进工作流

Segmenters take longer to label (pixel-level annotation), so there's a shortcut:

分割器需要更长时间进行标注(像素级注释),因此有一个快捷方式:

  1. 将问题图像导入分割配方
  2. 点击 Generate Predictions,让模型尽可能地对新图像进行预标注
  3. Fix the predictions,而不是从头开始标注(快得多)
  4. 重新训练

在分割中减少假阳性

如果您的分割器检测到大量不应存在的小随机斑点,您有两种强大工具:从通过/失败逻辑中过滤掉小斑点,以及训练模型以更好地理解“正常”看起来应是怎样的。

使用最小尺寸阈值滤除小斑点

最快的修复方法是让系统忽略低于某个像素面积的斑点。相对于真实缺陷,微小的噪点斑点几乎总是很小,因此尺寸过滤器可以将它们排除,同时不影响实际检测。

在 Basic Mode (IO Logic): 在通过/不通过设置中设定 minimum blob area 阈值。任何小于此像素数的斑点将完全被忽略。先从 50 像素开始,逐步调整,直到噪声消失但真实缺陷仍被触发为止。

在 Advanced Mode (Node-RED): 通过在您的函数节点中按 blob.pixel_count 过滤斑点。例如,要忽略小于 50 像素的任意斑点:

const minBlobSize = 50;
const allBlobs = msg.payload.segmentation.blobs;
const realBlobs = allBlobs.filter(blob => blob.pixel_count >= minBlobSize);
const results = realBlobs.length <1; // Pass if no real blobs remain
msg.payload = results;
return msg;

根据您的应用调整 minBlobSize 值。查看调试输出中噪声斑点与真实缺陷的像素计数,以找到合适的阈值。

向训练集添加良品图像

这是减少假阳性检测的最有效、也是人们最常忽略的单一方法。

问题在于:如果你只用包含缺陷的图像进行训练,模型从未学习过干净零件的外观。它开始把正常表面纹理、光照渐变和细小变异——所有你在对抗的小随机斑点——误认为“缺陷”。

解决方法:

  1. 进入 Library,寻找 良品图像——表面干净、无缺陷
  2. 将这些图像添加到训练集 (Add to Active Recipe Train Set)
  3. 在标注视图中,选择 ROI,但 不要添加任何缺陷注释。如原样包含,不做上色标记
  4. 重新训练模型

通过向模型展示“正常”样子的示例,你是在教它不要把普通表面变化误判为缺陷。这会显著降低噪声。

指导原则:

  • 从 3-5 张良品图像开始并重新训练。测试结果
  • 如果噪声仍然存在,添加更多。目标是在缺陷图像中混合至少 20-30 张良品图像
  • 这点尤为重要,如果你的初始训练集仅包含带缺陷的图像
  • 确保良品图像覆盖生产中看到的正常变异范围(不同光照、轻微色差、表面纹理)
这是解决噪声分割器的首要方法

九成以上,当有人抱怨到处出现随机小斑点时,根本原因是训练集中没有良品图像。添加它们并重新训练——改进通常是即时且显著的。

降低噪声的其他技巧

  • 提升光照一致性。 不一致的光照会产生阴影和高光,模型可能将其误认为缺陷。请确保内置 LEDs 配置正确,外部光源不会造成眩光或阴影的偏移
  • 检查模板对齐。 如果对齐器工作不佳,ROI 在拍摄之间会发生偏移。模型每次看到的背景区域不同,导致噪声增加。请验证对齐稳定性
  • 使用 Accurate(production)训练模式。 开发模式速度快但精度较低。在判断分割质量之前,请始终在 production 模式下重新训练
  • 分步迭代。 添加 3-5 张良品图像,重新训练,测试。重复直到结果干净。这比一次性导入 50 张图像并寄希望于最佳结果要快。

哲学

  • 持续迭代。 AI 具有高学习能力,随着 50、100,甚至 500+ 张图像的增加会持续改进
  • 有针对性地定位失败。 不要随意添加数据。加入 AI 运行困难的情形
  • 定期检查误标。 随着数据集增长,误标更难发现,但仍会损害准确性

使用 GenAI 工具加速

三款 AI 驱动的工具位于 tools.overview.ai,可以显著加速你的改进循环:

  • Defect Studio -- 生成高保真合成缺陷图像,速度比等待真实缺陷快多达 10,000x
  • Integration Builder -- 根据简单英文描述构建生产就绪的 Node-RED 流
  • AI Expert Helper -- 对任何相机问题提供 24/7 专家指导
GenAI 工具包优势

这些工具合力可将部署时间从数日缩短到数小时。生成合成训练数据以替代等待真实缺陷、按需求描述即可构建集成、并随时获得专家指导,无需等待支持工单。

查看完整 GenAI Toolkit 指南