跳到主要内容

AI 驱动文档

您想了解什么?

随着时间的推移改进您的模型

您的检测系统已部署。现在,如何在条件变化、新缺陷类型出现或规格演变时保持其良好性能?

库:您的持续改进工具

相机拍摄的每一张图像都会保存在中,连同 AI 的预测和置信度评分。这是您改进的金矿。

库视图:浏览捕获,按预测和置信度过滤

找出 AI 错误的地方

  1. 转到
  2. 浏览最近的捕获
  3. 查找两个方面:
    • 漏检: AI 的预测明显错误的图像(每个缩略图左上角的复选框)
    • 低置信度预测: 在任何图像上向下滚动以查看置信度值。低置信度 = AI 不确定
错误标记的图像可能会显著影响准确性

在小数据集中,一张错误标记的图像会产生过大的影响。仅有 5 张训练图像时,单个错误标签会损坏 20% 的数据。在重新训练之前,始终仔细检查标签,尤其是在数据集较小的情况下。

使用目标数据重新训练

  1. 选择 AI 错误或不确定的图像
  2. 点击**“添加到活动配方训练集”**
  3. 如有需要,修正标签
  4. 点击重新训练

将库中的图像添加到您的训练集中

专注于漏检和低置信度捕获,而不是随机的新数据。这是提高效率的最佳方式。

使用元数据查看器检查保存的图像

如果您需要查看 AI 在特定图像上的确切预测,请将保存的 JPEG 上传到[元数据查看器][[[URL_2]]。OV 相机将预测结果、置信度评分和相机设置直接嵌入到每张捕获的图像中。

分类器改进工作流程

  1. 审查库中的图像 → 找出错误和低置信度预测
  2. 将它们添加到训练集中
  3. 如有需要,重新标记
  4. 重新训练
  5. 使用Haystack可视化探索您的数据,快速找到大规模错误标记的图像

分割器改进工作流程

分割器需要更长时间进行标记(像素级注释),因此有一个快捷方式:

  1. 将问题图像导入分割配方
  2. 点击生成预测,让模型尽可能预标记新图像
  3. 修正预测,而不是从头开始标记(速度更快)
  4. 重新训练
使用 Haystack 大规模识别错误标记

Haystack 是一个可视化数据探索工具,允许您浏览整个训练集并快速识别看起来不合适的图像。随着数据集超过 50-100 张图像,手动审查变得不切实际。Haystack 将相似图像聚集在一起,使错误标记的异常值在视觉上突出。

减少分割中的假阳性

如果您的分割器捕捉到许多不应存在的小随机斑点,您可以使用两个强大的工具:从通过/失败逻辑中过滤小斑点,以及训练模型更好地理解“正常”是什么样子。

过滤掉小的斑点,设定最小尺寸阈值

最快的解决方案是告诉系统忽略小于某个像素面积的斑点。小的噪声斑点通常与真实缺陷相比非常微小,因此尺寸过滤器可以在不影响实际检测的情况下消除它们。

在基本模式 (IO 逻辑) 中: 在合格/不合格设置中设定 最小斑点面积 阈值。任何小于此像素计数的斑点将被完全忽略。可以从 50 像素的值开始,并向上调整,直到噪声消失但真实缺陷仍然被触发。

在高级模式 (Node-RED) 中: 在你的函数节点中通过 blob.pixel_count 过滤斑点。例如,要忽略任何小于 50 像素的斑点:

const minBlobSize = 50;
const allBlobs = msg.payload.segmentation.blobs;
const realBlobs = allBlobs.filter(blob => blob.pixel_count >= minBlobSize);
const results = realBlobs.length <1; // Pass if no real blobs remain
msg.payload = results;
return msg;

根据你的应用调整 minBlobSize 值。查看调试输出中噪声斑点与真实缺陷的像素计数,以找到合适的截止值。

将良好图像添加到训练集中

这是减少误报检测的最有效方法,也是人们最常忽视的方法。

问题:如果你只用包含缺陷的图像进行训练,模型从未学习过干净部件的样子。它开始在正常表面纹理、光照渐变和微小变化中看到“缺陷”——所有你正在对抗的小随机斑点。

如何解决:

  1. 前往 ,找到 良好部件 的图像——没有缺陷的干净表面
  2. 将这些图像添加到训练集 (添加到活动配方训练集)
  3. 在标记视图中,选择 ROI,但 不要添加任何缺陷注释。只需按原样包含它们,无需涂抹标记
  4. 重新训练模型

通过向模型展示“正常”样子的示例,你在教它停止将普通表面变化标记为缺陷。这大大减少了噪声。

指导原则:

  • 从 3-5 张良好图像开始并重新训练。测试结果
  • 如果噪声仍然存在,添加更多。目标是至少 20-30 张良好图像与缺陷图像混合
  • 如果你的初始训练集仅包含缺陷图像,这一点尤其重要
  • 确保良好图像覆盖生产中你所见的正常变化范围(不同的光照、轻微的颜色变化、表面纹理)
这是减少噪声分割器的首要解决方案

十有八九,当有人抱怨随机小斑点到处出现时,根本原因是训练集中没有良好图像。添加它们并重新训练——改善通常是立即且显著的。

减少噪声的其他建议

  • 改善光照一致性。 不一致的光照会产生阴影和高光,模型可能会将其误认为缺陷。确保内置 LED 配置正确,外部光源不会造成眩光或阴影移动
  • 检查模板对齐。 如果对齐器工作不良,ROI 在捕获之间会发生偏移。模型每次看到不同的背景区域,这会增加噪声。验证对齐是否稳定
  • 使用准确(生产)训练模式。 开发模式快速但精度较低。在判断分割质量之前,始终在生产模式下重新训练
  • 逐步迭代。 添加 3-5 张良好图像,重新训练,测试。重复直到结果干净。这比一次性添加 50 张图像并希望得到最佳结果要快得多

理念

  • 不断迭代。 AI 具有很高的学习能力,随着图像数量的增加(50、100,甚至 500+),它会不断改进。
  • 针对性地解决失败。 不要随意添加数据。添加 AI 遇到困难的案例。
  • 定期检查错误标记。 随着数据集的增长,错误标记变得更难发现,但仍然会影响准确性。

利用 GenAI 工具加速

tools.overview.ai 上的三个 AI 驱动工具可以显著加快您的改进周期:

  • 缺陷工作室 -- 生成逼真的合成缺陷图像,速度比等待真实缺陷快多达 10,000 倍。
  • 集成构建器 -- 从简单的英语描述构建生产就绪的 Node-RED 流程。
  • AI 专家助手 -- 随时获得关于任何相机问题的专家指导。
GenAI 工具包优势

这三种工具结合在一起,可以将您的部署时间从几天缩短到几小时。生成合成训练数据,而不是等待真实缺陷,通过描述您想要的内容来构建集成,并在无需等待支持票的情况下获得即时专家指导。

查看完整的 GenAI 工具包指南