AI 驱动文档
您想了解什么?
随着时间的推移改进您的模型
您的检测系统已部署。现在,如何在条件变化、新缺陷类型出现或规格演变时保持其良好性能?
库:您的持续改进工具
相机拍摄的每一张图像都会保存在库中,连同 AI 的预测和置信度评分。这是您改进的金矿。

找出 AI 错误的地方
- 转到库
- 浏览最近的捕获
- 查找两个方面:
- 漏检: AI 的预测明显错误的图像(每个缩略图左上角的复选框)
- 低置信度预测: 在任何图像上向下滚动以查看置信度值。低置信度 = AI 不确定
在小数据集中,一张错误标记的图像会产生过大的影响。仅有 5 张训练图像时,单个错误标签会损坏 20% 的数据。在重新训练之前,始终仔细检查标签,尤其是在数据集较小的情况下。
使用目标数据重新训练
- 选择 AI 错误或不确定的图像
- 点击**“添加到活动配方训练集”**
- 如有需要,修正标签
- 点击重新训练
专注于漏检和低置信度捕获,而不是随机的新数据。这是提高效率的最佳方式。
如果您需要查看 AI 在特定图像上的确切预测,请将保存的 JPEG 上传到[元数据查看器][[[URL_2]]。OV 相机将预测结果、置信度评分和相机设置直接嵌入到每张捕获的图像中。
分类器改进工作流程
- 审查库中的图像 → 找出错误和低置信度预测
- 将它们添加到训练集中
- 如有需要,重新标记
- 重新训练
- 使用Haystack可视化探索您的数据,快速找到大规模错误标记的图像
分割器改进工作流程
分割器需要更长时间进行标记(像素级注释),因此有一个快捷方式:
- 将问题图像导入分割配方
- 点击生成预测,让模型尽可能预标记新图像
- 修正预测,而不是从头开始标记(速度更快)
- 重新训练
Haystack 是一个可视化数据探索工具,允许您浏览整个训练集并快速识别看起来不合适的图像。随着数据集超过 50-100 张图像,手动审查变得不切实际。Haystack 将相似图像聚集在一起,使错误标记的异常值在视觉上突出。
减少分割中的假阳性
如果您的分割器捕捉到许多不应存在的小随机斑点,您可以使用两个强大的工具:从通过/失败逻辑中过滤小斑点,以及训练模型更好地理解“正常”是什么样子。
过滤掉小的斑点,设定最小尺寸阈值
最快的解决方案是告诉系统忽略小于某个像素面积的斑点。小的噪声斑点通常与真实缺陷相比非常微小,因此尺寸过滤器可以在不影响实际检测的情况下消除它们。
在基本模式 (IO 逻辑) 中: 在合格/不合格设置中设定 最小斑点面积 阈值。任何小于此像素计数的斑点将被完全忽略。可以从 50 像素的值开始,并向上调整,直到噪声消失但真实缺陷仍然被触发。
在高级模式 (Node-RED) 中: 在你的函数节点中通过 blob.pixel_count 过滤斑点。例如,要忽略任何小于 50 像素的斑点:
const minBlobSize = 50;
const allBlobs = msg.payload.segmentation.blobs;
const realBlobs = allBlobs.filter(blob => blob.pixel_count >= minBlobSize);
const results = realBlobs.length <1; // Pass if no real blobs remain
msg.payload = results;
return msg;
根据你的应用调整 minBlobSize 值。查看调试输出中噪声斑点与真实缺陷的像素计数,以找到合适的截止值。
将良好图像添加到训练集中
这是减少误报检测的最有效方法,也是人们最常忽视的方法。
问题:如果你只用包含缺陷的图像进行训练,模型从未学习过干净部件的样子。它开始在正常表面纹理、光照渐变和微小变化中看到“缺陷”——所有你正在对抗的小随机斑点。
如何解决:
- 前往 库,找到 良好部件 的图像——没有缺陷的干净表面
- 将这些图像添加到训练集 (添加到活动配方训练集)
- 在标记视图中,选择 ROI,但 不要添加任何缺陷注释。只需按原样包含它们,无需涂抹标记
- 重新训练模型
通过向模型展示“正常”样子的示例,你在教它停止将普通表面变化标记为缺陷。这大大减少了噪声。
指导原则:
- 从 3-5 张良好图像开始并重新训练。测试结果
- 如果噪声仍然存在,添加更多。目标是至少 20-30 张良好图像与缺陷图像混合
- 如果你的初始训练集仅包含缺陷图像,这一点尤其重要
- 确保良好图像覆盖生产中你所见的正常变化范围(不同的光照、轻微的颜色变化、表面纹理)
十有八九,当有人抱怨随机小斑点到处出现时,根本原因是训练集中没有良好图像。添加它们并重新训练——改善通常是立即且显著的。
减少噪声的其他建议
- 改善光照一致性。 不一致的光照会产生阴影和高光,模型可能会将其误认为缺陷。确保内置 LED 配置正确,外部光源不会造成眩光或阴影移动
- 检查模板对齐。 如果对齐器工作不良,ROI 在捕获之间会发生偏移。模型每次看到不同的背景区域,这会增加噪声。验证对齐是否稳定
- 使用准确(生产)训练模式。 开发模式快速但精度较低。在判断分割质量之前,始终在生产模式下重新训练
- 逐步迭代。 添加 3-5 张良好图像,重新训练,测试。重复直到结果干净。这比一次性添加 50 张图像并希望得到最佳结果要快得多
理念
- 不断迭代。 AI 具有很高的学习能力,随着图像数量的增加(50、100,甚至 500+),它会不断改进。
- 针对性地解决失败。 不要随意添加数据。添加 AI 遇到困难的案例。
- 定期检查错误标记。 随着数据集的增长,错误标记变得更难发现,但仍然会影响准确性。
利用 GenAI 工具加速
在 tools.overview.ai 上的三个 AI 驱动工具可以显著加快您的改进周期:
- 缺陷工作室 -- 生成逼真的合成缺陷图像,速度比等待真实缺陷快多达 10,000 倍。
- 集成构建器 -- 从简单的英语描述构建生产就绪的 Node-RED 流程。
- AI 专家助手 -- 随时获得关于任何相机问题的专家指导。
这三种工具结合在一起,可以将您的部署时间从几天缩短到几小时。生成合成训练数据,而不是等待真实缺陷,通过描述您想要的内容来构建集成,并在无需等待支持票的情况下获得即时专家指导。