AI 驱动文档
您想了解什么?
随着时间改进您的模型
您的检测系统已部署。随着条件变化、出现新的缺陷类型,或规格演变,如何保持其高效运行?
库:您的持续改进工具
摄像头拍摄的每张画面都会保存在 Library 中,并附带 AI 的预测和置信度分数。这是您用于改进的金矿。

找出 AI 出错的地方
- 转到 Library
- 浏览最近的捕获
- 查找两项内容:
- Misses: AI 的预测明显错误的图像(每个缩略图左上角的复选框)
- Low-confidence predictions: 在任意图像向下滚动以查看置信度值。置信度低表示 AI 不确定
在小型数据集中,单个错误标签会产生过大的影响。仅有 5 张训练图像时,1 个错误标签就会污染约 20% 的数据。重新训练前请始终仔细核对每个标签,尤其是在数据集较小时。
使用定向数据重新训练
- 选择 AI 出错或不确定的图像
- 点击 "Add to Active Recipe Train Set"
- 如有需要,修正标签
- 点击 Retrain
聚焦 misses 与 low-confidence 捕获,而非随机的新数据。这是提高效率的最有效方法。
如果您需要查看 AI 对特定图像的确切预测,请将保存的 JPEG 上传到 Metadata Viewer. OV 相机会将预测结果、置信度分数和相机设置直接嵌入到每张捕获的图像中。
随着数据集规模的增长,逐一核对每个标签变得不切实际。Haystack 让您可视化地浏览训练数据、将相似图像聚集在一起,并能快速发现看起来不对劲的标签。请定期运行以保持数据集清洁。
分类器改进工作流
- 审核 Library 图像 → 找出错误和低置信度预测
- 将它们添加到训练集
- 如有需要,重新标注
- 重新训练
- 使用 Haystack 以可视化方式浏览数据并在大规模数据中发现错误标注的图像
分割器改进工作流
Segmenters take longer to label (pixel-level annotation), so there's a shortcut:
分割器需要更长时间进行标注(像素级注释),因此有一个快捷方式:
- 将问题图像导入分割配方
- 点击 Generate Predictions,让模型尽可能地对新图像进行预标注
- Fix the predictions,而不是从头开始标注(快得多)
- 重新训练
在分割中减少假阳性
如果您的分割器检测到大量不应存在的小随机斑点,您有两种强大工具:从通过/失败逻辑中过滤掉小斑点,以及训练模型以更好地理解“正常”看起来应是怎样的。
使用最小尺寸阈值滤除小斑点
最快的修复方法是让系统忽略低于某个像素面积的斑点。相对于真实缺陷,微小的噪点斑点几乎总是很小,因此尺寸过滤器可以将它们排除,同时不影响实际检测。
在 Basic Mode (IO Logic): 在通过/不通过设置中设定 minimum blob area 阈值。任何小于此像素数的斑点将完全被忽略。先从 50 像素开始,逐步调整,直到噪声消失但真实缺陷仍被触发为止。
在 Advanced Mode (Node-RED): 通过在您的函数节点中按 blob.pixel_count 过滤斑点。例如,要忽略小于 50 像素的任意斑点:
const minBlobSize = 50;
const allBlobs = msg.payload.segmentation.blobs;
const realBlobs = allBlobs.filter(blob => blob.pixel_count >= minBlobSize);
const results = realBlobs.length <1; // Pass if no real blobs remain
msg.payload = results;
return msg;
根据您的应用调整 minBlobSize 值。查看调试输出中噪声斑点与真实缺陷的像素计数,以找到合适的阈值。
向训练集添加良品图像
这是减少假阳性检测的最有效、也是人们最常忽略的单一方法。
问题在于:如果你只用包含缺陷的图像进行训练,模型从未学习过干净零件的外观。它开始把正常表面纹理、光照渐变和细小变异——所有你在对抗的小随机斑点——误认为“缺陷”。
解决方法:
- 进入 Library,寻找 良品图像——表面干净、无缺陷
- 将这些图像添加到训练集 (Add to Active Recipe Train Set)
- 在标注视图中,选择 ROI,但 不要添加任何缺陷注释。如原样包含,不做上色标记
- 重新训练模型
通过向模型展示“正常”样子的示例,你是在教它不要把普通表面变化误判为缺陷。这会显著降低噪声。
指导原则:
- 从 3-5 张良品图像开始并重新训练。测试结果
- 如果噪声仍然存在,添加更多。目标是在缺陷图像中混合至少 20-30 张良品图像
- 这点尤为重要,如果你的初始训练集仅包含带缺陷的图像
- 确保良品图像覆盖生产中看到的正常变异范围(不同光照、轻微色差、表面纹理)
九成以上,当有人抱怨到处出现随机小斑点时,根本原因是训练集中没有良品图像。添加它们并重新训练——改进通常是即时且显著的。
降低噪声的其他技巧
- 提升光照一致性。 不一致的光照会产生阴影和高光,模型可能将其误认为缺陷。请确保内置 LEDs 配置正确,外部光源不会造成眩光或阴影的偏移
- 检查模板对齐。 如果对齐器工作不佳,ROI 在拍摄之间会发生偏移。模型每次看到的背景区域不同,导致噪声增加。请验证对齐稳定性
- 使用 Accurate(production)训练模式。 开发模式速度快但精度较低。在判断分割质量之前,请始终在 production 模式下重新训练
- 分步迭代。 添加 3-5 张良品图像,重新训练,测试。重复直到结果干净。这比一次性导入 50 张图像并寄希望于最佳结果要快。
哲学
- 持续迭代。 AI 具有高学习能力,随着 50、100,甚至 500+ 张图像的增加会持续改进
- 有针对性地定位失败。 不要随意添加数据。加入 AI 运行困难的情形
- 定期检查误标。 随着数据集增长,误标更难发现,但仍会损害准确性
使用 GenAI 工具加速
三款 AI 驱动的工具位于 tools.overview.ai,可以显著加速你的改进循环:
- Defect Studio -- 生成高保真合成缺陷图像,速度比等待真实缺陷快多达 10,000x
- Integration Builder -- 根据简单英文描述构建生产就绪的 Node-RED 流
- AI Expert Helper -- 对任何相机问题提供 24/7 专家指导
这些工具合力可将部署时间从数日缩短到数小时。生成合成训练数据以替代等待真实缺陷、按需求描述即可构建集成、并随时获得专家指导,无需等待支持工单。