持续改进您的模型
时间:5 分钟(阅读)
您的检测系统已部署。随着条件变化、出现新缺陷类型,或规格演变,如何让它保持良好的性能?
库:您的持续改进工具
相机拍摄的每张图片都会被保存在库中,同时记录 AI 的预测结果和置信度分数。这是您进行改进的宝贵资源。

找出 AI 预测错误的地方
- 转到库
- 浏览最近的捕获项
- 查找两项内容:
- Misses(预测错误):AI 的预测明显错误的图像(缩略图左上角的复选框)
- 低置信度预测:在任意图像上向下滚动查看置信度数值。低置信度 = AI 不确定
一张标注错误的图像可能显著降低准确性
在小数据集中,单个错误标签会对数据造成过大影响。仅用 5 张训练图像时,一个错误标签就会污染约 20% 的数据。在重新训练前,请务必逐一核对每个标签,尤其在数据集较小时。
使用定向数据重新训练
- 选择 AI 出错或不确定的图像
- 点击 "Add to Active Recipe Train Set"
- 如有需要,请修正标签
- 点击 Retrain
聚焦于 Misses(预测错误)和低置信度捕获,而不是随机新增数据。这是提升效果最有效的方法。
使用 Haystack 在大规模数据中发现错标
随着数据集的增长,逐一检查每个标签变得不现实。Haystack 让您直观地浏览训练数据,聚类相似图像,并快速发现看起来不合适的标签。请定期运行以保持数据集整洁。
分类器改进工作流
- 审查库中的图像 → 查找错误和低置信度预测
- 将它们添加到训练集
- 如有需要,请重新标注
- 重新训练
- 使用 Haystack 直观地探索数据并在大规模数据中发现错误标注的图像
分割器改进工作流
分割器需要更长的标注时间(像素级注释),因此有一个快捷方法:
- 将问题图像导入 segmentation recipe
- 点击 Generate Predictions,让模型尽可能对新图像进行预标注
- Fix the predictions,而不是从头开始逐标注(更快)
- 重新训练
基本理念
- 永不止步的迭代。 AI 具有很高的学习能力,并会在 50、100,甚至 500 张以上的图像上持续改进
- 针对失败进行定位。 不要随意添加数据。添加 AI 处理困难的案例
- 定期检查标注错误。 随着数据集增长,错标变得更难发现,但仍会损害准确性
使用 GenAI 工具加速
位于 tools.overview.ai 的三款 AI 驱动工具可以显著加速改进周期:
- Defect Studio -- 生成逼真的合成缺陷图像,速度比等待真实缺陷快多达 10,000 倍
- Integration Builder -- 根据自然语言描述构建可投入生产的 Node-RED 流程
- AI Expert Helper -- 针对任何相机问题提供 24/7 的专家指导
GenAI 工具包优势
这三种工具可以将部署时间从数天缩短到数小时。生成合成训练数据,而不是等待真实缺陷;通过描述所需内容来构建集成;并获得即时的专家指导,无需等待支持工单。