跳到主要内容

持续改进您的模型

时间:5 分钟(阅读)

您的检测系统已部署。随着条件变化、出现新缺陷类型,或规格演变,如何让它保持良好的性能?

库:您的持续改进工具

相机拍摄的每张图片都会被保存在中,同时记录 AI 的预测结果和置信度分数。这是您进行改进的宝贵资源。

库视图:浏览捕获项、按预测和置信度过滤

找出 AI 预测错误的地方

  1. 转到库
  2. 浏览最近的捕获项
  3. 查找两项内容:
    • Misses(预测错误):AI 的预测明显错误的图像(缩略图左上角的复选框)
    • 低置信度预测:在任意图像上向下滚动查看置信度数值。低置信度 = AI 不确定
一张标注错误的图像可能显著降低准确性

在小数据集中,单个错误标签会对数据造成过大影响。仅用 5 张训练图像时,一个错误标签就会污染约 20% 的数据。在重新训练前,请务必逐一核对每个标签,尤其在数据集较小时。

使用定向数据重新训练

  1. 选择 AI 出错或不确定的图像
  2. 点击 "Add to Active Recipe Train Set"
  3. 如有需要,请修正标签
  4. 点击 Retrain

将库中的图像添加到训练集

聚焦于 Misses(预测错误)和低置信度捕获,而不是随机新增数据。这是提升效果最有效的方法。

使用 Haystack 在大规模数据中发现错标

随着数据集的增长,逐一检查每个标签变得不现实。Haystack 让您直观地浏览训练数据,聚类相似图像,并快速发现看起来不合适的标签。请定期运行以保持数据集整洁。

分类器改进工作流

  1. 审查库中的图像 → 查找错误和低置信度预测
  2. 将它们添加到训练集
  3. 如有需要,请重新标注
  4. 重新训练
  5. 使用 Haystack 直观地探索数据并在大规模数据中发现错误标注的图像

分割器改进工作流

分割器需要更长的标注时间(像素级注释),因此有一个快捷方法:

  1. 将问题图像导入 segmentation recipe
  2. 点击 Generate Predictions,让模型尽可能对新图像进行预标注
  3. Fix the predictions,而不是从头开始逐标注(更快)
  4. 重新训练

基本理念

  • 永不止步的迭代。 AI 具有很高的学习能力,并会在 50、100,甚至 500 张以上的图像上持续改进
  • 针对失败进行定位。 不要随意添加数据。添加 AI 处理困难的案例
  • 定期检查标注错误。 随着数据集增长,错标变得更难发现,但仍会损害准确性

使用 GenAI 工具加速

位于 tools.overview.ai 的三款 AI 驱动工具可以显著加速改进周期:

  • Defect Studio -- 生成逼真的合成缺陷图像,速度比等待真实缺陷快多达 10,000 倍
  • Integration Builder -- 根据自然语言描述构建可投入生产的 Node-RED 流程
  • AI Expert Helper -- 针对任何相机问题提供 24/7 的专家指导
GenAI 工具包优势

这三种工具可以将部署时间从数天缩短到数小时。生成合成训练数据,而不是等待真实缺陷;通过描述所需内容来构建集成;并获得即时的专家指导,无需等待支持工单。

查看完整的 GenAI Toolkit 指南