跳到主要内容

Improving Your Model Over Time

时间:5 分钟(阅览)

您的检测已部署。随着条件变化、出现新的缺陷类型,或规格演变,如何确保其持续保持良好性能?

The Library: Your continuous improvement tool

每张相机拍摄的图像都会被保存在 Library,并附带 AI 的预测和置信度分数。这是您持续改进的金矿。

Library 视图:浏览捕获,按预测和置信度筛选

Find what the AI got wrong

  1. 转到 Library
  2. 浏览最近的捕获
  3. 查找两项:
    • Misses: AI 的预测明显错误的图像(缩略图左上角的复选框)
    • Low-confidence predictions: 在任意图像向下滚动以查看置信度值。低置信度 = AI 尚不确定
标注错误的图像可能显著降低准确性

在一个小型数据集中的一个错误标注会产生超出预期的影响。仅有 5 张训练图像时,单个错误标签会污染您数据的 20%。在重新训练前,请务必仔细核对标签,尤其是在数据集较小时。

Retrain with targeted data

  1. 选择 AI 出错或不确定的图像
  2. 点击 "Add to Active Recipe Train Set"
  3. 如有需要,修正标签
  4. 点击 Retrain

将 Library 图像添加到训练集

Focus on misses and low-confidence captures, not random new data. This is the most efficient way to improve.

Classifier improvement workflow

  1. Review Library images → 找出错误和低置信度预测
  2. Add them to the training set
  3. Relabel if needed
  4. Retrain
  5. Use Haystack to explore your data visually and find mislabeled images at scale

Segmenter improvement workflow

Segmenters take longer to label (pixel-level annotation), so there's a shortcut:

  1. 将问题图像导入分割配方 (segmentation recipe)
  2. Click Generate Predictions so the model pre-labels the new images as best it can
  3. Fix the predictions rather than labeling from scratch (much faster)
  4. Retrain
使用 Haystack 进行大规模错标识识别

Haystack is a visual data exploration tool that lets you browse your entire training set and quickly spot images that look out of place. As your dataset grows beyond 50-100 images, manual review becomes impractical. Haystack clusters similar images together, making mislabeled outliers stand out visually.

The philosophy

  • Never stop iterating. AI 具有很高的学习能力,并且随着 50、100,甚至 500+ 张图像的增加,持续改进。
  • Target failures specifically. 不要随机添加数据。添加 AI 处理困难的案例
  • Check for mislabels regularly. 随着数据集的增长,误标记变得更难发现,但仍会损害准确性

使用 GenAI 工具提速

位于 [tools.overview.ai][[URL_0]] 的三款 AI 驱动工具可显著加速您的改进周期:

  • Defect Studio -- 生成具照片级真实感的合成缺陷图像,速度比等待真实缺陷快多达 10,000 倍
  • Integration Builder -- 从纯英文描述构建生产就绪的 Node-RED 流程
  • AI Expert Helper -- 对任何相机问题提供 24/7 专家级指导
GenAI 工具包的优势

将这三款工具结合使用,您的部署时间可从数天缩短到数小时。生成合成训练数据,而无需等待真实缺陷;通过描述所需内容来构建集成;并获得即时专家指导,无需等待支持工单。

查看完整的 GenAI Toolkit 指南