Improving Your Model Over Time
时间:5 分钟(阅览)
您的检测已部署。随着条件变化、出现新的缺陷类型,或规格演变,如何确保其持续保持良好性能?
The Library: Your continuous improvement tool
每张相机拍摄的图像都会被保存在 Library,并附带 AI 的预测和置信度分数。这是您持续改进的金矿。

Find what the AI got wrong
- 转到 Library
- 浏览最近的捕获
- 查找两项:
- Misses: AI 的预测明显错误的图像(缩略图左上角的复选框)
- Low-confidence predictions: 在任意图像向下滚动以查看置信度值。低置信度 = AI 尚不确定
在一个小型数据集中的一个错误标注会产生超出预期的影响。仅有 5 张训练图像时,单个错误标签会污染您数据的 20%。在重新训练前,请务必仔细核对标签,尤其是在数据集较小时。
Retrain with targeted data
- 选择 AI 出错或不确定的图像
- 点击 "Add to Active Recipe Train Set"
- 如有需要,修正标签
- 点击 Retrain
Focus on misses and low-confidence captures, not random new data. This is the most efficient way to improve.
Classifier improvement workflow
- Review Library images → 找出错误和低置信度预测
- Add them to the training set
- Relabel if needed
- Retrain
- Use Haystack to explore your data visually and find mislabeled images at scale
Segmenter improvement workflow
Segmenters take longer to label (pixel-level annotation), so there's a shortcut:
- 将问题图像导入分割配方 (segmentation recipe)
- Click Generate Predictions so the model pre-labels the new images as best it can
- Fix the predictions rather than labeling from scratch (much faster)
- Retrain
Haystack is a visual data exploration tool that lets you browse your entire training set and quickly spot images that look out of place. As your dataset grows beyond 50-100 images, manual review becomes impractical. Haystack clusters similar images together, making mislabeled outliers stand out visually.
The philosophy
- Never stop iterating. AI 具有很高的学习能力,并且随着 50、100,甚至 500+ 张图像的增加,持续改进。
- Target failures specifically. 不要随机添加数据。添加 AI 处理困难的案例
- Check for mislabels regularly. 随着数据集的增长,误标记变得更难发现,但仍会损害准确性
使用 GenAI 工具提速
位于 [tools.overview.ai][[URL_0]] 的三款 AI 驱动工具可显著加速您的改进周期:
- Defect Studio -- 生成具照片级真实感的合成缺陷图像,速度比等待真实缺陷快多达 10,000 倍
- Integration Builder -- 从纯英文描述构建生产就绪的 Node-RED 流程
- AI Expert Helper -- 对任何相机问题提供 24/7 专家级指导
将这三款工具结合使用,您的部署时间可从数天缩短到数小时。生成合成训练数据,而无需等待真实缺陷;通过描述所需内容来构建集成;并获得即时专家指导,无需等待支持工单。