跳到主要内容

AI 驱动文档

您想了解什么?

第四步:训练您的 AI 模型

您的感兴趣区域 (ROI) 已设置完毕。现在是时候教 AI 识别"好"与"坏"了。

训练的三条基本规则

在做其他事情之前,请牢记这三条规则。无论您训练的是分类器还是分割器,使用 5 张图像还是 500 张图像,它们都适用。

规则 1:仅从图像进行标注

切勿通过查看实物零件(或将其放在显微镜下)来判断其好坏。如果您无法在相机图像中看到缺陷,AI 就无法学习它。

AI 不是魔法。它只能基于相机所看到的内容进行工作。如果您因为通过触摸或在放大镜下放大查看而发现某些问题,从而将零件标记为"有缺陷",但相机图像看起来正常,那么您就是在教 AI 看到并不存在的东西。

如果您无法仅凭图像进行标注,请返回安装步骤并修复物理设置:更好的镜头、更好的照明、更近的安装位置、不同的角度。

规则 2:反复检查您的标签

错误标注每个人都会发生;经验丰富的工程师也会犯错。但在小型数据集中,一个错误标签就可能毁掉您的结果。

对于 5 张训练图像,一个错误标签会污染**20%**的训练数据。这是灾难性的。

在每次训练运行之前:点击View All ROIs并验证每一个标注。这是最容易修复且影响最大的事情。

规则 3:从小处着手,快速迭代

不要标注 50 张图像然后就开始训练。相反,建立一个紧凑的循环:每个类别标注 10-15 张图像,训练(大约 30 秒),测试并尝试找出问题,然后在失败的地方添加针对性数据。重复这个循环 2-4 次。

这个循环是您获得良好模型的最快路径。

分步训练工作流程

1. 捕获初始训练图像

在程序处于活动状态且零件正在流转(或手动放置)的情况下,捕获图像。每个类别至少需要10-15 张图像才能开始。

对于简单的通过/失败检测:

  • 10-15 张良品零件的图像
  • 10-15 张缺陷零件的图像

2. 定义您的类别

选择您要训练的模型类型,然后阅读相应的说明。下面的切换在第 2 步和第 3 步之间保持同步,您的选择会保存在 URL 中,因此即使刷新或分享也不会丢失。

在标注界面中,添加每种检测类型所需的类别。常见的分类器类别集:

  • Pass / Fail
  • Present / Absent
  • Good / Scratched / Cracked

一开始保持简单。您随时可以稍后添加类别。

3. 标注图像

分类器标注:从下拉菜单中为每个 ROI 选择一个类别

每个 ROI 都有自己的分类类别 — 选择描述该图像中该 ROI 的类别(例如 "pass" 或 "fail")。

分类标注更快

如果您不确定使用分类还是分割,请从分类开始。它的标注速度快得多,并且适用于大多数 pass/fail 场景。请参阅 Classifier vs. Segmenter 获取指导。

4. 训练模型

点击 Train。分类器提供两种训练模式:

  • Fast 模式 — 大约 30 秒到 1 分钟。最适合在设置过程中进行快速迭代、检查标签的合理性以及处理简单/可明显区分的部件。准确率低于生产模式,但能让您快速看到结果。
  • Production 模式 — 耗时较长,但生成的模型明显更准确。在部署到产线之前,请始终使用 Production 模式。对于棘手的部件、难以区分的缺陷或您将在生产中信任的任何内容,Production 模式是正确的选择。

一个良好的节奏:在清理标签和添加数据时使用 Fast 模式迭代,当结果看起来不错时运行一次 Production —— 并在部署前再运行一次。

5. 使用实时预览进行测试

点击 Live Preview Mode 并让零件通过。观察结果:

  • 它是否能正确处理简单情况?
  • 它在哪些方面会遇到困难?
  • 哪些是临界情况?

尝试让它失效。 找出它失败的案例。这些失败就是你改进的路线图。

分类器实时预览:每个 ROI 的判定结果和置信度分数

测试面板会显示每个 ROI 的预测 类别置信度分数。运行几次捕获,找出低置信度的判定(通常低于 70%)——这些就是你的临界案例,也是接下来最值得标注的零件。

6. 添加针对性的数据

不要随意添加新图像。要专门针对你发现的失败模式添加图像:

  • 如果它将划痕与反光混淆,请添加更多这两类的示例
  • 如果它漏检小缺陷,请添加更多小缺陷的图像
  • 如果它在边角处的零件上失败,请添加更多边角处的示例

7. 重新训练和重新测试

重复步骤 4-6 两到四次。每次迭代都应该提升准确率。如需更深入的指导——包括如何在不丢失之前训练的情况下向现有模型添加新图像——请参阅 添加数据与重新训练

数据增强:教 AI 处理变化

数据增强会在训练过程中随机修改你的训练图像——调整亮度、添加旋转、调整对比度等。每张图像会以略有不同的数据增强方式被反复送入 AI 数百次,但标签保持不变。这就是让模型在不必为每种可能的变化都采集示例的情况下,对真实环境保持鲁棒性的方法。

默认应该开启哪些

少量的亮度变化几乎总是值得开启的——即使是控制最严格的工厂,也会有顶灯闪烁、班次中阴影变化以及 LED 随时间的轻微漂移。亮度增强基本上可以免费地让模型对这些变化具有鲁棒性。

旋转:有用,但要注意 ROI 形状

如果你的零件确实可能以不同角度到达(传送带上松动的螺丝、手工放置的零件、任何未固定的物件),旋转增强非常有用。但它与 ROI 形状有相互影响:

  • 方形 ROI: 旋转增强可以正常工作——旋转后的图像仍然能容纳在 ROI 框内。
  • 分类器上的非方形 ROI: 旋转可能会裁剪图像。当一个高而窄的 ROI 旋转 45° 时,旋转后内容的角会落在框外,模型就会基于不完整的图像进行训练。如果你的零件可能旋转,要么将 ROI 设为方形,要么依靠 对齐器 在上游处理旋转,这样此处就不需要旋转增强了。
  • 分割器: 同样存在裁剪问题,但分割对此不太敏感,因为它是从像素掩码而非整体 ROI 形状中学习的。

何时不应使用特定的数据增强

通用规则:不要对正在检测的属性进行数据增强。 如果您想检测方向,旋转数据增强会让模型认为颠倒的零件依然是"良好"的。

  • 检测颜色一致性? 不要使用饱和度数据增强。
  • 检测模糊/对焦? 不要使用运动模糊数据增强。
  • 检测方向? 不要使用旋转数据增强(也很可能不应使用对齐器)。

数据多样性很重要

您的训练数据应涵盖 AI 在生产环境中将看到的全部范围:

  • 不同的时间段(如果光照会变化)
  • 不同的零件批次(表面处理可能略有差异)
  • 在画面中处于不同位置的零件
  • 简单和困难的情况都要有

重点关注最困难的情况。 如果您的训练数据包含了 10 个最难分类的零件,那么剩下 90% 的简单零件对 AI 来说将易如反掌。

高学习能力

OV 相机的 AI 设计为可以随着数据增多而持续改进。不像许多 AI 系统在 20 张图像后就遇到瓶颈,此模型可以在 50 张、100 张甚至 500 张以上的图像下继续提升。大多数检测在 5-10 张图像下就能很好地运行,但如果您面对的是复杂的多缺陷问题,请不要犹豫,继续添加数据。

使用合成数据加速:Defect Studio

如果您需要为很少见到的缺陷进行训练,该怎么办?比如必须刻意拆除才能产生的缺失螺钉、必须人为制造的划痕、或每千个零件才出现一次的裂纹?等待数月以收集足够样本并不现实。

位于 tools.overview.aiOV Auto-Defect Creator Studio 解决了这个问题。它可以生成逼真的合成缺陷图像,比等待真实缺陷在生产线上出现快多达 10,000 倍

工作原理:5 个简单步骤

  1. 上传 您零件的良品图像
  2. 标记 缺陷应出现的区域
  3. 用简明英语描述 缺陷(例如,"表面上的深划痕"或"缺失的焊点")
  4. 生成 缺陷变化(AI 会创建逼真的结果)
  5. 导出 合成图像,直接进入您的训练集

为什么合成数据有效

生成的图像并非简单"贴上去"的伪影。它们是与您的实际光照、相机角度和零件表面相匹配的逼真变化。AI 理解在您特定成像条件下缺陷外观的物理规律。

使用场景:

  • 稀有缺陷: 训练您从未(或极少)见过的失效模式
  • 新产品发布: 在第一个不良品下线之前就建立好检测
  • 边缘案例: 生成临界样本以改进 AI 的决策边界
  • 数据增强: 使用合成的多样性补充小型数据集

实际演示

从真实数据开始,用合成数据加速

最佳做法:首先使用最初的 3-5 张真实图像进行训练,找出 AI 表现不佳之处,然后使用 Defect Studio 针对那些特定失效模式生成有针对性的合成样本。真实数据建立基线;合成数据填补空缺。

训练检查清单

在继续之前,请确认:

  • 已捕获初始图像,每个类别至少 10-15 张
  • 所有标签均已复核(View All ROIs)
  • 已通过实时预览完成训练和测试
  • 已识别故障模式并添加针对性数据
  • 已完成 2-4 轮 标注 → 训练 → 测试 迭代
  • 结果符合预期

模型已训练完成且表现良好?请前往 第 5 步:设置输出