跳到主要内容

AI 驱动文档

您想了解什么?

第4步:训练您的 AI 模型

您的检验区域已设置。现在是时候教会 AI 区分“良品”和“不良品”了。

训练的三条基本原则

在开始之前,请牢记这三条原则。无论是训练一个 Classifier 还是一个 Segmenter,使用 5 张图像还是 500 张图像,均适用。

规则1:仅从图像进行标注

切勿通过观察实际部件(或放在显微镜下)来判断其是否良品。如果在相机图像中看不到缺陷,AI 就无法学习。

AI 不是魔法。它只能处理相机看到的内容。如果你根据触摸部件或在放大镜下看到的某些特征将部件标注为 "defective",但相机图像看起来正常,你是在教 AI 去看到并不存在的东西。

如果无法仅从图像进行标注,请返回 Install 步骤并修复物理设置:更好的镜头、更好的照明、靠近安装、不同角度。

规则2:对标注进行反复核对

标注错误会发生在每个人身上;经验丰富的工程师也会犯错。但在一个小数据集中,只有一个错误的标注就会破坏你的结果。

使用 5 张训练图像时,一个错误标注就会污染训练数据的 20%。这是灾难性的。

在每次训练运行前: 点击 View All ROIs 并逐一核对每一个注释。这是最容易修复且影响最大的步骤。

规则3:从小处开始,快速迭代

不要标注 50 张图像后再开始训练。相反,建立一个紧凑的循环:每个类别标注 3-5 张图像,在 development mode 训练(大约 30 秒),测试并尝试打破它,然后在失败处添加有针对性的数据。重复 2-4 次使用 development mode 之后再切换到 production mode。

这个循环是获得良好模型的最快路径。在 development mode 下运行 2-4 次,然后切换到 production mode。

逐步训练工作流程

1. 捕获初始训练图像

在您的配方处于激活状态且部件在流动中(或手动放置)的情况下,进行图像捕获。起始需要每个类别至少3-5 张图像

对于一个简单的通过/不通过检验:

  • 3-5 张良品部件图像
  • 3-5 张不良部件图像

2. 标注图像

标注与训练界面

对于每张图像中的每个 ROI,分配正确的类别标签:

  • Classifier: 从下拉列表中选择类别(例如 "pass" 或 "fail")
  • Segmenter: 使用刷子工具逐像素涂抹缺陷区域
分类标注更快

如果你不确定是使用 Classification 还是 Segmenter,请先从 Classification 开始。它在标注方面更快,并且适用于大多数通过/不通过场景。请参阅 Classifier vs. Segmenter 以获取指导。

3. 在 Development Mode 进行训练

点击 Train 并选择 Development Mode。这大约需要 30 秒,所生成的模型的准确性大约只有生产模式的 1/20,但足以检查信号。

“检查信号”到底是什么意思:AI 是开始学习良品与不良品之间的差异,还是几乎把一切都搞错了?

  • 如果它大部分正确 → 信号良好,继续
  • 如果它完全错误 → 出现问题。请检查标注是否有误、ROI 大小、以及图像质量

4. 使用实时预览进行测试

实时预览模式:实时测试您的模型

点击 实时预览模式 并对部件进行测试。观察结果:

  • 它是否正确处理简单案例?
  • 它在哪些方面表现困难?
  • 边界案例有哪些?

尝试让它失败。 找出它失败的案例。这些失败将成为改进的路线图。

5. 添加有针对性的数据

不要添加随机的新图像。请添加专门针对你发现的失败模式的图像:

  • 如果它把划痕和反射混淆,请多提供两者的示例
  • 如果它漏检微小缺陷,请增加更多微小缺陷的图像
  • 如果它在角落部件上失效,请增加更多角落部件的示例

6. 重新训练和重新测试

重复执行步骤 3-5 两到四次。每次迭代都应提高准确性。

7. 切换到生产模式

当开发模式运行相对稳定时,切换到 生产模式。这大约需要 5-10 分钟,但产生的模型的准确性大约比开发模式高出 20 倍。

如果开发模式能够正确处理约 80% 的案例,生产模式可能达到 95% 以上。

数据增强:教 AI 应对变化

数据增强在训练过程中随机修改你的训练图像,调整亮度、添加旋转、微调对比度等。每张图像在略有不同的增强下会被输入到 AI 数百次,但标签保持不变。

这对于建立鲁棒性极其强大。 若在换班之间光照变化,亮度增强会教 AI 处理它。若部件可能以任意角度到达,旋转增强使定向变得无关紧要。

何时使用增强

增强类型使用时机示例场景
Brightness光照变化(白天/夜晚、阴影)工厂顶灯全天变化
Rotation部件可在任意角度到达螺孔等,方向不影响
Motion blur部件移动迅速或相机振动高速传送带
Saturation颜色不是检查项同一部件在不同颜色下应同样通过
Contrast环境光照波动通过窗户的季节性光线变化

何时不使用增强

不要对你正在检查的对象进行增强

这是一把双刃剑。若你添加旋转增强,但你正在检查 部件是否定向正确,你将教 AI 颠倒的部件仍然是“良好”的。

  • 检查颜色一致性?不要使用饱和度增强
  • 检查模糊/焦点?不要使用运动模糊增强
  • 检查定向?不要使用旋转增强

规则:对所有属性进行增强,唯独你正在检查的具体属性除外。

数据多样性很重要

你的训练数据应覆盖生产环境中 AI 将看到的全部范围:

  • 不同时间段(若光照变化)
  • 不同部件批次(表面处理可能略有不同)
  • 部件在画面中的不同位置
  • 易于辨认和较难辨认的案例

关注最难的案例。 如果你的训练数据包含了 10 个最难分类的部件,那么 90% 的易部件对 AI 来说将是微不足道的。

高学习能力

OV 相机的 AI 设计用于随着数据增多而持续提升。与在获得约 20 张图像后就会达到瓶颈的众多 AI 系统不同,该模型可以随着 50、100,甚至 500 张以上图像继续改进。大多数检测在 5-10 张图像时就能良好工作,但如果您遇到复杂的多缺陷问题,请继续添加数据。

使用合成数据加速:Defect Studio

如果您需要为很少出现的缺陷进行训练怎么办?例如需要故意移除的螺丝、需要创建的划痕、每千件才会发生一次的裂纹?花费数月时间收集足够样本并不实际。

The OV Auto-Defect Creator Studio 位于 tools.overview.ai,解决了这个问题。它能够生成真实感的合成缺陷图像,速度高达 10,000 倍 的提升,相比等待真实缺陷在生产线出现。

工作原理:5 个简单步骤

  1. 上传 您部件的良好图像
  2. 标注 应出现缺陷的区域
  3. 描述 缺陷,请用简明英文描述(例如“表面上的深划痕”或“焊点缺失”)
  4. 生成 缺陷变体(AI 将生成真实感结果)
  5. 导出 合成图像直接进入您的训练集

为什么合成数据有效

生成的图像不仅仅是简单地“粘贴”得到的伪影。它们是与您实际照明、相机角度和部件表面相匹配的真实感变体。AI 了解在您特定成像条件下缺陷的外观物理特性。

使用场景:

  • 罕见缺陷: 针对您从未(或很少)见过的失效模式进行训练
  • 新产品发布: 在第一批有缺陷的部件下线前建立检测
  • 边缘情况: 生成边界示例以提升 AI 的决策边界
  • 数据增强: 用合成多样性补充小型数据集

实际演示

从真实数据开始,使用合成数据加速

最佳做法:先用初始的 3-5 张真实图像进行训练,识别 AI 的薄弱点,然后使用 Defect Studio 为这些特定失效模式生成定向的合成示例。真实数据提供基线;合成数据用于弥补差距。

训练清单

在继续之前,请确认:

  • 已捕获初始图像,每类最少 3-5 张
  • 所有标签已反复核对(查看所有 ROI)
  • 开发模式已训练并通过 Live Preview 测试
  • 已识别失效模式并新增定向数据
  • 2-4 次标签 → 训练 → 测试的迭代完成
  • 生产模式已训练;结果符合预期

模型已训练且效果良好?前往 步骤 5:输出设置.