跳到主要内容

train-ai

title: "Step 4: Train Your AI Model" sidebar_position: 9 slug: /guides/ov80i/train-ai

Step 4: Train Your AI Model

Time: 5–10 minutes

您的检查区域已设置。现在是教 AI 识别“good”和“bad”外观的时候。

The three cardinal rules of training

在正式开始之前,请牢记这三条原则。无论你是在训练一个 classifier 还是一个 segmenter,无论是 5 张图像还是 500 张。

Rule 1: Label from the image only

Never look at the physical part (or put it under a microscope) to decide whether it's good or bad. If you can't see the defect in the camera image, the AI cannot learn it.

AI 并非 魔法。它只能处理相机所看到的内容。如果你根据触摸部件或在放大镜下观察到的情况将部件标注为“defective”(有缺陷),但相机图像看起来正常,你是在教 AI 去看到其实并不存在的东西。

If you can't label it from the image alone, go back to the Install step and fix the physical setup: better lens, better lighting, closer mounting, different angle.

如果你不能仅凭图像进行标注,返回 Install 步骤并修正物理设置:更好的镜头、更好的照明、更加靠近的安装、不同的角度。

Rule 2: Double and triple check your labels

Mislabels happen to everyone; experienced engineers do it too. But one bad label in a small dataset can destroy your results.

标注错误会发生在每个人身上;有经验的工程师也会犯错。但是在很小的数据集中,一个错误的标注就可能毁掉你的结果。

With 5 training images, one mislabel corrupts 20% of your training data. That's catastrophic.

在只有 5 张训练图像的情况下,1 个错误标注会污染你训练数据的 20%。这是灾难性的。

Before every training run: Click View All ROIs and verify every single annotation. This is the easiest thing to fix and the most impactful.

在每次训练运行之前: 单击 View All ROIs 并逐一核对每个注释。这是最容易修复且影响最大的事项。

Rule 3: Start small, iterate fast

Don't label 50 images and hit train. Instead, create a tight loop: Label 3-5 images per class, train in development mode (approximately 30 seconds), test and try to break it, then add targeted data where it fails. Repeat this cycle 2-4 times in development mode, then switch to production mode.

不要标注 50 张图像然后就开始训练。相反,建立一个紧凑的循环:对每个类别标注 3-5 张图像,在开发模式下训练(大约 30 秒),测试并尝试打破它,然后在失败的地方添加有针对性的数据。重复此循环 2-4 次,在开发模式下运行,然后切换到生产模式。

This loop is your fastest path to a good model. Run it 2-4 times in development mode, then switch to production mode.

这个循环是获得良好模型的最快路径。在开发模式下运行 2-4 次,然后切换到生产模式。

Step-by-step training workflow

1. Capture initial training images

With your recipe active and parts flowing (or placed manually), capture images. You need a minimum of 3-5 images per class to start.

在配方启用且部件在流动中(或手动放置时),捕获图像。开始时,每个类别至少需要 3-5 张图像

For a simple pass/fail inspection:

  • 3-5 images of good parts
  • 3-5 images of defective parts

对于一个简单的通过/失败检查:

  • 3-5 张良品图像
  • 3-5 张不良品图像

2. Label the images

Labeling and training interface

For each ROI in each image, assign the correct class label:

  • Classifier: Select the class from a dropdown (e.g., "pass" or "fail")
  • Segmenter: Use the brush tool to paint the defective areas pixel by pixel

Labeling and training interface 上的每个 ROI,请分配正确的类别标签:

  • Classifier: 从下拉菜单中选择类别(例如 "pass" 或 "fail")
  • Segmenter: 使用绘笔工具逐像素涂绘缺陷区域
Classification is faster to label

If you're not sure whether to use classification or segmentation, start with classification. It's much faster to label and good for most pass/fail scenarios. See Classifier vs. Segmenter for guidance.

分类标注更快

如果你不确定要使用分类(Classification)还是分割(Segmentation),从分类开始。标注更快,适用于大多数通过/失败场景。请参阅 Classifier vs. Segmenter 以获取指导。

3. Train in Development Mode

Click Train and select Development Mode. This takes about 30 seconds and produces a model that's roughly 20x less accurate than production, but it's enough to check the signal.

单击 Train 并选择 Development Mode。这大约需要 30 秒,并生成一个准确度大约是生产模式的1/20的模型,但足以用于查看信号。

What "checking the signal" means: Is the AI starting to learn the difference between good and bad? Or is it getting everything completely wrong?

“检查信号”是什么意思:AI 开始学习 good 与 bad 之间的差异了吗?还是完全把一切都搞错了?

  • If it's mostly right → great signal, keep going 如果大部分正确 → 信号良好,继续

  • If it's completely wrong → something is off. Check for mislabels, check ROI size, check image quality 如果完全错误 → 可能出了问题。检查标注是否错误、ROI 大小、图像质量。

4. 实时预览测试

实时预览模式:在实时测试您的模型

点击 实时预览模式 并对部件进行测试。观察结果:

  • 它是否正确处理简单案例?
  • 它在哪些方面表现不佳?
  • 边界案例有哪些?

尽量找出它的失败案例。 找出它失败的案例。这些失败将成为改进的路线图。

5. 添加定向数据

不要添加随机的新图像。添加专门针对你发现的失败模式的图像:

  • 如果它把划痕与反射混淆,请同时增加两者的示例
  • 如果它错过了小缺陷,请增加更多小缺陷的图像
  • 如果它在角落处的零件上表现不佳,请增加更多角落样本

6. 重新训练与再测试

将步骤 3-5 重复两到四次。每次迭代都应提升准确性。

7. 切换到生产模式

当开发模式运行得相当顺利时,切换到 生产模式。这大约需要 5-10 分钟,但会产生一个比开发模式高出约 20 倍准确度的模型。

如果开发模式能处理约 80% 的案例,生产模式很可能达到 95% 及以上。

数据增强:教 AI 处理变异

数据增强在训练过程中随机修改您的训练图像,包括调整亮度、增加旋转、调整对比度等。每张图像在略有不同的增强下被输入 AI 数百次,但标签保持不变。

这对提升鲁棒性极其有效。 如果你的照明在班次之间变化,亮度增强可以让 AI 学会应对它。如果零件可能以任意角度到达,旋转增强使定向无关紧要。

何时使用数据增强

增强使用情形典型场景
亮度照明变化(白天/夜晚、阴影)车间顶灯整日变化
旋转零件可能以任意角度到达螺孔等定向不重要的情况
运动模糊零件移动迅速或相机振动高速传送带
饱和度颜色不是你检验的属性同一零件在不同颜色下也应通过
对比度环境照明波动通过窗户的季节性光线变化

何时不要使用数据增强

不要对你正在检查的对象进行数据增强

这是双刃剑。如果你添加了旋转增强,但你正在检查 部件是否正确定向,你将教会 AI 倾向于认为倒置的部件也是“良好”的。

  • 检查颜色一致性?不要使用饱和度增强
  • 检查模糊/聚焦?不要使用运动模糊增强
  • 检查定向?不要使用旋转增强

数据多样性很重要

你的训练数据应覆盖 AI 在生产中将看到的全部范围:

  • 不同时间段(若照明变化)
  • 不同批次的零件(表面处理可能略有不同)
  • 零件在画面中的不同位置
  • 同时包含简单和困难的案例

聚焦最困难的案例。 如果你的训练数据包含前十个最难分类的零件,那么 90% 的简单零件对 AI 将变得非常容易。

高学习能力

OV 相机的 AI 旨在随着更多数据持续改进。与在 20 张图像后趋于停滞的许多 AI 系统不同,该模型会在 50 张、100 张,甚至 500 张以上的图像后继续改进。大多数检查在 5-10 张图像时就能很好地工作,但如果你遇到一个复杂的多缺陷问题,请继续添加数据。

通过合成数据加速:Defect Studio

如果你需要训练一个很少见的缺陷,该怎么办?比如一个你需要有意移除的螺丝、一个你必须制造的划痕,或每千个部件才会出现一次的裂纹?花几个月时间来收集足够的样本并不现实。

The OV Auto-Defect Creator Studiotools.overview.ai 解决了这个问题。它能够生成具有真实感的合成缺陷图像,快高达 10,000 倍,比在生产线上等待真实缺陷出现要快。

工作原理:5 个简单步骤

  1. 上传 部件的高质量图片
  2. 标记 应该出现缺陷的区域
  3. 用通俗英文描述 缺陷(例如“deep scratch across the surface” 或 “missing solder joint”)
  4. 生成 缺陷变体(AI 会生成真实感极强的结果)
  5. 导出 合成图像,直接进入您的训练集

为什么合成数据有效

生成的图像不仅仅是“粘贴上去”的伪影。它们是与您实际照明、相机角度和部件表面相匹配的真实感变体。AI 理解在您特定成像条件下缺陷看起来的物理规律。

应用场景:

  • 罕见缺陷: 针对您从未(或极少)见过的失效模式进行训练
  • 新产品推出: 在第一件有缺陷的部件下线前构建检验
  • 边缘情况: 生成边界样本以改进 AI 的决策边界
  • 数据增强: 用合成的多样性来补充小型数据集

实际演示

从真实数据开始,通过合成数据加速

最佳做法:先用初始的 3-5 张真实图像进行训练,找出 AI 的薄弱环节,然后使用 Defect Studio 为这些特定的失效模式生成有针对性的合成示例。真实数据提供基线;合成数据弥补差距。

训练清单

在继续之前,请确认:

  • 初始图像已捕获,每类至少 3-5 张
  • 所有标签均已再次核对(查看所有 ROI)
  • 开发模式已训练并通过 Live Preview 测试
  • 已识别故障模式并添加有针对性的数据
  • 2-4 轮标注 → 训练 → 测试完成
  • 生产模式已训练;结果符合预期

模型已训练且效果良好吗?前往 Step 5: Setting Up Outputs