train-ai
title: "Step 4: Train Your AI Model" sidebar_position: 9 slug: /guides/ov80i/train-ai
Step 4: Train Your AI Model
Time: 5–10 minutes
您的检查区域已设置。现在是教 AI 识别“good”和“bad”外观的时候。
The three cardinal rules of training
在正式开始之前,请牢记这三条原则。无论你是在训练一个 classifier 还是一个 segmenter,无论是 5 张图像还是 500 张。
Rule 1: Label from the image only
Never look at the physical part (or put it under a microscope) to decide whether it's good or bad. If you can't see the defect in the camera image, the AI cannot learn it.
AI 并非 魔法。它只能处理相机所看到的内容。如果你根据触摸部件或在放大镜下观察到的情况将部件标注为“defective”(有缺陷),但相机图像看起来正常,你是在教 AI 去看到其实并不存在的东西。
If you can't label it from the image alone, go back to the Install step and fix the physical setup: better lens, better lighting, closer mounting, different angle.
如果你不能仅凭图像进行标注,返回 Install 步骤并修正物理设置:更好的镜头、更好的照明、更加靠近的安装、不同的角度。
Rule 2: Double and triple check your labels
Mislabels happen to everyone; experienced engineers do it too. But one bad label in a small dataset can destroy your results.
标注错误会发生在每个人身上;有经验的工程师也会犯错。但是在很小的数据集中,一个错误的标注就可能毁掉你的结果。
With 5 training images, one mislabel corrupts 20% of your training data. That's catastrophic.
在只有 5 张训练图像的情况下,1 个错误标注会污染你训练数据的 20%。这是灾难性的。
Before every training run: Click View All ROIs and verify every single annotation. This is the easiest thing to fix and the most impactful.
在每次训练运行之前: 单击 View All ROIs 并逐一核对每个注释。这是最容易修复且影响最大的事项。
Rule 3: Start small, iterate fast
Don't label 50 images and hit train. Instead, create a tight loop: Label 3-5 images per class, train in development mode (approximately 30 seconds), test and try to break it, then add targeted data where it fails. Repeat this cycle 2-4 times in development mode, then switch to production mode.
不要标注 50 张图像然后就开始训练。相反,建立一个紧凑的循环:对每个类别标注 3-5 张图像,在开发模式下训练(大约 30 秒),测试并尝试打破它,然后在失败的地方添加有针对性的数据。重复此循环 2-4 次,在开发模式下运行,然后切换到生产模式。
This loop is your fastest path to a good model. Run it 2-4 times in development mode, then switch to production mode.
这个循环是获得良好模型的最快路径。在开发模式下运行 2-4 次,然后切换到生产模式。
Step-by-step training workflow
1. Capture initial training images
With your recipe active and parts flowing (or placed manually), capture images. You need a minimum of 3-5 images per class to start.
在配方启用且部件在流动中(或手动放置时),捕获图像。开始时,每个类别至少需要 3-5 张图像。
For a simple pass/fail inspection:
- 3-5 images of good parts
- 3-5 images of defective parts
对于一个简单的通过/失败检查:
- 3-5 张良品图像
- 3-5 张不良品图像
2. Label the images

For each ROI in each image, assign the correct class label:
- Classifier: Select the class from a dropdown (e.g., "pass" or "fail")
- Segmenter: Use the brush tool to paint the defective areas pixel by pixel
上的每个 ROI,请分配正确的类别标签:
- Classifier: 从下拉菜单中选择类别(例如 "pass" 或 "fail")
- Segmenter: 使用绘笔工具逐像素涂绘缺陷区域
If you're not sure whether to use classification or segmentation, start with classification. It's much faster to label and good for most pass/fail scenarios. See Classifier vs. Segmenter for guidance.
如果你不确定要使用分类(Classification)还是分割(Segmentation),从分类开始。标注更快,适用于大多数通过/失败场景。请参阅 Classifier vs. Segmenter 以获取指导。
3. Train in Development Mode
Click Train and select Development Mode. This takes about 30 seconds and produces a model that's roughly 20x less accurate than production, but it's enough to check the signal.
单击 Train 并选择 Development Mode。这大约需要 30 秒,并生成一个准确度大约是生产模式的1/20的模型,但足以用于查看信号。
What "checking the signal" means: Is the AI starting to learn the difference between good and bad? Or is it getting everything completely wrong?
“检查信号”是什么意思:AI 开始学习 good 与 bad 之间的差异了吗?还是完全把一切都搞错了?
-
If it's mostly right → great signal, keep going 如果大部分正确 → 信号良好,继续
-
If it's completely wrong → something is off. Check for mislabels, check ROI size, check image quality 如果完全错误 → 可能出了问题。检查标注是否错误、ROI 大小、图像质量。
4. 实时预览测试

点击 实时预览模式 并对部件进行测试。观察结果:
- 它是否正确处理简单案例?
- 它在哪些方面表现不佳?
- 边界案例有哪些?
尽量找出它的失败案例。 找出它失败的案例。这些失败将成为改进的路线图。
5. 添加定向数据
不要添加随机的新图像。添加专门针对你发现的失败模式的图像:
- 如果它把划痕与反射混淆,请同时增加两者的示例
- 如果它错过了小缺陷,请增加更多小缺陷的图像
- 如果它在角落处的零件上表现不佳,请增加更多角落样本
6. 重新训练与再测试
将步骤 3-5 重复两到四次。每次迭代都应提升准确性。
7. 切换到生产模式
当开发模式运行得相当顺利时,切换到 生产模式。这大约需要 5-10 分钟,但会产生一个比开发模式高出约 20 倍准确度的模型。
如果开发模式能处理约 80% 的案例,生产模式很可能达到 95% 及以上。
数据增强:教 AI 处理变异
数据增强在训练过程中随机修改您的训练图像,包括调整亮度、增加旋转、调整对比度等。每张图像在略有不同的增强下被输入 AI 数百次,但标签保持不变。
这对提升鲁棒性极其有效。 如果你的照明在班次之间变化,亮度增强可以让 AI 学会应对它。如果零件可能以任意角度到达,旋转增强使定向无关紧要。
何时使用数据增强
| 增强 | 使用情形 | 典型场景 |
|---|---|---|
| 亮度 | 照明变化(白天/夜晚、阴影) | 车间顶灯整日变化 |
| 旋转 | 零件可能以任意角度到达 | 螺孔等定向不重要的情况 |
| 运动模糊 | 零件移动迅速或相机振动 | 高速传送带 |
| 饱和度 | 颜色不是你检验的属性 | 同一零件在不同颜色下也应通过 |
| 对比度 | 环境照明波动 | 通过窗户的季节性光线变化 |
何时不要使用数据增强
这是双刃剑。如果你添加了旋转增强,但你正在检查 部件是否正确定向,你将教会 AI 倾向于认为倒置的部件也是“良好”的。
- 检查颜色一致性?不要使用饱和度增强
- 检查模糊/聚焦?不要使用运动模糊增强
- 检查定向?不要使用旋转增强
数据多样性很重要
你的训练数据应覆盖 AI 在生产中将看到的全部范围:
- 不同时间段(若照明变化)
- 不同批次的零件(表面处理可能略有不同)
- 零件在画面中的不同位置
- 同时包含简单和困难的案例
聚焦最困难的案例。 如果你的训练数据包含前十个最难分类的零件,那么 90% 的简单零件对 AI 将变得非常容易。
高学习能力
OV 相机的 AI 旨在随着更多数据持续改进。与在 20 张图像后趋于停滞的许多 AI 系统不同,该模型会在 50 张、100 张,甚至 500 张以上的图像后继续改进。大多数检查在 5-10 张图像时就能很好地工作,但如果你遇到一个复杂的多缺陷问题,请继续添加数据。
通过合成数据加速:Defect Studio
如果你需要训练一个很少见的缺陷,该怎么办?比如一个你需要有意移除的螺丝、一个你必须制造的划痕,或每千个部件才会出现一次的裂纹?花几个月时间来收集足够的样本并不现实。
The OV Auto-Defect Creator Studio 在 tools.overview.ai 解决了这个问题。它能够生成具有真实感的合成缺陷图像,快高达 10,000 倍,比在生产线上等待真实缺陷出现要快。
工作原理:5 个简单步骤
- 上传 部件的高质量图片
- 标记 应该出现缺陷的区域
- 用通俗英文描述 缺陷(例如“deep scratch across the surface” 或 “missing solder joint”)
- 生成 缺陷变体(AI 会生成真实感极强的结果)
- 导出 合成图像,直接进入您的训练集
为什么合成数据有效
生成的图像不仅仅是“粘贴上去”的伪影。它们是与您实际照明、相机角度和部件表面相匹配的真实感变体。AI 理解在您特定成像条件下缺陷看起来的物理规律。
应用场景:
- 罕见缺陷: 针对您从未(或极少)见过的失效模式进行训练
- 新产品推出: 在第一件有缺陷的部件下线前构建检验
- 边缘情况: 生成边界样本以改进 AI 的决策边界
- 数据增强: 用合成的多样性来补充小型数据集
实际演示
最佳做法:先用初始的 3-5 张真实图像进行训练,找出 AI 的薄弱环节,然后使用 Defect Studio 为这些特定的失效模式生成有针对性的合成示例。真实数据提供基线;合成数据弥补差距。
训练清单
在继续之前,请确认:
- 初始图像已捕获,每类至少 3-5 张
- 所有标签均已再次核对(查看所有 ROI)
- 开发模式已训练并通过 Live Preview 测试
- 已识别故障模式并添加有针对性的数据
- 2-4 轮标注 → 训练 → 测试完成
- 生产模式已训练;结果符合预期
模型已训练且效果良好吗?前往 Step 5: Setting Up Outputs。