第4步:训练你的 AI 模型
Time: 5–10 minutes
您的检查区域已设置。现在是时候让 AI 了解“好”和“坏”的外观。
训练的三条基本规则
在开始之前,请牢记这三条规则。无论你是在训练 classifier 还是 segmenter,无论是 5 张图像还是 500 张图像,这些规则都适用。
规则 1:仅从图像标注
切勿 从物理部件查看(或将其放在显微镜下)来判断它是良好还是不良。如果你在相机图像中看不到缺陷,AI 就无法学习它。
AI 不是魔法。它只能处理相机看到的内容。若你基于你在触摸部件或在放大镜下观察时注意到的某些因素而将部件标注为“defective”,但相机图像看起来正常,你就是在教 AI 看到不存在的东西。
如果你不能仅从图像本身对其进行标注,请返回安装步骤并修正物理设置:更好的镜头、更好的照明、靠近安装、不同角度。
规则 2:对标签进行双重和三重检查
标注错误会发生在每个人身上;有经验的工程师也会犯错。但在一个小型数据集中,一个错误的标签就会摧毁你的结果。
用 5 张训练图像时,一个错误标签会污染你训练数据的 20%。这是灾难性的。
在每次训练运行之前: 点击 View All ROIs 并逐一核对每个注释。这是最容易修复且影响最大的改动。
规则 3:从小做起,快速迭代
不要标注 50 张图像然后再开始训练。相反,建立一个紧凑的循环:每个类别标注 3-5 张图像,在开发模式下训练(大约 30 秒),测试并尝试打破它,然后在失败处添加有针对性的数据。重复这个循环 2-4 次,在开发模式下完成后再切换到生产模式。
这个循环是获得一个良好模型的最快路径。将其在开发模式下运行 2-4 次,然后切换到生产模式。
逐步训练工作流
1. 捕获初始训练图像
在配方激活且零件流动(或手动放置)的情况下,捕获图像。起步需要每个类别至少 3-5 张图像。
对于一个简单的通过/不通过检查:
- 良好部件的 3-5 张图像
- 缺陷部件的 3-5 张图像
2. 标注图像

对于每张图像中的每个 ROI,请分配正确的类别标签:
- Classifier: 从下拉菜单中选择类别(例如“pass”或“fail”)
- Segmenter: 使用画笔工具逐像素涂抹缺陷区域
如果你不确定应该使用 classification 还是 segmentation,请从 classification 开始。它更快标注,且适用于大多数 pass/fail 场景。请参阅 Classifier vs. Segmenter 以获取指导。
3. 在 Development Mode 下训练
点击 Train 并选择 Development Mode。这大约需要 30 秒,生成的模型的准确度大约比 production 低 20 倍,但足以检查信号。
“检查信号”是什么意思: AI 是否开始学习好与坏之间的差异?还是把一切都搞错了?
- 如果大部分情况正确 → 信号良好,继续
- 如果完全错误 → 可能出现问题。检查标签是否错误、ROI 大小、以及图像质量
4. 使用 Live Preview 进行测试

点击 Live Preview Mode,对部件进行测试。观察结果:
- 是否正确处理简单案例?
- 它在哪些方面表现吃力?
- 边缘案例是什么?
尽量让它出错。 找到它失败的案例。这些失败将是你改进的路线图。
5. 添加有针对性的数据
不要添加随机的新图像。请仅添加专门针对你发现的失败模式的图像:
- 如果它把划痕与反射混淆,请同时增加两者的示例
- 如果它漏检小缺陷,请增加更多关于小缺陷的图像
- 如果它在角落处的部件上失败,请增加更多角落示例
6. 重新训练并重新测试
重复步骤 3-5 2-4 次。每次迭代都应提高准确性。
7. 切换到 Production Mode
当开发模式运行得相对稳健时,切换到 Production Mode。这大约需要 5-10 分钟,但生成的模型的准确性大约是开发模式的 20 倍。
如果开发模式能正确处理约 80% 的案例,生产模式很可能达到 95% 及以上的正确率。
数据增强:让 AI 应对变异
数据增强在训练过程中随机修改训练图像,调整亮度、添加旋转、调整对比度等。每张图像都会在 AI 处被以略有不同的增强进行数百次处理,但标签保持不变。
这对于提升鲁棒性来说极其强大。 若你的照明在换班之间变化,亮度增强可教 AI 处理它。若部件可能以任意角度到达,旋转增强使朝向不再重要。
何时使用数据增强
| 增强 | 何时使用... | 示例场景 |
|---|---|---|
| Brightness | 光照变化(日/夜、阴影) | 工厂上方照明全天变化 |
| Rotation | 部件可能以任意角度到达 | 螺丝孔,朝向无关紧要 |
| Motion blur | 部件移动迅速或相机振动 | 高速传送带 |
| Saturation | 颜色不是检查的一部分 | 同一部件在不同颜色下应同样通过 |
| Contrast | 环境照明波动 | 通过窗户的季节性光线变化 |
何时不使用数据增强
这是双刃剑。如果你添加旋转增强,但你正在检查部件是否正确定向,你将教 AI 认为倒置的部件仍然是“good”。
- 检查颜色一致性?不要使用 Saturation 增强
- 检查模糊/聚焦?不要使用 Motion blur 增强
- 检查定向?不要使用 Rotation 增强
规则:对正在检查的具体属性之外的所有内容进行增强。
数据多样性的重要性
你的训练数据应覆盖 AI 在生产中可能看到的全部范围:
- 不同时间段(如果光照会变化)
- 不同批次的部件(表面处理可能略有不同)
- 部件在画面中的不同位置
- 易于与难以处理的案例
聚焦最难的案例。 如果你的训练数据包含最难分类的前 10 个部件,那么 90% 的简单部件对 AI 将变得非常容易。
高学习能力
OV 相机的 AI 设计为通过更多数据持续改进。与在 20 张图像后就趋于平稳的许多 AI 系统不同,该模型在 50、100,甚至 500+ 张图像时仍在提升。大多数检查在 5-10 张图像时表现良好,但如果你面临复杂的多缺陷问题,请继续添加数据。
使用合成数据加速:Defect Studio
如果你需要针对你很少看到的缺陷进行训练怎么办?例如你必须故意移除的螺钉、你必须创建的划痕、每千个部件才会发生一次的裂纹?花几个月时间收集足够样本并不现实。
位于 tools.overview.ai 的 The OV Auto-Defect Creator Studio 解决了这个问题。它能够生成照片级真实的合成缺陷图像,速度比等待真实缺陷在生产线出现快多达 10,000x。
工作原理:5 个简单步骤
- Upload 一张你部件的良好图像
- Mark 应出现缺陷的区域
- Describe 用简单英文描述缺陷(例如 "deep scratch across the surface" 或 "missing solder joint")
- Generate 生成缺陷变体(AI 将创建照片级真实的结果)
- Export 将合成图像直接导入到你的训练集中
为什么合成数据有效
生成的图像不仅仅是“粘贴”在现有图像上的伪影。它们是与实际照明、相机角度和部件表面相匹配的照片级真实变体。AI 能理解在你特定成像条件下缺陷的物理表现。
应用场景:
- Rare defects: 针对你从未(或很少)见过的失效模式进行训练
- New product launches: 在首批有缺陷的部件下线之前建立检测
- Edge cases: 生成边缘案例,以改进 AI 的决策边界
- Data augmentation: 用合成多样性补充小数据集
实际演示
The best approach: train with your initial 3-5 real images first, identify where the AI struggles, then use Defect Studio to generate targeted synthetic examples for those specific failure modes. Real data teaches the baseline; synthetic data fills the gaps.
训练清单
在继续之前,请确认:
- 初始图像已捕获,每类最少 3-5 张
- 所有标签已双重核对(View All ROIs)
- 在 Development mode 下训练并通过 Live Preview 进行了测试
- 已识别失败模式并添加了有针对性的数据
- 完成 2-4 次 label → train → test 的迭代
- 已训练 Production Mode;结果符合预期
模型已训练并效果良好?前往 Step 5: Setting Up Outputs.