AI 驱动文档
您想了解什么?
第 4 步:训练您的 AI 模型
您的检测区域已设置。现在是教 AI 什么是“好”和“坏”的时候了。
训练的三条基本规则
在开始之前,请牢记这三条规则。无论您是在训练分类器还是分割器,使用 5 张图像还是 500 张,它们都适用。
规则 1:仅从图像中标记
绝不要查看实物零件(或将其放在显微镜下)来判断它是好是坏。如果您在相机图像中看不到缺陷,AI 就无法学习到它。
AI 不是魔法。它只能处理相机所看到的内容。如果您根据触摸或放大镜下观察到的内容将零件标记为“有缺陷”,但相机图像看起来正常,那么您正在教 AI 看到不存在的东西。
如果您无法仅从图像中标记它,请返回安装步骤并修复物理设置:更好的镜头、更好的照明、更近的安装、不同的角度。
规则 2:仔细检查您的标签
错误标记每个人都会遇到;经验丰富的工程师也会犯错。但在小数据集中,一个错误标签可能会毁掉您的结果。
在 5 张训练图像中,一个错误标记会破坏 20% 的训练数据。这是灾难性的。
在每次训练运行之前: 点击 查看所有 ROI 并验证每一个注释。这是最容易修复且影响最大的事情。
规则 3:从小开始,快速迭代
不要标记 50 张图像然后点击训练。相反,创建一个紧凑的循环:每个类别标记 3-5 张图像,在开发模式下训练(大约 30 秒),测试并尝试突破,然后在失败的地方添加有针对性的数据。重复这个循环 2-4 次在开发模式下,然后切换到生产模式。
这个循环是您获得良好模型的最快途径。在开发模式下运行 2-4 次,然后切换到生产模式。
分步训练工作流程
1. 捕获初始训练图像
在您的配方处于活动状态并且零件流动(或手动放置)时,捕获图像。您需要每个类别至少 3-5 张图像 来开始。
对于简单的合格/不合格检测:
- 3-5 张合格零件的图像
- 3-5 张有缺陷零件的图像
2. 标记图像

对于每个图像中的每个 ROI,分配正确的类别标签:
- 分类器: 从下拉菜单中选择类别(例如,“合格”或“不合格”)
- 分割器: 使用画笔工具逐像素绘制缺陷区域
如果您不确定是使用分类还是分割,请从分类开始。标记速度更快,适用于大多数合格/不合格场景。有关指导,请参见 分类器与分割器。
3. 在开发模式下训练
点击 训练 并选择 开发模式。这大约需要 30 秒,并生成一个准确率大约是生产模式的 20 倍低的模型,但足以检查信号。
“检查信号”意味着什么: AI 是否开始学习好与坏之间的区别?还是完全错误?
- 如果大部分正确 → 信号良好,继续
- 如果完全错误 → 有问题。检查错误标记,检查 ROI 大小,检查图像质量
4. 使用实时预览进行测试

点击 实时预览模式 并运行零件。观察结果:
- 它能正确处理简单案例吗?
- 它在哪些方面遇到困难?
- 边界案例是什么?
尝试突破它。 找出它失败的案例。这些失败是您改进的路线图。
5. 添加针对性数据
不要添加随机的新图像。添加专门针对您发现的失败模式的图像:
- 如果它将划痕与反射混淆,请添加更多这两种情况的示例
- 如果它漏掉小缺陷,请添加更多小缺陷的图像
- 如果它在角落的零件上失败,请添加更多角落示例
6. 重新训练和重新测试
重复步骤 3-5 两到四次。每次迭代应该提高准确性。
7. 切换到生产模式
当开发模式运行得相当顺利时,切换到 生产模式。这需要 5-10 分钟,但会生成一个大约 准确性提高 20 倍 的模型。
如果开发模式能正确处理 80% 的案例,生产模式可能会达到 95% 以上的准确率。
增强:教会 AI 处理变异
增强在训练过程中随机修改您的训练图像,调整亮度、添加旋转、调整对比度等。每张图像会以稍微不同的增强方式输入给 AI 数百次,但标签保持不变。
这对于构建鲁棒性非常强大。 如果您的照明在班次之间变化,亮度增强教会 AI 处理这种情况。如果零件可以以任何角度到达,旋转增强使方向变得无关紧要。
何时使用增强
| 增强 | 使用时... | 示例场景 |
|---|---|---|
| 亮度 | 照明变化(白天/夜晚,阴影) | 工厂的顶灯在一天中变化 |
| 旋转 | 零件可以以任何角度到达 | 螺丝孔,方向无关紧要 |
| 运动模糊 | 零件移动快速或相机震动 | 高速输送带 |
| 饱和度 | 颜色不是您检查的一部分 | 相同零件的不同颜色应该同样通过 |
| 对比度 | 环境照明波动 | 通过窗户的季节性光变化 |
何时不使用增强
这是把双刃剑。如果您添加了旋转增强,但您正在检查 零件是否正确定向,您将教会 AI 颠倒的零件仍然是“好”的。
- 检查颜色一致性?不要使用饱和度增强
- 检查模糊/对焦?不要使用运动模糊增强
- 检查方向?不要使用旋转增强
规则: 增强所有内容,除了您正在检查的特定属性。
数据多样性很重要
您的训练数据应代表 AI 在生产中将看到的全范围:
- 不同的时间(如果照明变化)
- 不同的零件批次(表面处理可能略有不同)
- 零件在框架中的不同位置
- 包括简单和困难的案例
关注最困难的案例。 如果您的训练数据包括 10 个最难分类的零件,那么 90% 的简单零件对 AI 来说将是微不足道的。
高学习能力
OV 相机的 AI 旨在通过更多数据不断改进。与许多在 20 张图像后停滞不前的 AI 系统不同,该模型在 50、100,甚至 500+ 张图像的情况下继续改进。大多数检查在 5-10 张图像下效果良好,但如果您遇到复杂的多缺陷问题,请不要犹豫,继续添加数据。
通过合成数据加速:缺陷工作室
如果您需要训练一个您很少见到的缺陷呢?一个缺失的螺丝,您必须故意移除,一个您必须制造的划痕,或者一个每千个零件才出现一次的裂缝?等待几个月以收集足够的示例并不实际。
OV 自动缺陷创建者工作室在 tools.overview.ai 解决了这个问题。它生成逼真的合成缺陷图像,速度比在生产线上等待真实缺陷出现快 10,000 倍。
工作原理:5 个简单步骤
- 上传 您零件的良好图像
- 标记 缺陷应出现的区域
- 描述 缺陷的具体情况(例如,“表面深划痕”或“缺失的焊点”)
- 生成 缺陷变体(AI 创建逼真的结果)
- 导出 合成图像直接进入您的训练集
为什么合成数据有效
生成的图像不仅仅是“粘贴上去”的伪影。它们是与您实际的照明、相机角度和零件表面相匹配的逼真变体。AI 理解在您特定成像条件下缺陷的物理表现。
使用案例:
- 稀有缺陷: 针对您从未(或很少)见过的失效模式进行训练
- 新产品发布: 在第一件缺陷零件下线之前构建检查
- 边缘案例: 生成临界示例以改善 AI 的决策边界
- 数据增强: 用合成多样性补充小数据集
观看实际效果
最佳方法:首先使用您最初的 3-5 张真实图像进行训练,识别 AI 的薄弱环节,然后使用缺陷工作室为这些特定失效模式生成有针对性的合成示例。真实数据教会基础;合成数据填补空白。
训练检查清单
在继续之前,请确认:
- 初始图像已捕获,每类至少 3-5 张
- 所有标签已仔细检查(查看所有 ROI)
- 开发模式已训练并通过实时预览测试
- 失效模式已识别并添加了针对性数据
- 完成了 2-4 次标签 → 训练 → 测试的迭代
- 生产模式已训练;结果符合预期
模型训练良好?请转到 步骤 5:设置输出.