AI 驱动文档
您想了解什么?
第4步:训练您的 AI 模型
您的检验区域已设置。现在是时候教会 AI 区分“良品”和“不良品”了。
训练的三条基本原则
在开始之前,请牢记这三条原则。无论是训练一个 Classifier 还是一个 Segmenter,使用 5 张图像还是 500 张图像,均适用。
规则1:仅从图像进行标注
切勿通过观察实际部件(或放在显微镜下)来判断其是否良品。如果在相机图像中看不到缺陷,AI 就无法学习。
AI 不是魔法。它只能处理相机看到的内容。如果你根据触摸部件或在放大镜下看到的某些特征将部件标注为 "defective",但相机图像看起来正常,你是在教 AI 去看到并不存在的东西。
如果无法仅从图像进行标注,请返回 Install 步骤并修复物理设置:更好的镜头、更好的照明、靠近安装、不同角度。
规则2:对标注进行反复核对
标注错误会发生在每个人身上;经验丰富的工程师也会犯错。但在一个小数据集中,只有一个错误的标注就会破坏你的结果。
使用 5 张训练图像时,一个错误标注就会污染训练数据的 20%。这是灾难性的。
在每次训练运行前: 点击 View All ROIs 并逐一核对每一个注释。这是最容易修复且影响最大的步骤。
规则3:从小处开始,快速迭代
不要标注 50 张图像后再开始训练。相反,建立一个紧凑的循环:每个类别标注 3-5 张图像,在 development mode 训练(大约 30 秒),测试并尝试打破它,然后在失败处添加有针对性的数据。重复 2-4 次使用 development mode 之后再切换到 production mode。
这个循环是获得良好模型的最快路径。在 development mode 下运行 2-4 次,然后切换到 production mode。
逐步训练工作流程
1. 捕获初始训练图像
在您的配方处于激活状态且部件在流动中(或手动放置)的情况下,进行图像捕获。起始需要每个类别至少3-5 张图像。
对于一个简单的通过/不通过检验:
- 3-5 张良品部件图像
- 3-5 张不良部件图像
2. 标注图像

对于每张图像中的每个 ROI,分配正确的类别标签:
- Classifier: 从下拉列表中选择类别(例如 "pass" 或 "fail")
- Segmenter: 使用刷子工具逐像素涂抹缺陷区域
如果你不确定是使用 Classification 还是 Segmenter,请先从 Classification 开始。它在标注方面更快,并且适用于大多数通过/不通过场景。请参阅 Classifier vs. Segmenter 以获取指导。
3. 在 Development Mode 进行训练
点击 Train 并选择 Development Mode。这大约需要 30 秒,所生成的模型的准确性大约只有生产模式的 1/20,但足以检查信号。
“检查信号”到底是什么意思:AI 是开始学习良品与不良品之间的差异,还是几乎把一切都搞错了?
- 如果它大部分正确 → 信号良好,继续
- 如果它完全错误 → 出现问题。请检查标注是否有误、ROI 大小、以及图像质量
4. 使用实时预览进行测试

点击 实时预览模式 并对部件进行测试。观察结果:
- 它是否正确处理简单案例?
- 它在哪些方面表现困难?
- 边界案例有哪些?
尝试让它失败。 找出它失败的案例。这些失败将成为改进的路线图。
5. 添加有针对性的数据
不要添加随机的新图像。请添加专门针对你发现的失败模式的图像:
- 如果它把划痕和反射混淆,请多提供两者的示例
- 如果它漏检微小缺陷,请增加更多微小缺陷的图像
- 如果它在角落部件上失效,请增加更多角落部件的示例
6. 重新训练和重新测试
重复执行步骤 3-5 两到四次。每次迭代都应提高准确性。
7. 切换到生产模式
当开发模式运行相对稳定时,切换到 生产模式。这大约需要 5-10 分钟,但产生的模型的准确性大约比开发模式高出 20 倍。
如果开发模式能够正确处理约 80% 的案例,生产模式可能达到 95% 以上。
数据增强:教 AI 应对变化
数据增强在训练过程中随机修改你的训练图像,调整亮度、添加旋转、微调对比度等。每张图像在略有不同的增强下会被输入到 AI 数百次,但标签保持不变。
这对于建立鲁棒性极其强大。 若在换班之间光照变化,亮度增强会教 AI 处理它。若部件可能以任意角度到达,旋转增强使定向变得无关紧要。
何时使用增强
| 增强类型 | 使用时机 | 示例场景 |
|---|---|---|
| Brightness | 光照变化(白天/夜晚、阴影) | 工厂顶灯全天变化 |
| Rotation | 部件可在任意角度到达 | 螺孔等,方向不影响 |
| Motion blur | 部件移动迅速或相机振动 | 高速传送带 |
| Saturation | 颜色不是检查项 | 同一部件在不同颜色下应同样通过 |
| Contrast | 环境光照波动 | 通过窗户的季节性光线变化 |
何时不使用增强
这是一把双刃剑。若你添加旋转增强,但你正在检查 部件是否定向正确,你将教 AI 颠倒的部件仍然是“良好”的。
- 检查颜色一致性?不要使用饱和度增强
- 检查模糊/焦点?不要使用运动模糊增强
- 检查定向?不要使用旋转增强
规则:对所有属性进行增强,唯独你正在检查的具体属性除外。
数据多样性很重要
你的训练数据应覆盖生产环境中 AI 将看到的全部范围:
- 不同时间段(若光照变化)
- 不同部件批次(表面处理可能略有不同)
- 部件在画面中的不同位置
- 易于辨认和较难辨认的案例
关注最难的案例。 如果你的训练数据包含了 10 个最难分类的部件,那么 90% 的易部件对 AI 来说将是微不足道的。
高学习能力
OV 相机的 AI 设计用于随着数据增多而持续提升。与在获得约 20 张图像后就会达到瓶颈的众多 AI 系统不同,该模型可以随着 50、100,甚至 500 张以上图像继续改进。大多数检测在 5-10 张图像时就能良好工作,但如果您遇到复杂的多缺陷问题,请继续添加数据。
使用合成数据加速:Defect Studio
如果您需要为很少出现的缺陷进行训练怎么办?例如需要故意移除的螺丝、需要创建的划痕、每千件才会发生一次的裂纹?花费数月时间收集足够样本并不实际。
The OV Auto-Defect Creator Studio 位于 tools.overview.ai,解决了这个问题。它能够生成真实感的合成缺陷图像,速度高达 10,000 倍 的提升,相比等待真实缺陷在生产线出现。
工作原理:5 个简单步骤
- 上传 您部件的良好图像
- 标注 应出现缺陷的区域
- 描述 缺陷,请用简明英文描述(例如“表面上的深划痕”或“焊点缺失”)
- 生成 缺陷变体(AI 将生成真实感结果)
- 导出 合成图像直接进入您的训练集
为什么合成数据有效
生成的图像不仅仅是简单地“粘贴”得到的伪影。它们是与您实际照明、相机角度和部件表面相匹配的真实感变体。AI 了解在您特定成像条件下缺陷的外观物理特性。
使用场景:
- 罕见缺陷: 针对您从未(或很少)见过的失效模式进行训练
- 新产品发布: 在第一批有缺陷的部件下线前建立检测
- 边缘情况: 生成边界示例以提升 AI 的决策边界
- 数据增强: 用合成多样性补充小型数据集
实际演示
最佳做法:先用初始的 3-5 张真实图像进行训练,识别 AI 的薄弱点,然后使用 Defect Studio 为这些特定失效模式生成定向的合成示例。真实数据提供基线;合成数据用于弥补差距。
训练清单
在继续之前,请确认:
- 已捕获初始图像,每类最少 3-5 张
- 所有标签已反复核对(查看所有 ROI)
- 开发模式已训练并通过 Live Preview 测试
- 已识别失效模式并新增定向数据
- 2-4 次标签 → 训练 → 测试的迭代完成
- 生产模式已训练;结果符合预期
模型已训练且效果良好?前往 步骤 5:输出设置.