AI 驱动文档
您想了解什么?
第四步:训练您的 AI 模型
您的感兴趣区域 (ROI) 已经设置完毕。现在该教 AI 识别什么是"良好"和"不良"了。
训练的三条基本准则
在开始任何工作之前,请牢记这三条准则。无论您是训练分类器还是分割器,无论使用 5 张还是 500 张图像,这些准则都适用。
准则 1:仅从图像进行标注
绝不通过查看实际零件(或将其放在显微镜下)来判断它是好还是坏。如果您无法在相机图像中看到缺陷,AI 就无法学习它。
AI 并非魔法。它只能基于相机所见进行工作。如果您因为通过触摸零件或在放大镜下放大观察发现了某个特征而将其标注为"缺陷",但相机图像看起来正常,那么您是在教 AI 识别根本不存在的东西。
如果您无法仅从图像标注它,请返回安装步骤,修复物理设置:更好的镜头、更好的光照、更近的安装位置或不同的角度。
准则 2:反复检查您的标签
每个人都会出现标签错误;即使是经验丰富的工程师也不例外。但在小数据集中,一个错误的标签就可能毁掉您的结果。
如果只有 5 张训练图像,一个标签错误就会污染**20%**的训练数据。这是灾难性的。
在每次训练运行之前: 点击 View All ROIs,验证每一个标注。这是最容易修复且影响最大的事情。
准则 3:从小处着手,快速迭代
不要标注 50 张图像后就直接开始训练。相反,建立一个紧密的循环:每个类别标注 10-15 张图像,训练(约 30 秒),测试并尝试找出失败案例,然后在失败的地方添加针对性的数据。重复此循环 2-4 次。
这个循环是您获得良好模型的最快路径。
分步训练工作流程
1. 捕获初始训练图像
在程序处于活动状态、零件流动(或手动放置)的情况下,捕获图像。开始时每个类别至少需要 10-15 张图像。
对于简单的通过/失败检测:
- 10-15 张良好零件的图像
- 10-15 张缺陷零件的图像
2. 定义您的类别
选择您要训练的模型类型,然后阅读相应的说明。下方的切换按钮在第 2 步和第 3 步之间保持同步,您的选择会保存在 URL 中,因此即使刷新或分享也能保留。
- Classifier
- Segmenter
在标注界面中,添加每种检测类型所需的类别。常见的分类器类别集:
- Pass / Fail
- Present / Absent
- Good / Scratched / Cracked
一开始保持简单。您随时可以稍后添加类别。
在标注界面中,为您希望 AI 进行掩膜的缺陷(或特征)添加类别。常见的分割器类别集:
- Defect / Background
- Scratch / Crack / Stain
- Foreground / Background
开始时保持类别列表简短。每个类别都需要自己的画笔颜色和自己的标注示例,因此预先添加更多类别会成倍增加您的标注工作量。
3. 标注图像
- Classifier
- Segmenter

每个 ROI 都有自己的分类类别——选择能描述该图像中该 ROI 的类别(例如"pass"或"fail")。
如果您不确定使用分类还是分割,请从分类开始。它的标注速度快得多,适合大多数通过/失败的场景。请参阅Classifier vs. Segmenter以获取指导。

对于每个图像中的每个 ROI,使用画笔工具逐像素涂绘缺陷区域。涂绘的区域就是 AI 学习检测的内容——任何未涂绘的部分都将被视为背景。
分割器标签需要像素级的画笔操作,比分类器下拉选择慢,但能为您提供包含位置和形状的精确缺陷图。先从一小组定义清晰的缺陷开始,待第一个模型可以工作后再添加更多类别。
4. 训练模型
- Classifier
- Segmenter
点击 训练。分类器提供两种训练模式:
- Fast mode — 大约 30 秒到 1 分钟。最适合在设置过程中快速迭代、检查标签合理性,以及简单/易区分的零件。准确率低于生产模式,但可以让您快速看到效果。
- Production mode — 耗时较长,但产出的模型明显更准确。在部署到产线之前请务必使用 Production 模式。对于棘手的零件、难以区分的缺陷,或任何您将在生产中信赖的内容,Production 模式是正确的选择。
一个良好的节奏:在清理标签和添加数据时使用 Fast 模式迭代,结果看起来不错时运行一次 Production 模式——并在部署前再运行一次。
点击 训练。分割只有一种训练模式——Production——因为像素级掩码需要更彻底的训练过程才能可靠。训练时间随图像数量和已标注 ROI 数量而增加,因此小型初始集(每类 10-15 张图像)只需几分钟即可完成训练;更大的数据集则需要更长时间。
这里没有"快速"合理性检查选项,因此在训练前请确保您的标签是干净的(使用 View All ROIs 来检查每个掩码)。
5. 使用实时预览进行测试
点击 Live Preview Mode 并让零件通过。观察结果:
- 它是否正确处理了简单情况?
- 它在哪里遇到困难?
- 边缘情况有哪些?
尝试让它出错。 找出它失败的情况。这些失败就是您改进的路线图。
- Classifier
- Segmenter

测试面板显示每个 ROI 的预测类别和置信度分数。运行几次捕获,查找低置信度判定(通常低于 70%)——这些就是您的边缘情况,也是最值得在下一轮标注的零件。

实时预览会将预测的缺陷掩码直接叠加在图像上。注意那些过小、过大或出现在没有真实缺陷处的掩码——这些就是您将在下一轮标注数据中要针对的失败模式。
6. 添加针对性的数据
不要随意添加新图像。应针对您发现的失败模式有针对性地添加图像:
- 如果模型混淆划痕与反光,应添加更多两者的样本
- 如果模型漏检小缺陷,应添加更多小缺陷图像
- 如果模型在角落部位的零件上失败,应添加更多角落部位的样本
7. 重新训练并重新测试
重复步骤 4-6 两到四次。每次迭代都应提升准确率。如需更深入的指引——包括如何在不丢失之前训练成果的情况下向现有模型添加新图像——请参阅 添加数据与重新训练。
数据增强:教会 AI 应对变化
数据增强会在训练过程中随机修改您的训练图像——调整亮度、添加旋转、微调对比度等。每张图像会以略有差异的增强方式被多次送入 AI 进行训练,但标签保持不变。这样您无需为每种可能的变化都采集样本,就能使模型对真实世界条件具有鲁棒性。
默认应开启的项
少量的亮度变化几乎总是值得开启的——即便是控制最严格的工厂也有会闪烁的顶灯、随班次变化的阴影,以及随时间推移产生的轻微 LED 漂移。亮度增强几乎不需要任何代价就能让模型应对这些情况。
旋转:有用,但要注意 ROI 形状
如果您的零件实际上可能以不同角度到达(如传送带上松散的螺丝、手工放置的零件,或任何未被夹具固定的物体),旋转增强非常有用。但它与 ROI 形状有交互影响:
- 方形 ROI: 旋转增强能够干净地工作——旋转后的图像仍能完整放入 ROI 框内。
- 分类器上的非方形 ROI: 旋转可能会裁切图像。当一个高而窄的 ROI 被旋转 45° 时,旋转后内容的角部会落在框外,模型将在不完整的图像上进行训练。如果您的零件可能旋转,请将 ROI 设为方形,或依靠对齐器在上游处理旋转,这样这里就不需要旋转增强。
- 分割器: 同样存在裁切问题,但分割器对此较不敏感,因为它从像素掩码学习,而非整个 ROI 形状。
何时不应使用特定的数据增强
一般规则是:不要对您正在检测的属性进行增强。 如果您要检测方向,旋转增强会让模型认为颠倒的零件仍然是"良品"。
- 检测颜色一致性? 不要使用饱和度增强。
- 检测模糊/对焦? 不要使用运动模糊增强。
- 检测方向? 不要使用旋转增强(可能也不应使用对齐器)。
数据多样性很重要
您的训练数据应代表 AI 在生产环境中将会看到的全部范围:
- 一天中的不同时段(如果光照有变化)
- 不同批次的零件(表面处理可能略有差异)
- 零件在画面中的不同位置
- 简单和困难的案例都要包含
重点关注最困难的案例。 如果您的训练数据包含了 10 个最难分类的零件,那么剩下 90% 的简单零件对 AI 来说将不在话下。
高学习能力
OV 摄像头的 AI 设计为可随着数据量的增加而持续改进。与许多在 20 张图像后就达到瓶颈的 AI 系统不同,该模型在 50 张、100 张甚至 500 张以上图像的情况下仍能持续改进。大多数检测在 5-10 张图像下就能很好地工作,但如果您面对的是复杂的多缺陷问题,请不要犹豫,继续添加数据。
使用合成数据加速:Defect Studio
如果您需要为很少见到的缺陷进行训练怎么办?比如必须故意拆除的缺失螺丝、必须人为制造的划痕、千分之一概率才出现的裂纹?等待数月才能收集到足够样本并不现实。
位于 tools.overview.ai 的 OV Auto-Defect Creator Studio 可以解决这个问题。它能生成逼真的合成缺陷图像,速度比等待生产线上出现真实缺陷快 10,000 倍。
工作原理:5 个简单步骤
- 上传 一张零件的良品图像
- 标记 缺陷应该出现的区域
- 描述 缺陷(使用简单的英语,例如 "deep scratch across the surface" 或 "missing solder joint")
- 生成 缺陷变体(AI 会创建逼真的结果)
- 导出 合成图像,直接放入您的训练集
为什么合成数据有效
生成的图像不只是"贴上去"的伪影。它们是与您实际的光照、相机角度和零件表面相匹配的逼真变体。AI 理解在您特定成像条件下缺陷外观的物理原理。
使用场景:
- 罕见缺陷: 针对您从未(或很少)见过的失效模式进行训练
- 新产品发布: 在第一个不良品下线之前就建立检测
- 边界案例: 生成临界样本以改进 AI 的决策边界
- 数据增强: 用合成的多样化样本补充小型数据集
实际演示
最佳方法是:先用最初的 3-5 张真实图像进行训练,识别 AI 表现不佳之处,然后使用 Defect Studio 针对这些特定的失效模式生成有针对性的合成样本。真实数据教会基线;合成数据填补空白。
训练检查清单
在继续之前,请确认:
- 已捕获初始图像,每个类别至少 10-15 张
- 所有标签已仔细复核(View All ROIs)
- 已通过实时预览完成训练和测试
- 已识别失效模式并添加针对性数据
- 已完成 2-4 轮 标签 → 训练 → 测试 迭代
- 结果符合预期
模型训练完成且表现良好?请转至第 5 步:设置输出。