AI 驱动文档
您想了解什么?
首个配方创建
本深入探讨解释了什么是配方,概述了分类与分割之间的区别,并提供了创建配方的逐步指导。它还包括图像设置配置、模板图像捕获和对齐设置、ROI 优化、数据收集和 AI 训练,以及图像增强配置的详细操作指南。
查看此主题的实际操作:如何在几分钟内创建分割配方
学习目标
通过本次深入探讨,您将了解:
- 什么是配方
- 分类与分割的区别 - 以及何时使用每种方法
- 如何创建配方
- 如何配置图像设置
- 如何捕获模板图像并配置对齐器
- 什么是 ROI(感兴趣区域)以及如何优化它们
- AI 训练的数据收集
- 配方测试和验证
什么是配方?
- 一组配置好的指令,告诉相机如何检查特定的零件或产品。
- 定义相机设置,包括曝光、对焦和照明参数,以确保一致的图像捕获。
- 包含处理逻辑,如 ROI 定义、对齐器、分类或分割类别。
- 存储输入/输出配置,以便与自动化系统集成,实现合格/不合格或高级信号。
- 可以保存和重用,以确保在不同班次、生产线或设施之间进行一致的检查。
分类与分割
定义
- 分类:识别 ROI 中对象的类型
- 分割:定位和分析图像/ROI 中的区域
示例
| 图像分类 | 图像分割 | 图像分类 | 图像分割 |
|---|---|---|---|
| 什么是羊? | 哪些像素属于哪个对象? | 这块披萨是可接受的还是有缺陷的? | 每片香肠在哪里? |
![]() | ![]() | ![]() | ![]() |
关键比较
| 分类 | 分割 | |
|---|---|---|
| 速度 | 速度取决于图像设置和复杂性。通常在简单设置下高效且快速 | 优化后可以与分类一样快甚至更快,尤其是在精简模型下 |
| 准确性 | 适用于整体合格/不合格或零件类型识别 | 对于精确缺陷定位具有更高的准确性 |
| 复杂性 | 简单设置和维护;参数较少 | 复杂 - 需要更多数据、标注和调整 |
| 数据需求 | 低 - 需要较少的标注图像 | 中等 - 需要许多具有详细像素精确标注的图像 |
| 用例 | 零件存在、方向、基本质量检查、零件插入/未插入等 | 表面缺陷、细微特征检查、多缺陷检测、计数、测量等 |
创建和导出配方
使用配方旁边的 导出配方 按钮导出单个配方。
使用屏幕顶部的 导出 按钮一次性导出多个配方。

使用屏幕顶部的 导入 按钮导入配方。

请记住: 每个配方一次只支持一种检查类型,要么是分割,要么是分类。在开始设置之前选择正确的类型。
图像设置
图像旋转
- 它是什么: 旋转图像(0°或180°)。
- 何时使用: 如果相机以角度安装,但您希望在界面中以另一种方式显示图像。
如果需要将图像旋转90°,请旋转相机。
增益
- 它是什么: 人工数字亮度增强图像(类似于相机的ISO)。
- 效果:
- 较高增益 → 图像更亮,但会增加 噪声(颗粒感)。
- 较低增益 → 图像更干净,但需要良好的照明。
| 高增益 | 低增益 |
|---|---|
![]() | ![]() |
| 更亮且噪声较多 | 更暗且噪声较少 |
仅在调整曝光或照明不可能的情况下增加增益。
模板图像和对齐
跳过对齐器
- 它是什么: 在检查过程中关闭对齐步骤。
- 何时使用: 如果部件在图像中始终处于相同位置和方向。
模板区域
- 它是什么: 定义用于对齐的模板图像区域。
- 矩形: 绘制一个矩形感兴趣区域。
- 圆形: 绘制一个圆形感兴趣区域。
- 忽略模板区域: 排除某些区域以避免分散注意力的图案或无关特征。
- 最佳使用: 帮助系统仅关注最具特征的部件特征以实现准确对齐。
旋转范围

- 它是什么: 设置系统在将部件与模板匹配时可以容忍的旋转量(以度为单位)。
- 示例: 设置±20°允许部件稍微旋转但仍然被检测到。
- 何时调整: 如果部件在生产过程中倾向于旋转,则增加;对于高度一致的方向,则减少。
灵敏度
- 它是什么: 控制系统在实时图像和模板之间寻找匹配的精细程度。
- 效果:
- 高灵敏度 → 检测更细微的细节,适用于复杂部件。
- 较低灵敏度 → 减少误匹配,但可能会错过细微特征。
置信度阈值
- 定义: 设置系统接受检测所需的最低置信度分数。
- 效果:
- 较高的阈值 → 较少的误报,但可能会错过边缘匹配。
- 较低的阈值 → 更多的检测,但增加误报的风险。
从适中的值开始,并根据测试结果进行调整。
尺寸不变性
- 定义: 允许系统检测稍大或稍小于原始模板图像的部件。
- 启用时机: 如果部件尺寸可能因定位、距离变化或制造公差而略有变化。
实时预览图例

1. 一个 可配置的边界框,定义在触发期间监控的 相机视场 FOV 的特定区域。
- 目的: 确保相机 仅关注相关区域,忽略不必要的背景区域。
- 最佳使用:
- 对于 移动物体,确保部件始终完全位于检测区域内。
- 通过减少分析的图像数据量来 优化处理速度。
2. 一个视觉红点,显示图像中所有定义的 ROI(兴趣区域)的 中心点。
- 目的: 帮助您 对齐和定位搜索区域 相对于部件或相机视图。
3. 绿色线条 表示检测到物体的边缘。
如果您看到线条变为红色,请尝试增加 ROI 大小、调整 ROI 或提高灵敏度。

ROI(兴趣区域)定义与优化
检查类型
- 定义: 定义正在执行的 检查类型 并将相似的 ROI(兴趣区域)分组。
- 示例: “孔”用于检查部件中孔的存在、大小或质量。
- 主要功能:
- 添加检查类型: 为不同的检查需求创建新类别。
- ROI 数量: 显示当前分配给该检查类型的 ROI 数量。
变换

- 定义: 调整所选 ROI 的 位置和几何形状 以实现精确对齐和放置。
- 字段及其目的:
- 高度/宽度: 改变 ROI 的大小。
- X / Y: 沿水平(X)和垂直(Y)轴移动 ROI 的位置。
- 角度: 绕其中心旋转 ROI。
- 最佳使用: 当您有重复模式时,加快设置速度,例如多个相同的孔。
检查区域

- 定义: 模板图像中定义的所有 ROI 列表。
- 功能:
- 添加检查区域: 手动创建新的 ROI。
- 忽略区域: 从处理过程中排除特定区域。
- 编辑: 保存、删除或取消。
- 锁定图标: 表示锁定的 ROI,无法移动,需先解锁。
实时预览模式
- 定义: 在调整或添加 ROI 后显示实时反馈。
- 使用场景: 在设置过程中非常适合微调 ROI 的位置和大小。
测试按钮
- 定义: 基于旧图像运行回测以验证更改。
- 使用场景: 用于比较当前结果与以前设置的准确性和一致性。
数据收集与 AI 训练
定义不同的检查类别,并根据指定的检查类型标记每个 ROI(见下例)。

使用 标注工具 对图像进行标记/注释。使用 刷子类别 下拉菜单选择要注释的类别。当前每个配方的分割类别限制为最多 10 类。

良好数据的重要性

-
垃圾进,垃圾出: AI 模型的效果取决于输入的数据。低质量或不一致的数据会导致不准确的结果。
-
多样性很重要: 收集代表所有现实世界变化的数据:不同的班次、光照条件、零件位置和表面条件。
-
质量胜于数量: 较小、干净、标注良好的数据集通常比大但嘈杂或不一致的数据集表现更好。
标注基础:
- 分类: 将整个图像或 ROI 标记为特定类别(例如,“良好”、“损坏”)。
- 分割: 以像素级精度刷过、勾勒或突出特定感兴趣区域(例如,表面上的划痕位置)。
- 一致性: 使用一致的规则和定义进行标注,以避免在训练期间的混淆。

常见陷阱
- 数据不足: 样本过少会导致欠拟合,造成实际性能差。
- 类别不平衡: 一类(例如,许多“良好”零件但缺少缺陷零件)的过度代表会扭曲模型。
- 标注不良: 不正确、不一致或匆忙的标注会导致显著的准确性下降。
- 忽视环境变化: 当光照、零件方向或表面条件变化时,不更新数据集会导致准确性漂移。
- 未验证数据: 在训练前跳过质量检查通常会导致浪费时间和返工。
数据增强
图像增强 人工修改您的训练图像 以提高模型的鲁棒性。它们模拟现实世界的变化,如亮度变化、旋转或噪声,以便模型在不同条件下表现良好。
颜色增强

亮度
- 定义: 调整图像的明亮或黑暗程度。
- 使用场景: 处理生产过程中光照的轻微变化。
在稳定的设置中使用 ±0.1;如果光照变化较大,则增加该值。
对比度
- 定义: 改变明暗区域之间的差异。
- 使用场景: 对于具有纹理或表面变化的零件,有助于模型适应视觉差异。
色调
- 定义: 稍微改变颜色的色调。
- 使用场景: 适用于光照颜色(例如,LED温度)可能随时间变化的设置。
饱和度
- 定义: 调整颜色的强度。
- 使用场景: 有助于处理照明变化,使图像看起来更暗淡或更鲜艳。
几何增强

旋转范围
- 定义: 在设定范围内随机旋转图像(例如,±20°)。
- 使用场景: 对于可能稍微旋转的零件。
避免对通常固定方向的零件进行过度旋转。
翻转
- 定义: 水平、垂直或同时翻转图像。
- 使用场景: 对于对称零件或在处理过程中可能翻转的情况很有帮助。
光照与颜色模拟

普朗克(Planckian)
- 定义: 模拟色温变化(例如,暖光或冷光)。
- 使用场景: 处理不同的光源变化或工作单元。
高斯噪声
- 定义: 向图像添加细微噪声。
- 使用场景: 如果您的生产环境存在小的视觉噪声或相机传感器伪影,可以提高鲁棒性。
运动模拟

运动模糊
- 定义: 模拟在捕捉过程中零件移动时产生的轻微模糊。
- 使用场景: 对于可能出现运动模糊的高速生产线至关重要。
概率(prob)
- 定义: 设置在训练过程中应用每种增强的可能性。
- 示例: 0.50 = 50% 的机会将该变化应用于任何给定的训练图像。
对于大多数增强,初始值设为 0.5,并根据实际变化进行调整。
训练参数(分割)
训练参数(也称为超参数)是控制 机器学习模型如何从数据中学习 的设置。
学习率
- 定义: 控制模型在训练过程中更新其内部权重的速度。
- 值(0.003): 学习率越高,模型学习越快,但过高可能导致不稳定或准确性差。
- 滑块范围: 从 10^-4(非常慢)到 10^-1(非常快)。
通常,0.001–0.01 之间的值是分割任务的良好起点。
ROI(感兴趣区域)大小
- 定义: 定义在训练过程中使用的图像区域的大小(宽度 × 高度)。
- 未选中: 默认情况下,模型会根据您的数据自动确定 ROI。
- 选中时: 如果您需要一致的输入尺寸(例如,所有图像裁剪为 256×256 像素),可以手动设置宽度和高度。
当您的数据集包含不同大小的图像,并且您希望获得一致的输入以提高稳定性、可重复性或与已知模型架构匹配时,请使用固定大小(例如,256×256)。
当您的数据已经具有统一的分辨率,或您希望系统根据数据集的特征优化最佳感兴趣区域时,让它自动选择。
迭代次数(Epochs)
- 定义: 一个 epoch = 对整个训练数据集的完整遍历一次。
- 值(100): 模型将进行 100 次完整的遍历。
通常增加这个数字会提高准确性,但会花费更长时间。
经验法则: 在训练期间监控训练和验证损失。如果验证损失停止下降而训练损失持续下降,这表明模型正在过拟合,您应该提前停止训练。
架构
- 定义: 选择神经网络的大小和复杂性。
- 小型: 训练速度较快,通常足以满足大多数数据集的需求。适合快速实验或较小的数据集。
- 较大模型 可以捕捉更多细节,但在小数据集上可能会过拟合,而小型模型在数据有限时更高效且更具泛化能力。
从小型开始,通常足够,并帮助您在扩展之前更快地迭代。
外部 GPU
联系支持以了解更多关于外部 GPU 的信息。
训练参数(分类)
训练参数(也称为超参数)是控制 机器学习模型如何从数据中学习 的设置。
学习率
- 定义: 控制模型在训练期间更新其内部权重的速度。
- 值(0.003): 学习率越高,模型学习越快,但过高可能导致不稳定或准确性差。
- 滑块范围: 从 10^-4(非常慢)到 10^-1(非常快)。
通常,0.001–0.01 之间的值是分割任务的良好起点。
验证百分比
- 定义: 定义您数据集中将被保留用于验证(训练期间测试)的部分。
- 目的: 验证数据帮助监控模型在未见示例上的表现,防止过拟合。
- 范围: 0–50%。
常见选择为 10–20%。
如果设置为 0%,所有数据将用于训练,这可能提高训练准确性,但会使检测过拟合变得更加困难。
ROI(感兴趣区域)大小
- 定义: 定义用于训练的图像区域的大小(宽度 × 高度)。
- 未选中: 默认情况下,模型会根据您的数据自动确定 ROI。
- 选中时: 如果您需要一致的输入尺寸(例如,所有图像裁剪为 256×256 像素),可以手动设置宽度和高度。
当您的数据集中包含不同尺寸的图像,并且您希望获得一致的输入以提高稳定性、可重复性或与已知模型架构匹配时,请使用固定大小(例如 256×256)。
当您的数据已经具有统一的分辨率,或者您希望系统根据数据集的特征优化最佳感兴趣区域时,请让其自动选择。
迭代次数(Epochs)
- 定义: 一个 epoch = 对整个训练数据集的完整遍历一次。
- 值(100): 模型将进行 100 次完整遍历训练。
通常增加这个数字会提高准确性,但会花费更长时间。
经验法则: 在训练期间监控训练和验证损失。如果验证损失停止下降而训练损失继续下降,则表明模型过拟合,您应该提前停止训练。
架构
- 定义: 选择神经网络的大小和复杂性。
- 小型: 训练速度更快,通常足以满足大多数数据集的需求。适合快速实验或较小的数据集。
从小型开始,通常足够,并帮助您在扩展之前更快地迭代。
| 架构和相机 | 描述 | 推荐用途 |
|---|---|---|
| ConvNeXt-Pico | 针对速度和低内存使用优化的超轻量模型。 | 适合快速实验或硬件有限的情况。 |
| ConvNeXt-Nano | 稍大于 Pico;在最小成本下提供更好的准确性。 | 小到中型数据集的良好平衡。 |
| ConvNeXt-Tiny | 提供更好的准确性,同时仍然高效。 | 适合中等数据集和较长的训练运行。 |
| ConvNeXt-Small | 此列表中功能最强大的变体。更高的容量和准确性。 | 用于大型数据集或需要最大性能时。 |
外部 GPU
联系支持以了解更多有关外部 GPU 的信息。





