DOCUMENTACIÓN CON IA
¿Qué desea saber?
Clasificación: una etiqueta por región
Un clasificador analiza una región recortada y responde una sola pregunta: ¿a qué categoría pertenece esto? Aprobado o rechazado. Vacío o lleno. Rojo, verde o azul. Es el tipo de inspección más simple y rápido, y la opción predeterminada correcta a menos que necesite saber dónde está un defecto.
La configuración de un clasificador se basa en una jerarquía simple: los Tipos contienen Clases, y los Tipos se estampan sobre las imágenes como ROIs.
Piense en ello como un sistema de sellos de goma. El Tipo de Inspección es el sello en sí (el diseño). Los ROIs son las marcas que hace en la página (la imagen). Cada marca hereda el mismo diseño, la misma lista de clases y el mismo modelo entrenado.
Los tres conceptos
Antes de poder entrenar un modelo de AI, la cámara necesita saber dónde mirar, cuáles son los posibles resultados y cómo debe evaluarse cada recorte. Esas tres preguntas corresponden a tres conceptos, y se anidan de una manera muy específica.
Inspection Type
A named bucket. Holds one shared dataset, one shared list of classes, and one trained AI model.
Classes
The vocabulary of possible outcomes for this inspection. Defined once on the type.
Region of Interest (ROI)
A rectangle drawn on the image. Many ROIs can share one type and, therefore, one dataset and one model.
El modelo mental: un tipo contiene las clases y los ROIs
Un Tipo de Inspección es un contenedor. Contiene un conjunto de datos compartido, una lista compartida de clases y un modelo de AI entrenado. Luego estampa ese contenedor sobre la imagen en varios lugares; esos sellos son los ROIs. Cada ROI del mismo tipo hereda las mismas clases y es evaluado por el mismo modelo.
- Tipo de Inspección es el contenedor.
- Clases son el vocabulario de resultados.
- ROI es una ubicación en la imagen.
Para un clasificador: una etiqueta por ROI, elegida de la lista de clases
Un clasificador toma cada recorte de ROI y hace una sola pregunta: ¿a qué clase se parece esto? Presente o ausente. Aprobado o rechazado. Bueno, rayado o agrietado. La salida por ROI es un nombre de clase más una puntuación de confianza, una respuesta categórica limpia sobre la cual el resto de su pipeline puede actuar.
Ejemplo en vivo: verificación de presencia de tornillos en PCB
Considere un PCB con seis ubicaciones de tornillos. Cuatro tornillos están presentes, uno falta y uno está dañado. Lo configuraría así:
- Tipo:
Screws(6 ROIs, clasificador) - Clases:
present,absent,damaged - ROIs:
Screw_1hastaScrew_6, cada uno etiquetado con una de las tres clases
La salida por ROI es una etiqueta más confianza:
| ROI | Etiqueta | Confianza |
|---|---|---|
| Screw_1 | present | 0.98 |
| Screw_2 | absent | 0.94 |
| Screw_3 | present | 0.97 |
| Screw_4 | present | 0.96 |
| Screw_5 | present | 0.95 |
| Screw_6 | damaged | 0.82 |
Tres cosas que hay que interiorizar de este ejemplo:
- Una etiqueta por ROI. El clasificador asigna exactamente una clase a cada recorte, una selección de menú desplegable, no una tarea de pintura. La salida es
class_namemás una puntuación deconfidence. - El tipo es el propietario. Los seis ROIs comparten el conjunto de datos Screws. Capturar una imagen le da seis nuevas muestras de entrenamiento, y un solo modelo entrenado decide los seis.
- Los ROIs son solo ubicaciones. Dibuje ajustado (menos de 512 × 512 px). Use Duplicar para estampar
Screw_1 → Screw_2 → Screw_3, cada uno hereda la lista de clases automáticamente.
Análisis profundo: cómo se comportan las clases
Las clases viven en el tipo, no en el ROI
Esto es lo más importante que hay que interiorizar. Las clases son una propiedad del Tipo de Inspección, lo que significa que agregar o eliminar una cambia las opciones de etiqueta para cada ROI que usa ese tipo, automáticamente.
- Defina una vez. Haga clic en + Agregar clase en el panel de Clases. Asígnele un nombre (p. ej.,
stripped_head) y un color. - Se propaga instantáneamente. La nueva clase aparece en el menú desplegable en cada ROI de ese tipo. Sin configuración por ROI.
- Reetiquete según sea necesario. Las imágenes de entrenamiento existentes mantienen sus etiquetas; puede volver a cualquier imagen y reclasificarla en la nueva clase.
- Manténgalo ajustado. Comience con el conjunto más pequeño de clases que capture sus decisiones. Dos clases (
pass/fail) a menudo superan a cinco difusas.
Análisis profundo: cómo se comportan los ROIs
Las regiones más pequeñas ganan. Haga que cada ROI sea apenas lo suficientemente grande para contener la característica. Los ROIs más pequeños significan menos datos de entrenamiento, iteración más rápida y decisiones de AI más precisas, la característica domina el recorte en lugar de perderse en el fondo, y nada se reduce de escala.
Pequeños, específicos y numerosos
Un ROI le indica a la cámara dónde recortar. Cuanto más ajustado sea el recorte, más clara será la señal que recibe el modelo. Debido a que los ROIs comparten un tipo, agregar más multiplica sus datos de entrenamiento sin multiplicar su trabajo.
- Mantenga los recortes por debajo de 512 × 512 px. Cualquier cosa más grande se reduce de tamaño para ajustarse a la entrada del modelo, y el detalle se pierde permanentemente.
- Ajustado es mejor. Un ROI pequeño alrededor de una sola característica le da al modelo una señal clara y necesita menos datos de entrenamiento para converger.
- Muchos ROIs, un tipo. 10 tornillos → 10 ROIs en el mismo tipo Screws. Una captura se convierte en diez muestras de entrenamiento, y un solo modelo maneja los diez en inferencia.
- Use Duplicar. Nombre el primer ROI de manera significativa (
Screw_Top_Left). Duplicar autoincrementa los nombres para que no tenga que volver a escribir. - ¿Necesita cobertura completa? No dibuje un ROI gigante, divida en mosaico una cuadrícula de ROIs pequeños. Cada uno conserva la resolución completa.
Flujo de datos: cada ROI realiza su propio recorrido por el modelo
En tiempo de ejecución, la cámara recorta cada ROI de la imagen completa, lo alimenta al modelo entrenado individualmente y registra qué clase ganó junto con una puntuación de confianza. El resultado es una etiqueta por ROI, en cada captura.
- Capture el cuadro completo con todos los ROIs marcados.
- Recorte individualmente para que cada ROI se convierta en su propia imagen pequeña.
- El modelo clasificador elige una clase más una puntuación de confianza para cada recorte.
- La salida es una tabla de ROI → etiqueta → confianza. La lógica de aprobado/rechazado sobre esa tabla depende de las reglas de su Bloque IO.
Resumen de configuración
Una lista rápida antes de entrenar. Si cada uno de estos es verdadero, su clasificador tendrá una base sólida.
- Un Tipo de Inspección por decisión. No mezcle "tornillos" y "etiquetas" en el mismo tipo, dele a cada uno el suyo para que obtengan sus propias clases, conjunto de datos y modelo.
- Clases definidas a nivel de tipo. Cada ROI obtiene el mismo menú desplegable. Si una opción no se aplica a todos los ROIs, probablemente pertenece a un tipo diferente.
- ROIs dibujados ajustados y nombrados de forma descriptiva.
Screw_Top_Leftsupera aNew ROI. Mantenga cada ROI apenas lo suficientemente grande para su característica, y por debajo de 512 × 512 px. - La alineación funciona primero. Si la pieza se desplaza o rota, el alineador mueve sus ROIs con ella. Los ROIs ajustados solo funcionan cuando la alineación es sólida.
- De 3 a 5 imágenes de entrenamiento por clase para empezar. Entrene, encuentre las fallas, agregue datos específicos, reentrene. De dos a cuatro iteraciones es lo típico.
- Cada etiqueta verificada dos veces. Una etiqueta incorrecta en cinco imágenes de entrenamiento es 20% de corrupción. Haga clic en Ver todos los ROIs antes de cada entrenamiento.
Qué sigue
- Entendiendo el Segmentador, la página hermana sobre modelos a nivel de píxel.
- Regiones de Interés (ROIs), la guía práctica para dibujar ROIs.
- Entrenando su AI, el flujo de trabajo de etiquetado y entrenamiento.