DOCUMENTACIÓN CON IA
¿Qué desea saber?
OCR (Reconocimiento Óptico de Caracteres)
Tiempo: 30-45 minutos
El OV80i puede leer texto impreso, números de serie, códigos de fecha y otros caracteres alfanuméricos directamente desde las imágenes de la cámara utilizando un modelo OCR preentrenado. A diferencia de clasificadores y segmentadores, OCR no requiere datos de entrenamiento. Funciona de inmediato.
OCR es útil cuando necesitas:
- Verificar que los números de serie o los códigos de lote coincidan con los valores esperados
- Confirmar que las etiquetas estén presentes y legibles
- Leer códigos de fecha/expiración para trazabilidad
- Verificar números de parte en componentes durante el ensamblaje
OCR está disponible exclusivamente en el OV80i. El OV20i y el OV10i no son compatibles con OCR.
Cómo funciona OCR
El OV80i utiliza una canalización de IA de dos etapas para el reconocimiento de texto:
- Detección de Texto: Localiza dónde se encuentra el texto dentro del ROI. Devuelve cuadros delimitadores alrededor de cada palabra o región de texto detectada.
- Reconocimiento de Texto: Lee los caracteres dentro de cada cuadro delimitador detectado y devuelve la cadena de texto con una puntuación de confianza.
Todo este proceso se ejecuta en la GPU NVIDIA Jetson Orin NX de la cámara. No se necesita conexión a la nube.
El modelo reconoce un conjunto de caracteres amplio que incluye:
- Dígitos (0-9)
- Letras latinas (A-Z, a-z, caracteres acentuados)
- Puntuación y símbolos comunes
- Letras griegas
- Símbolos de moneda
- Operadores matemáticos
El conjunto de caracteres es fijo y no se puede personalizar. El modelo admite aproximadamente 480 caracteres, que cubren la mayor parte del texto impreso en idiomas basados en el alfabeto latino.
Prerrequisitos
Antes de configurar OCR, necesitas una cámara que esté:
- Fijada y estable físicamente
- Conectada a tu red y accesible en un navegador
- Enfocada en la pieza con el texto que quieres leer
Si aún no lo has hecho, sigue primero las guías de inicio:
Paso 1: Crear una Nueva Receta
Cada inspección comienza con una receta. Una receta es un paquete completo: configuración de imágenes, alineación, regiones de inspección, modelos de IA y reglas de salida.
- Navegue a Todas las Recetas en la barra lateral izquierda
- Haga clic en + Nueva en la esquina superior derecha
- Asigne a su receta un nombre descriptivo (p. ej., "Verificación de Número de Serie", "Verificación de Etiquetas")
- Haga clic en Activar para hacerla la receta activa, luego haga clic en Editar para abrir el Editor de Recetas

El Editor de Recetas muestra toda la canalización de inspección. Trabajará a lo largo de ella de izquierda a derecha:
- Configuración de Imagen (configuración de la cámara)
- Alineación de Imagen y Configuración de Inspección (plantilla, ROIs)
- Bloques de IA (Clasificación, Segmentación, OCR, Medición)
- Establecer Aprobación/Desaprobación y Lógica de E/S (reglas de salida)
Para una guía detallada de la creación de recetas, vea Crear la Primera Inspección.
Paso 2: Ajustes de Imagen
Una buena calidad de imagen es la base de un OCR preciso. El texto debe verse claramente con un contraste alto.
- Haga clic en Configure Imaging o vaya a la pestaña Imaging Setup
- Ajuste los siguientes ajustes mientras observa la vista previa en vivo:
| Parámetro | Objetivo para OCR |
|---|---|
| Exposición | Lo suficientemente brillante para ver claramente todo el texto. Demasiado oscuro y los caracteres se pierden en el fondo. Demasiado brillante y las etiquetas blancas se saturan. |
| Ganancia | Manténgala lo más baja posible. Una ganancia alta introduce ruido que parece artefactos de texto para el detector. |
| Gamma | Ajuste para mejorar el contraste entre el texto y el fondo. |
| Foco | El texto debe estar nítido. Si los caracteres se ven borrosos o desenfocados, ajuste el anillo de enfoque de la lente C-mount. |
La precisión de OCR depende en gran medida de la calidad de la imagen. El texto debe ser claramente visible en la imagen de la cámara con un buen contraste contra el fondo. Texto oscuro sobre fondo claro o texto claro sobre fondo oscuro funcionan bien. Evite:
- Iluminación desigual que genere sombras sobre los caracteres
- Brillos en etiquetas brillantes
- Subexposición que haga que el texto sea difícil de distinguir del fondo
Acérquese al área de texto en la vista previa en vivo. ¿Puede leer cada carácter con claridad? Si no puede leerlo, la IA tampoco podrá.
Para una guía detallada de todos los ajustes de imagen, consulte Image Settings.
Paso 3: Configurar Alineación de Plantilla
La alineación de la plantilla indica a la cámara cómo rastrear la posición y la orientación de su pieza. Esto es esencial porque las piezas no siempre caen en el mismo punto en la cinta transportadora o en el montaje.
- Navegue a la pestaña Template Image and Alignment
- Coloque su pieza en el campo de visión de la cámara
- Haga clic en Capture Template para tomar una imagen de referencia
- Dibuje 2-3 regiones pequeñas de plantilla en características que siempre estén presentes y sean fáciles de identificar (p. ej., esquinas, logotipos, orificios de montaje)
Para una guía detallada sobre la alineación de plantillas, vea Alignment.
Paso 4: Crear Regiones de Inspección OCR (ROIs)
Ahora definirá exactamente dónde en la pieza debe buscar texto la cámara. Este es el paso más importante para la precisión de OCR.
4a. Navegar a la pestaña Inspection Setup
- Haga clic en la pestaña Inspection Setup en el Recipe Editor
- Verá el Editor de Inspección con la imagen de su plantilla
4b. Agregar el Modelo OCR
- En el panel derecho, busque la sección Models
- Si no ve un modelo OCR listado, haga clic en el botón Add en la parte inferior y seleccione OCR
- El modelo OCR aparecerá en la lista de Models
4c. Crear un ROI de OCR
- Asegúrese de que la fila del modelo OCR esté seleccionada (resaltada) en la lista de modelos
- Haga clic en 'Add ROI' en la sección Región de Interés
- Aparecerá una ROI rectangular nueva en la imagen
- Arrastre la ROI para posicionarla sobre el texto que desea leer
- Cambie su tamaño arrastrando las manijas de las esquinas

4d. Establecer la Orientación de ROI
Este es el aspecto más importante para lograrlo correctamente. La orientación de su ROI debe coincidir con la orientación del texto que desea leer.
El motor OCR recorta la imagen utilizando el ángulo de la ROI y luego procesa el recorte como si el texto fuese horizontal. Si el ángulo de su ROI no coincide con el ángulo del texto, el motor intentará leer texto rotado y obtendrá resultados incorrectos.
Ejemplos:
- Texto leído de izquierda a derecha de forma horizontal: el ángulo de la ROI debe ser 0 grados
- Texto girado 90 grados en sentido horario: el ángulo de la ROI debe ser 90 grados
- Texto al revés: el ángulo de la ROI debe ser 180 grados
- Texto en un ángulo de 45 grados: el ángulo de la ROI debe ser 45 grados
Cómo rotar una ROI:
- Seleccione la ROI haciendo clic en ella
- Use la manija de rotación en la esquina de la ROI, o
- Establezca el valor del ángulo directamente en los campos de posición en la parte inferior del lienzo
La barra de posición muestra: H (altura), W (ancho), X y Y (posición), y el ángulo en grados.

4e. Dimensionar la ROI Correctamente
- Haga que la ROI quede lo más ajustada posible alrededor del área de texto. El fondo adicional introduce ruido y puede provocar detecciones falsas.
- Incluya un pequeño margen (10-20 píxeles) alrededor del texto para que los caracteres no se corten en los bordes.
- No incluya otro texto que no desee leer. Si hay varias áreas de texto, cree ROIs separadas para cada una.
Si necesita leer texto de varias áreas de la pieza (p. ej., un Serial Number y un Date Code), cree una ROI separada para cada una. Esto le proporciona resultados independientes y facilita la configuración de las reglas de pass/fail.
4f. Crear ROIs Adicionales (Opcional)
Repita los pasos 4c-4e para cada área de texto que necesite leer. Cada ROI obtiene su propio nombre en la lista de Regiones de Interés. Cambie sus nombres por algo descriptivo (p. ej., "Serial Number", "Date Code", "Part Label") haciendo doble clic en el nombre.
Utilice copiar y pegar para duplicar ROIs. Los nombres se incrementan automáticamente (p. ej., "ROI", "ROI (1)", "ROI (2)").
Paso 5: Configurar y Probar el Bloque OCR
5a. Navegar al Bloque OCR
Haga clic en la pestaña OCR Block en la barra de pestañas del Editor de Recetas. Verá la señal de la cámara a la izquierda y un panel de configuración a la derecha.

El panel derecho muestra:
- RECONOCIMIENTO ÓPTICO DE CARACTERES (OCR) descripción
- Explicación de que este es un modelo preentrenado que no requiere datos de entrenamiento
- Instrucciones para usar Live Preview o Test para validar
5b. Habilitar Live Preview
Marque la casilla Live Preview Mode en la esquina superior derecha. La cámara empezará a procesar fotogramas en tiempo real.

Con Live Preview activo, verá:
- Tiempo de procesamiento: Cuánto tarda el modelo OCR por fotograma
- Latencia: Tiempo total de ida y vuelta, incluyendo la captura de imagen y el renderizado
- Cuadros delimitadores morados alrededor de las regiones de texto detectadas superpuestos en el feed de la cámara
- Texto detectado mostrado como etiquetas en cada cuadro delimitador
- Panel de parámetros a la derecha para ajustar los ajustes de detección
5c. Verificar que OCR esté leyendo correctamente
Con la Vista previa en vivo activada, coloque la pieza bajo la cámara y verifique:
- ¿Se detectan todas las regiones de texto? Debería ver cuadros morados alrededor de cada palabra/frase en la ROI.
- ¿El texto se está leyendo correctamente? Las etiquetas deben coincidir con el texto real en la pieza.
- ¿Existen detecciones falsas? ¿Las áreas que no son texto se están identificando incorrectamente como texto?
- Desplace ligeramente la pieza. ¿OCR continúa funcionando en diferentes posiciones (esto prueba el alineamiento)?
Si el texto no se detecta o se lee incorrectamente, verifique:
- La orientación de la ROI coincide con la orientación del texto (ver Paso 4d)
- La ROI está posicionada correctamente sobre el texto
- La calidad de la imagen es buena (enfoque nítido, buen contraste, iluminación uniforme)
- Intente ajustar los parámetros de OCR (ver la siguiente sección)
Paso 6: Ajustar Parámetros OCR
Cuando la Vista previa en vivo está activada, el panel derecho muestra cuatro parámetros ajustables. Estos controlan la etapa de detección de texto (dónde está el texto), no la etapa de reconocimiento (leer lo que dice).
| Parameter | Default | What it does |
|---|---|---|
| Text Segmentation Threshold | 0.10 | Cómo de confiable debe ser que una región contenga texto. Valores más altos = detección más estricta, menos falsos positivos pero pueden perder texto débil. Valores más bajos = más sensible, capturan texto débil pero pueden haber detecciones falsas. Rango: 0.0 a 1.0. |
| Unclip Ratio | 4.0 | Cuánto expandir los cuadros delimitadores detectados fuera del contorno del texto. Valores más altos = cuadros más grandes. Aumente si los cuadros recortan los bordes de caracteres grandes. Disminuya si palabras cercanas se fusionan en un solo cuadro. |
| Unclip Ceiling | 20 | Expansión máx. de píxeles al desclipar. Limita el crecimiento para que expansiones de alto cociente en texto grande no creen cuadros enormes. Aumente si el texto grande aún se recorta incluso después de aumentar el Unclip Ratio. |
| Min Text Area | 500 | Área mínima (en píxeles) para una región de texto detectada. Todo lo que sea más pequeño se descarta como ruido. Aumente si se detectan artefactos pequeños como texto. Disminuya si texto válido pequeño está siendo filtrado. |
Comience con los valores predeterminados. Solo ajuste si observa problemas específicos en la Vista previa en vivo:
| Problema | Parámetro a ajustar | Dirección |
|---|---|---|
| Áreas no textuales detectadas como texto | Text Segmentation Threshold | Aumentar |
| Se está perdiendo texto válido | Text Segmentation Threshold | Disminuir |
| Los cuadros recortan los bordes de los caracteres | Unclip Ratio | Aumentar |
| Las palabras cercanas se fusionan en un solo cuadro | Unclip Ratio | Disminuir |
| Los cuadros crecen demasiado para texto grande | Unclip Ceiling | Disminuir |
| El texto grande aún queda recortado tras aumentar Unclip Ratio | Unclip Ceiling | Aumentar |
| Ruido/artefactos detectados como texto | Min Text Area | Aumentar |
| Texto válido pequeño filtrado | Min Text Area | Disminuir |
Los cambios de parámetros tienen efecto inmediato en la Vista previa en vivo, por lo que puede ajustar de forma iterativa. Estos parámetros también se aplican durante las capturas de producción, no solo durante la vista previa.
Paso 7: Probar con Imágenes Capturadas
Después de ajustar los parámetros con la Vista previa en vivo, valide OCR en una variedad de muestras de producción.
7a. Usando el Panel de Pruebas
- Desactive el Modo de Vista previa en vivo (desmarque la casilla)
- Haga clic en el botón Test

- Haga clic en Select From Library para elegir imágenes de inspecciones capturadas previamente, o haga clic en Upload Captures para subir imágenes desde su computadora
- Los resultados de la prueba se muestran para cada ROI:
- Detected Text (mostrado en formato monospace/código)
- Confidence (etiqueta codificada por colores: verde por encima del 80%, naranja por encima del 50%, rojo por debajo del 50%)
- Detection Count (cuántas regiones de texto se encontraron)
7b. Qué Buscar
- Consistencia: ¿El OCR lee el mismo texto cada vez para la misma pieza?
- Precisión: ¿Los textos detectados coinciden con el texto real en la pieza?
- Puntajes de confianza: ¿Son consistentes por encima del 80%? La baja confianza a menudo indica problemas de calidad de la imagen.
- Casos límite: Pruebe con piezas que tengan texto borrado, desvanecido o parcialmente obstruido.
Si las puntuaciones de confianza son consistentemente inferiores al 80%, revise la configuración de la imagen (Paso 2). La precisión OCR está directamente ligada a la calidad de la imagen. Ninguna cantidad de ajuste de parámetros puede compensar una imagen borrosa o mal iluminada.
Paso 8: Configurar Reglas de Paso/Fracaso (Lógica IO)
Después de que OCR detecte correctamente el texto, debe definir qué constituye un pass o un fail. Navegue a la pestaña IO Logic.
Modo Básico
El Modo Básico proporciona una interfaz de usuario simple basada en reglas para la lógica de pass/fail de OCR. No se requiere conocimiento de Node-RED.

La página muestra:
- Pestañas Preview / Test a la izquierda (para visualizar los resultados frente a sus reglas)
- Sección OCR Rules a la derecha
- Botón Save & Deploy para activar las reglas
- Botón Advanced Mode para cambiar a Node-RED
Crear una Regla
Haga clic en + Add rule para crear una regla de pass/fail. Cada regla tiene tres campos:

| Campo | Descripción |
|---|---|
| ROIs | Qué ROI(s) evaluar. Haga clic para expandir y seleccionar "All ROIs" o elegir regiones específicas. |
| Operator | La comparación a realizar sobre el texto detectado. |
| Text | La cadena de texto esperada para comparar. |
Operadores disponibles
Haga clic en la lista desplegable Operator para ver las cuatro opciones:

| Operator | Comportamiento | Caso de uso de ejemplo |
|---|---|---|
| = (equals) | Todo el texto detectado, unido, debe coincidir exactamente con el texto esperado | Verifique que un número de serie lea exactamente "SN-2025-0042" |
| != (not equals) | El texto unido debe NO coincidir con el texto esperado | Rechazar piezas con un código conocido como malo |
| includes | El texto unido debe contener la cadena de texto esperada como subcadena | Verifique que una etiqueta contenga la palabra "SAFETY" en alguna parte |
| not includes | El texto unido debe NO contener la cadena de texto esperada | Asegúrese de que un código de producto obsoleto no aparezca |
Cómo se compara el texto
Cuando una ROI contiene múltiples regiones de texto detectadas (p. ej., el detector identifica "LOT" y "2025" como palabras separadas), todas las cadenas de texto individuales se unirán con espacios antes de la comparación.
Entonces, si el detector encuentra tres regiones de texto que dicen "LOT", "2025" y "A1", el texto unido se convierte en "LOT 2025 A1". Tu regla se compara contra esta cadena unida completa.
Esto significa:
- Una regla equals para
"LOT 2025 A1"pasaría - Una regla includes para
"2025"pasaría - Una regla equals para solo
"LOT"fallaría (porque el texto unido incluye más que solo "LOT")
Múltiples reglas
Puedes agregar varias reglas haciendo clic en + Add rule de nuevo. Todas las reglas utilizan la lógica AND: cada regla debe pasar para que la verificación OCR tenga éxito. Si falla alguna regla, toda la inspección falla.
Selección de ROI

Haz clic en el dropdown de ROIs para seleccionar a qué región(es) se aplica la regla:
- All ROIs: La regla evalúa el texto de todas las regiones OCR combinadas
- Specific ROI: Expande para escoger ROI individuales por nombre (por eso es importante nombrar descriptivamente tus ROI en el Paso 4f)
Guardar y desplegar
Después de configurar tus reglas, haz clic en Save & Deploy para activarlas. Las reglas tendrán efecto inmediato para todas las inspecciones futuras.
Modo Avanzado (Node-RED)
Para una lógica de pase/fallo más compleja que el Modo Básico no puede manejar, cambia a Advanced Mode.
Haz clic en el botón Advanced Mode para ver un cuadro de diálogo de confirmación:

El cuadro explica:
- Advanced Mode usa el entorno completo de Node-RED para programación visual
- Cualquier regla del Modo Básico quedará desactivada
- Puedes volver a Modo Básico en cualquier momento
Haz clic en Switch to Advanced Mode (o si ya estás en Advanced Mode, el botón dirá Basic Mode).

En el Modo Avanzado, verás un lienzo de flujo de Node-RED con nodos preconstruidos que incluyen:
- All Block Outputs: Recibe resultados de todos los bloques de AI (clasificación, segmentación, OCR, medición)
- Check OCR (o similar): Un nodo de función que contiene JavaScript para evaluar los resultados de OCR
- Classification Block Logic / Format Data for PLC / Trigger: Otros nodos de salida para integración
- Inspection Pass/Fail: Determinación final de pase/fallo
- Save to Library: Almacena resultados
Carga útil de OCR en Node-RED
En el Modo Avanzado, los resultados de OCR están disponibles en el objeto msg.payload.ocr. Esto le da acceso programático completo a cada detección:
{
"predictions": [
{
"roi_id": 1,
"roi_name": "Serial Number",
"center_x_global": 450,
"center_y_global": 220,
"angle_global": 90,
"search_area_id": 1,
"detections": [
{
"text": "SN-2025-0042",
"confidence": 0.95,
"roi_bbox": {
"x": 10,
"y": 5,
"width": 120,
"height": 30,
"angle": 0
},
"global_bbox": {
"x": 450,
"y": 220,
"width": 120,
"height": 30,
"angle": 90
}
}
]
}
]
}
| Campo | Descripción |
|---|---|
| roi_id | ID numérico de la ROI que produjo este resultado |
| roi_name | El nombre que le asignaste a la ROI (p. ej., "Serial Number") |
| center_x_global / center_y_global | Posición central de la ROI en coordenadas de cuadro completo |
| angle_global | Ángulo de rotación de la ROI en el cuadro completo |
| search_area_id | El tipo de inspección / área de búsqueda a la que pertenece esta ROI |
| detections | Arreglo de detecciones de texto individuales encontradas dentro de esta ROI |
| detections[].text | Cadena de texto reconocida |
| detections[].confidence | Confianza de reconocimiento de 0.0 a 1.0 (limitada) |
| detections[].roi_bbox | Posición de la bounding box relativa al origen de recorte de la ROI |
| detections[].global_bbox | Posición de la bounding box en el marco completo de la cámara (toma en cuenta la rotación y alineación de la ROI) |
Utilice msg.payload.ocr.predictions[0].detections.map(d => d.text).join(" ") para obtener la misma cadena de texto unida que utiliza Basic Mode para la comparación.
Con el Modo Avanzado, puedes:
- Aplicar patrones regex al texto detectado usando JavaScript
- Filtrar detecciones por umbral de confianza
- Combinar resultados de OCR con resultados de clasificación/segmentación para lógica compleja
- Formatear texto OCR para salida hacia PLC (p. ej., enviar el número de serie detectado por EtherNet/IP)
- Enviar mensajes personalizados a Microsoft Teams o correo electrónico según el contenido de OCR
Para una guía detallada sobre Node-RED, consulta Node-RED Basics.
Puedes cambiar entre el modo Básico y el Modo Avanzado en cualquier momento usando el botón de alternancia en la parte superior de la página IO Logic. Al cambiar a Modo Básico, cualquier lógica de Node-RED implementada se desactiva y es reemplazada por reglas del Modo Básico. Al volver, se restaura el flujo de Node-RED.
Paso 9: Desplegar la Receta
Una vez que su configuración OCR esté completa y probada:
- Regrese al Recipe Editor (haga clic en Recipe Editor en la barra lateral izquierda)
- Haga clic en el botón púrpura Deploy Recipe en la esquina inferior derecha
- La receta está ahora activa y ejecutando inspecciones
Visualización de Resultados
HMI
La página HMI muestra resultados de inspección en tiempo real. Con OCR activo, verá:
- La transmisión en vivo de la cámara con cajas de delimitación moradas alrededor del texto detectado
- Etiquetas de texto que muestran lo que se leyó
- Estado de Aprobado/Rechazado basado en sus reglas de IO Logic
- Estadísticas en ejecución: inspecciones totales, aprobadas, rechazadas, porcentaje de rendimiento

Library
Vaya a Library en la barra lateral izquierda para revisar los resultados almacenados de capturas anteriores. Cada entrada de captura muestra:
- La imagen capturada con superposición OCR
- Texto detectado por ROI
- Puntuaciones de confianza
- Resultado de Aprobado/Rechazado
Solución de Problemas
No se detecta texto
| Posible causa | Solución |
|---|---|
| ROI no está posicionado sobre el texto | Reubique el ROI en la Configuración de Inspección |
| La orientación del ROI no coincide con la dirección del texto | Esta es la causa n.º 1. Rote el ROI para alinearlo con la dirección del texto (Paso 4d) |
| El texto es demasiado pequeño en la imagen | Acérquese a la cámara o use un lente de mayor longitud focal |
| El texto es demasiado pequeño en relación con el ROI | Haga el ROI más ajustado alrededor del área de texto |
| El área de texto mínima es demasiado alta | Reduzca el parámetro Min Text Area |
| Iluminación insuficiente / contraste bajo | Mejore la iluminación para maximizar el contraste entre el texto y el fondo |
| El texto está borroso | Ajuste el enfoque en el lente C-mount y verifique que el soporte de la cámara esté estable |
| La alineación no está configurada | La detección de texto requiere alineación. Configure la alineación de plantilla (Paso 3) |
Texto incorrecto detectado (lecturas erróneas)
| Posible causa | Solución |
|---|---|
| La orientación del ROI no coincide con la orientación del texto | Esta es la causa n.º 1. Rote el ROI para alinearlo con la dirección del texto (Paso 4d) |
| Baja calidad de imagen o ruido | Aumente la exposición, reduzca la ganancia, mejore la iluminación |
| Umbral de Segmentación de Texto demasiado bajo | Aumente para filtrar detecciones de texto falsas |
| Regiones de texto superpuestas se fusionan en una única detección | Disminuya la relación de Unclip para evitar la fusión de cajas |
| Varias líneas de texto en un ROI | Cree ROIs separados para cada línea si el orden de lectura importa |
La confianza de OCR es consistentemente baja
| Posible causa | Solución |
|---|---|
| Uniformidad de iluminación deficiente | Asegure una iluminación uniforme en toda el área de texto |
| Deslumbramiento o reflejos en el texto (especialmente en etiquetas brillantes) | Ajuste el ángulo de iluminación para eliminar reflejos especulares. Considere iluminación difusa. |
| Fuente muy pequeña o altamente estilizada | Acérquese a la cámara o use un lente de mayor longitud focal para aumentar el tamaño del texto en la imagen |
| Texto dañado, desvanecido o parcialmente impreso | OCR solo puede leer lo que la cámara ve. Si el texto está físicamente degradado, la precisión será menor. |
| Ganancia alta en la configuración de imagen | Reduzca la ganancia. La ganancia alta añade ruido que parece artefactos de texto. |
Las reglas de Aprobado/Rechazado no funcionan como se espera
| Posible causa | Solución |
|---|---|
| El texto se une de forma diferente a lo esperado | Habilite la Vista previa en vivo y verifique exactamente qué texto se está detectando. Recuerde, varias detecciones se unen con espacios. |
| Usar "equals" cuando es más apropiado "includes" | Si solo le importa una subcadena, use "includes" en lugar de "equals" |
| Reglas no implementadas | Haga clic en Save & Deploy después de cambiar las reglas en Modo Básico |
| ROI incorrecto seleccionado en la regla | Verifique la lista desplegable de ROIs en su regla para asegurarse de que apunte a la región correcta |
Limitaciones
- Máximo 1 bloque OCR por receta (puede haber múltiples ROI dentro de ese bloque)
- Solo modelo optimizado para inglés: El modelo preentrenado está optimizado para texto impreso basado en latín. El texto manuscrito, escritura cursiva o escrituras no latinas (Chino, Japonés, Coreano, Árabe) no son compatibles.
- Sin expresiones regulares o coincidencia de patrones en Modo Básico: Las reglas de aprobación/rechazo utilizan una comparación de cadenas simple (igual a, distinto de, incluye, no incluye). Para patrones de validación complejos (p. ej., coincidir con "SN-####-####"), use Modo Avanzado (Node-RED) con expresiones regulares de JavaScript personalizadas.
- Sin conjunto de caracteres configurable por el usuario: El diccionario de 480 caracteres del modelo es fijo. No puede restringir el reconocimiento a dígitos solamente, por ejemplo. Utilice reglas de aprobación/rechazo para validar el formato esperado.
- No hay un orden de texto garantizado: Cuando se detectan múltiples regiones de texto dentro de un ROI, se combinan en el orden de detección (por contorno), no necesariamente en el orden de lectura (de izquierda a derecha, de arriba hacia abajo). Si el orden de lectura es crítico, use ROI separadas para cada línea de texto.
- Solo modelo preentrenado: A diferencia de la clasificación y la segmentación, el modelo OCR no puede reentrenarse ni ajustarse a sus fuentes o estilos de texto específicos. Utiliza el modelo OCR preentrenado incorporado.
Ver también
- Crear Primera Inspección - Guía completa para la creación de la receta
- Ajustes de Imagen - Guía detallada de la configuración de imagen
- Alineación - Profundización en la alineación de plantillas
- Regiones de inspección (ROI) - Dimensionamiento y estrategia de ROI
- Configuración de inspección y tipos de ROI - Referencia de tipos de ROI
- Fundamentos de Node-RED - Programación avanzada de lógica de E/S
- Fundamentos de Configuración de Imagen - Teoría de iluminación y calidad de imagen