Saltar al contenido principal

DOCUMENTACIÓN CON IA

¿Qué desea saber?

OCR (Reconocimiento Óptico de Caracteres)

Tiempo: 30-45 minutos

El OV80i puede leer texto impreso, números de serie, códigos de fecha y otros caracteres alfanuméricos directamente desde las imágenes de la cámara utilizando un modelo OCR preentrenado. A diferencia de clasificadores y segmentadores, OCR no requiere datos de entrenamiento. Funciona de inmediato.

OCR es útil cuando necesitas:

  • Verificar que los números de serie o los códigos de lote coincidan con los valores esperados
  • Confirmar que las etiquetas estén presentes y legibles
  • Leer códigos de fecha/expiración para trazabilidad
  • Verificar números de parte en componentes durante el ensamblaje
OV80i Solo

OCR está disponible exclusivamente en el OV80i. El OV20i y el OV10i no son compatibles con OCR.


Cómo funciona OCR

El OV80i utiliza una canalización de IA de dos etapas para el reconocimiento de texto:

  1. Detección de Texto: Localiza dónde se encuentra el texto dentro del ROI. Devuelve cuadros delimitadores alrededor de cada palabra o región de texto detectada.
  2. Reconocimiento de Texto: Lee los caracteres dentro de cada cuadro delimitador detectado y devuelve la cadena de texto con una puntuación de confianza.

Todo este proceso se ejecuta en la GPU NVIDIA Jetson Orin NX de la cámara. No se necesita conexión a la nube.

El modelo reconoce un conjunto de caracteres amplio que incluye:

  • Dígitos (0-9)
  • Letras latinas (A-Z, a-z, caracteres acentuados)
  • Puntuación y símbolos comunes
  • Letras griegas
  • Símbolos de moneda
  • Operadores matemáticos
nota

El conjunto de caracteres es fijo y no se puede personalizar. El modelo admite aproximadamente 480 caracteres, que cubren la mayor parte del texto impreso en idiomas basados en el alfabeto latino.


Prerrequisitos

Antes de configurar OCR, necesitas una cámara que esté:

  • Fijada y estable físicamente
  • Conectada a tu red y accesible en un navegador
  • Enfocada en la pieza con el texto que quieres leer

Si aún no lo has hecho, sigue primero las guías de inicio:


Paso 1: Crear una Nueva Receta

Cada inspección comienza con una receta. Una receta es un paquete completo: configuración de imágenes, alineación, regiones de inspección, modelos de IA y reglas de salida.

  1. Navegue a Todas las Recetas en la barra lateral izquierda
  2. Haga clic en + Nueva en la esquina superior derecha
  3. Asigne a su receta un nombre descriptivo (p. ej., "Verificación de Número de Serie", "Verificación de Etiquetas")
  4. Haga clic en Activar para hacerla la receta activa, luego haga clic en Editar para abrir el Editor de Recetas

Editor de Recetas: visión general con todos los bloques

El Editor de Recetas muestra toda la canalización de inspección. Trabajará a lo largo de ella de izquierda a derecha:

  • Configuración de Imagen (configuración de la cámara)
  • Alineación de Imagen y Configuración de Inspección (plantilla, ROIs)
  • Bloques de IA (Clasificación, Segmentación, OCR, Medición)
  • Establecer Aprobación/Desaprobación y Lógica de E/S (reglas de salida)

Para una guía detallada de la creación de recetas, vea Crear la Primera Inspección.


Paso 2: Ajustes de Imagen

Una buena calidad de imagen es la base de un OCR preciso. El texto debe verse claramente con un contraste alto.

  1. Haga clic en Configure Imaging o vaya a la pestaña Imaging Setup
  2. Ajuste los siguientes ajustes mientras observa la vista previa en vivo:
ParámetroObjetivo para OCR
ExposiciónLo suficientemente brillante para ver claramente todo el texto. Demasiado oscuro y los caracteres se pierden en el fondo. Demasiado brillante y las etiquetas blancas se saturan.
GananciaManténgala lo más baja posible. Una ganancia alta introduce ruido que parece artefactos de texto para el detector.
GammaAjuste para mejorar el contraste entre el texto y el fondo.
FocoEl texto debe estar nítido. Si los caracteres se ven borrosos o desenfocados, ajuste el anillo de enfoque de la lente C-mount.
La iluminación es crítica para OCR

La precisión de OCR depende en gran medida de la calidad de la imagen. El texto debe ser claramente visible en la imagen de la cámara con un buen contraste contra el fondo. Texto oscuro sobre fondo claro o texto claro sobre fondo oscuro funcionan bien. Evite:

  • Iluminación desigual que genere sombras sobre los caracteres
  • Brillos en etiquetas brillantes
  • Subexposición que haga que el texto sea difícil de distinguir del fondo
tip

Acérquese al área de texto en la vista previa en vivo. ¿Puede leer cada carácter con claridad? Si no puede leerlo, la IA tampoco podrá.

Para una guía detallada de todos los ajustes de imagen, consulte Image Settings.


Paso 3: Configurar Alineación de Plantilla

La alineación de la plantilla indica a la cámara cómo rastrear la posición y la orientación de su pieza. Esto es esencial porque las piezas no siempre caen en el mismo punto en la cinta transportadora o en el montaje.

  1. Navegue a la pestaña Template Image and Alignment
  2. Coloque su pieza en el campo de visión de la cámara
  3. Haga clic en Capture Template para tomar una imagen de referencia
  4. Dibuje 2-3 regiones pequeñas de plantilla en características que siempre estén presentes y sean fáciles de identificar (p. ej., esquinas, logotipos, orificios de montaje)
Coloque las regiones de plantilla lo más separadas posible en la pieza. Esto reduce drásticamente el jitter angular en la alineación. Dos regiones cercanas proporcionan poca estabilidad rotacional; dos regiones en esquinas opuestas proporcionan una excelente estabilidad.
Si omite la alineación, sus ROI de OCR quedarán fijadas a posiciones de píxel absolutas. Cualquier movimiento de la pieza hará que la ROI se salga del texto. Siempre configure la alineación para uso en producción.

Para una guía detallada sobre la alineación de plantillas, vea Alignment.


Paso 4: Crear Regiones de Inspección OCR (ROIs)

Ahora definirá exactamente dónde en la pieza debe buscar texto la cámara. Este es el paso más importante para la precisión de OCR.

4a. Navegar a la pestaña Inspection Setup

  1. Haga clic en la pestaña Inspection Setup en el Recipe Editor
  2. Verá el Editor de Inspección con la imagen de su plantilla

4b. Agregar el Modelo OCR

  1. En el panel derecho, busque la sección Models
  2. Si no ve un modelo OCR listado, haga clic en el botón Add en la parte inferior y seleccione OCR
  3. El modelo OCR aparecerá en la lista de Models
Solo puede haber un bloque OCR por receta. Sin embargo, puede crear múltiples ROIs dentro de ese bloque para leer texto de diferentes áreas de la pieza.

4c. Crear un ROI de OCR

  1. Asegúrese de que la fila del modelo OCR esté seleccionada (resaltada) en la lista de modelos
  2. Haga clic en 'Add ROI' en la sección Región de Interés
  3. Aparecerá una ROI rectangular nueva en la imagen
  4. Arrastre la ROI para posicionarla sobre el texto que desea leer
  5. Cambie su tamaño arrastrando las manijas de las esquinas

Inspection Setup with OCR ROI drawn over text

4d. Establecer la Orientación de ROI

Orientación de ROI DEBE Coincidir con la Orientación del Texto

Este es el aspecto más importante para lograrlo correctamente. La orientación de su ROI debe coincidir con la orientación del texto que desea leer.

El motor OCR recorta la imagen utilizando el ángulo de la ROI y luego procesa el recorte como si el texto fuese horizontal. Si el ángulo de su ROI no coincide con el ángulo del texto, el motor intentará leer texto rotado y obtendrá resultados incorrectos.

Ejemplos:

  • Texto leído de izquierda a derecha de forma horizontal: el ángulo de la ROI debe ser 0 grados
  • Texto girado 90 grados en sentido horario: el ángulo de la ROI debe ser 90 grados
  • Texto al revés: el ángulo de la ROI debe ser 180 grados
  • Texto en un ángulo de 45 grados: el ángulo de la ROI debe ser 45 grados

Cómo rotar una ROI:

  1. Seleccione la ROI haciendo clic en ella
  2. Use la manija de rotación en la esquina de la ROI, o
  3. Establezca el valor del ángulo directamente en los campos de posición en la parte inferior del lienzo

La barra de posición muestra: H (altura), W (ancho), X y Y (posición), y el ángulo en grados.

ROI selected showing position, dimensions, and angle of 90.96 degrees

4e. Dimensionar la ROI Correctamente

  • Haga que la ROI quede lo más ajustada posible alrededor del área de texto. El fondo adicional introduce ruido y puede provocar detecciones falsas.
  • Incluya un pequeño margen (10-20 píxeles) alrededor del texto para que los caracteres no se corten en los bordes.
  • No incluya otro texto que no desee leer. Si hay varias áreas de texto, cree ROIs separadas para cada una.
tip

Si necesita leer texto de varias áreas de la pieza (p. ej., un Serial Number y un Date Code), cree una ROI separada para cada una. Esto le proporciona resultados independientes y facilita la configuración de las reglas de pass/fail.

4f. Crear ROIs Adicionales (Opcional)

Repita los pasos 4c-4e para cada área de texto que necesite leer. Cada ROI obtiene su propio nombre en la lista de Regiones de Interés. Cambie sus nombres por algo descriptivo (p. ej., "Serial Number", "Date Code", "Part Label") haciendo doble clic en el nombre.

tip

Utilice copiar y pegar para duplicar ROIs. Los nombres se incrementan automáticamente (p. ej., "ROI", "ROI (1)", "ROI (2)").


Paso 5: Configurar y Probar el Bloque OCR

5a. Navegar al Bloque OCR

Haga clic en la pestaña OCR Block en la barra de pestañas del Editor de Recetas. Verá la señal de la cámara a la izquierda y un panel de configuración a la derecha.

OCR Block overview page

El panel derecho muestra:

  • RECONOCIMIENTO ÓPTICO DE CARACTERES (OCR) descripción
  • Explicación de que este es un modelo preentrenado que no requiere datos de entrenamiento
  • Instrucciones para usar Live Preview o Test para validar

5b. Habilitar Live Preview

Marque la casilla Live Preview Mode en la esquina superior derecha. La cámara empezará a procesar fotogramas en tiempo real.

OCR Live Preview with parameters panel

Con Live Preview activo, verá:

  • Tiempo de procesamiento: Cuánto tarda el modelo OCR por fotograma
  • Latencia: Tiempo total de ida y vuelta, incluyendo la captura de imagen y el renderizado
  • Cuadros delimitadores morados alrededor de las regiones de texto detectadas superpuestos en el feed de la cámara
  • Texto detectado mostrado como etiquetas en cada cuadro delimitador
  • Panel de parámetros a la derecha para ajustar los ajustes de detección

5c. Verificar que OCR esté leyendo correctamente

Con la Vista previa en vivo activada, coloque la pieza bajo la cámara y verifique:

  1. ¿Se detectan todas las regiones de texto? Debería ver cuadros morados alrededor de cada palabra/frase en la ROI.
  2. ¿El texto se está leyendo correctamente? Las etiquetas deben coincidir con el texto real en la pieza.
  3. ¿Existen detecciones falsas? ¿Las áreas que no son texto se están identificando incorrectamente como texto?
  4. Desplace ligeramente la pieza. ¿OCR continúa funcionando en diferentes posiciones (esto prueba el alineamiento)?

Si el texto no se detecta o se lee incorrectamente, verifique:

  • La orientación de la ROI coincide con la orientación del texto (ver Paso 4d)
  • La ROI está posicionada correctamente sobre el texto
  • La calidad de la imagen es buena (enfoque nítido, buen contraste, iluminación uniforme)
  • Intente ajustar los parámetros de OCR (ver la siguiente sección)

Paso 6: Ajustar Parámetros OCR

Cuando la Vista previa en vivo está activada, el panel derecho muestra cuatro parámetros ajustables. Estos controlan la etapa de detección de texto (dónde está el texto), no la etapa de reconocimiento (leer lo que dice).

ParameterDefaultWhat it does
Text Segmentation Threshold0.10Cómo de confiable debe ser que una región contenga texto. Valores más altos = detección más estricta, menos falsos positivos pero pueden perder texto débil. Valores más bajos = más sensible, capturan texto débil pero pueden haber detecciones falsas. Rango: 0.0 a 1.0.
Unclip Ratio4.0Cuánto expandir los cuadros delimitadores detectados fuera del contorno del texto. Valores más altos = cuadros más grandes. Aumente si los cuadros recortan los bordes de caracteres grandes. Disminuya si palabras cercanas se fusionan en un solo cuadro.
Unclip Ceiling20Expansión máx. de píxeles al desclipar. Limita el crecimiento para que expansiones de alto cociente en texto grande no creen cuadros enormes. Aumente si el texto grande aún se recorta incluso después de aumentar el Unclip Ratio.
Min Text Area500Área mínima (en píxeles) para una región de texto detectada. Todo lo que sea más pequeño se descarta como ruido. Aumente si se detectan artefactos pequeños como texto. Disminuya si texto válido pequeño está siendo filtrado.
Cuándo ajustar los parámetros

Comience con los valores predeterminados. Solo ajuste si observa problemas específicos en la Vista previa en vivo:

ProblemaParámetro a ajustarDirección
Áreas no textuales detectadas como textoText Segmentation ThresholdAumentar
Se está perdiendo texto válidoText Segmentation ThresholdDisminuir
Los cuadros recortan los bordes de los caracteresUnclip RatioAumentar
Las palabras cercanas se fusionan en un solo cuadroUnclip RatioDisminuir
Los cuadros crecen demasiado para texto grandeUnclip CeilingDisminuir
El texto grande aún queda recortado tras aumentar Unclip RatioUnclip CeilingAumentar
Ruido/artefactos detectados como textoMin Text AreaAumentar
Texto válido pequeño filtradoMin Text AreaDisminuir

Los cambios de parámetros tienen efecto inmediato en la Vista previa en vivo, por lo que puede ajustar de forma iterativa. Estos parámetros también se aplican durante las capturas de producción, no solo durante la vista previa.


Paso 7: Probar con Imágenes Capturadas

Después de ajustar los parámetros con la Vista previa en vivo, valide OCR en una variedad de muestras de producción.

7a. Usando el Panel de Pruebas

  1. Desactive el Modo de Vista previa en vivo (desmarque la casilla)
  2. Haga clic en el botón Test

Test OCR Block panel with Select From Library and Upload options

  1. Haga clic en Select From Library para elegir imágenes de inspecciones capturadas previamente, o haga clic en Upload Captures para subir imágenes desde su computadora
  2. Los resultados de la prueba se muestran para cada ROI:
    • Detected Text (mostrado en formato monospace/código)
    • Confidence (etiqueta codificada por colores: verde por encima del 80%, naranja por encima del 50%, rojo por debajo del 50%)
    • Detection Count (cuántas regiones de texto se encontraron)

7b. Qué Buscar

  • Consistencia: ¿El OCR lee el mismo texto cada vez para la misma pieza?
  • Precisión: ¿Los textos detectados coinciden con el texto real en la pieza?
  • Puntajes de confianza: ¿Son consistentes por encima del 80%? La baja confianza a menudo indica problemas de calidad de la imagen.
  • Casos límite: Pruebe con piezas que tengan texto borrado, desvanecido o parcialmente obstruido.
precaución

Si las puntuaciones de confianza son consistentemente inferiores al 80%, revise la configuración de la imagen (Paso 2). La precisión OCR está directamente ligada a la calidad de la imagen. Ninguna cantidad de ajuste de parámetros puede compensar una imagen borrosa o mal iluminada.


Paso 8: Configurar Reglas de Paso/Fracaso (Lógica IO)

Después de que OCR detecte correctamente el texto, debe definir qué constituye un pass o un fail. Navegue a la pestaña IO Logic.

Modo Básico

El Modo Básico proporciona una interfaz de usuario simple basada en reglas para la lógica de pass/fail de OCR. No se requiere conocimiento de Node-RED.

Basic Mode Pass/Fail & IO Logic with OCR Rules section

La página muestra:

  • Pestañas Preview / Test a la izquierda (para visualizar los resultados frente a sus reglas)
  • Sección OCR Rules a la derecha
  • Botón Save & Deploy para activar las reglas
  • Botón Advanced Mode para cambiar a Node-RED

Crear una Regla

Haga clic en + Add rule para crear una regla de pass/fail. Cada regla tiene tres campos:

Add rule showing ROIs dropdown, Operator dropdown, and Text input

CampoDescripción
ROIsQué ROI(s) evaluar. Haga clic para expandir y seleccionar "All ROIs" o elegir regiones específicas.
OperatorLa comparación a realizar sobre el texto detectado.
TextLa cadena de texto esperada para comparar.

Operadores disponibles

Haga clic en la lista desplegable Operator para ver las cuatro opciones:

Operator dropdown showing equals, not equals, includes, not includes

OperatorComportamientoCaso de uso de ejemplo
= (equals)Todo el texto detectado, unido, debe coincidir exactamente con el texto esperadoVerifique que un número de serie lea exactamente "SN-2025-0042"
!= (not equals)El texto unido debe NO coincidir con el texto esperadoRechazar piezas con un código conocido como malo
includesEl texto unido debe contener la cadena de texto esperada como subcadenaVerifique que una etiqueta contenga la palabra "SAFETY" en alguna parte
not includesEl texto unido debe NO contener la cadena de texto esperadaAsegúrese de que un código de producto obsoleto no aparezca

Cómo se compara el texto

Importante: Comportamiento de unión de texto

Cuando una ROI contiene múltiples regiones de texto detectadas (p. ej., el detector identifica "LOT" y "2025" como palabras separadas), todas las cadenas de texto individuales se unirán con espacios antes de la comparación.

Entonces, si el detector encuentra tres regiones de texto que dicen "LOT", "2025" y "A1", el texto unido se convierte en "LOT 2025 A1". Tu regla se compara contra esta cadena unida completa.

Esto significa:

  • Una regla equals para "LOT 2025 A1" pasaría
  • Una regla includes para "2025" pasaría
  • Una regla equals para solo "LOT" fallaría (porque el texto unido incluye más que solo "LOT")

Múltiples reglas

Puedes agregar varias reglas haciendo clic en + Add rule de nuevo. Todas las reglas utilizan la lógica AND: cada regla debe pasar para que la verificación OCR tenga éxito. Si falla alguna regla, toda la inspección falla.

Selección de ROI

ROIs dropdown showing All ROIs option

Haz clic en el dropdown de ROIs para seleccionar a qué región(es) se aplica la regla:

  • All ROIs: La regla evalúa el texto de todas las regiones OCR combinadas
  • Specific ROI: Expande para escoger ROI individuales por nombre (por eso es importante nombrar descriptivamente tus ROI en el Paso 4f)

Guardar y desplegar

Después de configurar tus reglas, haz clic en Save & Deploy para activarlas. Las reglas tendrán efecto inmediato para todas las inspecciones futuras.


Modo Avanzado (Node-RED)

Para una lógica de pase/fallo más compleja que el Modo Básico no puede manejar, cambia a Advanced Mode.

Haz clic en el botón Advanced Mode para ver un cuadro de diálogo de confirmación:

Basic Mode confirmation dialog explaining the switch

El cuadro explica:

  • Advanced Mode usa el entorno completo de Node-RED para programación visual
  • Cualquier regla del Modo Básico quedará desactivada
  • Puedes volver a Modo Básico en cualquier momento

Haz clic en Switch to Advanced Mode (o si ya estás en Advanced Mode, el botón dirá Basic Mode).

Advanced Mode Node-RED flow with Check OCR node

En el Modo Avanzado, verás un lienzo de flujo de Node-RED con nodos preconstruidos que incluyen:

  • All Block Outputs: Recibe resultados de todos los bloques de AI (clasificación, segmentación, OCR, medición)
  • Check OCR (o similar): Un nodo de función que contiene JavaScript para evaluar los resultados de OCR
  • Classification Block Logic / Format Data for PLC / Trigger: Otros nodos de salida para integración
  • Inspection Pass/Fail: Determinación final de pase/fallo
  • Save to Library: Almacena resultados

Carga útil de OCR en Node-RED

En el Modo Avanzado, los resultados de OCR están disponibles en el objeto msg.payload.ocr. Esto le da acceso programático completo a cada detección:

{
"predictions": [
{
"roi_id": 1,
"roi_name": "Serial Number",
"center_x_global": 450,
"center_y_global": 220,
"angle_global": 90,
"search_area_id": 1,
"detections": [
{
"text": "SN-2025-0042",
"confidence": 0.95,
"roi_bbox": {
"x": 10,
"y": 5,
"width": 120,
"height": 30,
"angle": 0
},
"global_bbox": {
"x": 450,
"y": 220,
"width": 120,
"height": 30,
"angle": 90
}
}
]
}
]
}
CampoDescripción
roi_idID numérico de la ROI que produjo este resultado
roi_nameEl nombre que le asignaste a la ROI (p. ej., "Serial Number")
center_x_global / center_y_globalPosición central de la ROI en coordenadas de cuadro completo
angle_globalÁngulo de rotación de la ROI en el cuadro completo
search_area_idEl tipo de inspección / área de búsqueda a la que pertenece esta ROI
detectionsArreglo de detecciones de texto individuales encontradas dentro de esta ROI
detections[].textCadena de texto reconocida
detections[].confidenceConfianza de reconocimiento de 0.0 a 1.0 (limitada)
detections[].roi_bboxPosición de la bounding box relativa al origen de recorte de la ROI
detections[].global_bboxPosición de la bounding box en el marco completo de la cámara (toma en cuenta la rotación y alineación de la ROI)
tip

Utilice msg.payload.ocr.predictions[0].detections.map(d => d.text).join(" ") para obtener la misma cadena de texto unida que utiliza Basic Mode para la comparación.

Con el Modo Avanzado, puedes:

  • Aplicar patrones regex al texto detectado usando JavaScript
  • Filtrar detecciones por umbral de confianza
  • Combinar resultados de OCR con resultados de clasificación/segmentación para lógica compleja
  • Formatear texto OCR para salida hacia PLC (p. ej., enviar el número de serie detectado por EtherNet/IP)
  • Enviar mensajes personalizados a Microsoft Teams o correo electrónico según el contenido de OCR

Para una guía detallada sobre Node-RED, consulta Node-RED Basics.

Cambio entre modos

Puedes cambiar entre el modo Básico y el Modo Avanzado en cualquier momento usando el botón de alternancia en la parte superior de la página IO Logic. Al cambiar a Modo Básico, cualquier lógica de Node-RED implementada se desactiva y es reemplazada por reglas del Modo Básico. Al volver, se restaura el flujo de Node-RED.


Paso 9: Desplegar la Receta

Una vez que su configuración OCR esté completa y probada:

  1. Regrese al Recipe Editor (haga clic en Recipe Editor en la barra lateral izquierda)
  2. Haga clic en el botón púrpura Deploy Recipe en la esquina inferior derecha
  3. La receta está ahora activa y ejecutando inspecciones

Visualización de Resultados

HMI

La página HMI muestra resultados de inspección en tiempo real. Con OCR activo, verá:

  • La transmisión en vivo de la cámara con cajas de delimitación moradas alrededor del texto detectado
  • Etiquetas de texto que muestran lo que se leyó
  • Estado de Aprobado/Rechazado basado en sus reglas de IO Logic
  • Estadísticas en ejecución: inspecciones totales, aprobadas, rechazadas, porcentaje de rendimiento

HMI view showing live OCR inspection results

Library

Vaya a Library en la barra lateral izquierda para revisar los resultados almacenados de capturas anteriores. Cada entrada de captura muestra:

  • La imagen capturada con superposición OCR
  • Texto detectado por ROI
  • Puntuaciones de confianza
  • Resultado de Aprobado/Rechazado

Solución de Problemas

No se detecta texto

Posible causaSolución
ROI no está posicionado sobre el textoReubique el ROI en la Configuración de Inspección
La orientación del ROI no coincide con la dirección del textoEsta es la causa n.º 1. Rote el ROI para alinearlo con la dirección del texto (Paso 4d)
El texto es demasiado pequeño en la imagenAcérquese a la cámara o use un lente de mayor longitud focal
El texto es demasiado pequeño en relación con el ROIHaga el ROI más ajustado alrededor del área de texto
El área de texto mínima es demasiado altaReduzca el parámetro Min Text Area
Iluminación insuficiente / contraste bajoMejore la iluminación para maximizar el contraste entre el texto y el fondo
El texto está borrosoAjuste el enfoque en el lente C-mount y verifique que el soporte de la cámara esté estable
La alineación no está configuradaLa detección de texto requiere alineación. Configure la alineación de plantilla (Paso 3)

Texto incorrecto detectado (lecturas erróneas)

Posible causaSolución
La orientación del ROI no coincide con la orientación del textoEsta es la causa n.º 1. Rote el ROI para alinearlo con la dirección del texto (Paso 4d)
Baja calidad de imagen o ruidoAumente la exposición, reduzca la ganancia, mejore la iluminación
Umbral de Segmentación de Texto demasiado bajoAumente para filtrar detecciones de texto falsas
Regiones de texto superpuestas se fusionan en una única detecciónDisminuya la relación de Unclip para evitar la fusión de cajas
Varias líneas de texto en un ROICree ROIs separados para cada línea si el orden de lectura importa

La confianza de OCR es consistentemente baja

Posible causaSolución
Uniformidad de iluminación deficienteAsegure una iluminación uniforme en toda el área de texto
Deslumbramiento o reflejos en el texto (especialmente en etiquetas brillantes)Ajuste el ángulo de iluminación para eliminar reflejos especulares. Considere iluminación difusa.
Fuente muy pequeña o altamente estilizadaAcérquese a la cámara o use un lente de mayor longitud focal para aumentar el tamaño del texto en la imagen
Texto dañado, desvanecido o parcialmente impresoOCR solo puede leer lo que la cámara ve. Si el texto está físicamente degradado, la precisión será menor.
Ganancia alta en la configuración de imagenReduzca la ganancia. La ganancia alta añade ruido que parece artefactos de texto.

Las reglas de Aprobado/Rechazado no funcionan como se espera

Posible causaSolución
El texto se une de forma diferente a lo esperadoHabilite la Vista previa en vivo y verifique exactamente qué texto se está detectando. Recuerde, varias detecciones se unen con espacios.
Usar "equals" cuando es más apropiado "includes"Si solo le importa una subcadena, use "includes" en lugar de "equals"
Reglas no implementadasHaga clic en Save & Deploy después de cambiar las reglas en Modo Básico
ROI incorrecto seleccionado en la reglaVerifique la lista desplegable de ROIs en su regla para asegurarse de que apunte a la región correcta

Limitaciones

  • Máximo 1 bloque OCR por receta (puede haber múltiples ROI dentro de ese bloque)
  • Solo modelo optimizado para inglés: El modelo preentrenado está optimizado para texto impreso basado en latín. El texto manuscrito, escritura cursiva o escrituras no latinas (Chino, Japonés, Coreano, Árabe) no son compatibles.
  • Sin expresiones regulares o coincidencia de patrones en Modo Básico: Las reglas de aprobación/rechazo utilizan una comparación de cadenas simple (igual a, distinto de, incluye, no incluye). Para patrones de validación complejos (p. ej., coincidir con "SN-####-####"), use Modo Avanzado (Node-RED) con expresiones regulares de JavaScript personalizadas.
  • Sin conjunto de caracteres configurable por el usuario: El diccionario de 480 caracteres del modelo es fijo. No puede restringir el reconocimiento a dígitos solamente, por ejemplo. Utilice reglas de aprobación/rechazo para validar el formato esperado.
  • No hay un orden de texto garantizado: Cuando se detectan múltiples regiones de texto dentro de un ROI, se combinan en el orden de detección (por contorno), no necesariamente en el orden de lectura (de izquierda a derecha, de arriba hacia abajo). Si el orden de lectura es crítico, use ROI separadas para cada línea de texto.
  • Solo modelo preentrenado: A diferencia de la clasificación y la segmentación, el modelo OCR no puede reentrenarse ni ajustarse a sus fuentes o estilos de texto específicos. Utiliza el modelo OCR preentrenado incorporado.

Ver también