Saltar al contenido principal

DOCUMENTACIÓN CON IA

¿Qué desea saber?

OCR (Optical Character Recognition)

El OV80i puede leer texto impreso, números de serie, códigos de fecha y otros caracteres alfanuméricos directamente desde las imágenes de la cámara utilizando un modelo OCR preentrenado. A diferencia de los clasificadores y segmentadores, OCR no requiere datos de entrenamiento. Funciona desde el primer momento.

OCR es útil cuando necesita:

  • Verificar que los números de serie o códigos de lote coincidan con los valores esperados
  • Confirmar que las etiquetas estén presentes y sean legibles
  • Leer códigos de fecha/caducidad para trazabilidad
  • Revisar números de parte en componentes durante el ensamblaje
Solo OV80i

OCR está disponible exclusivamente en el OV80i. El OV20i y el OV10i no admiten OCR.


Cómo Funciona OCR

El OV80i utiliza un pipeline de IA de dos etapas para el reconocimiento de texto:

  1. Detección de Texto: Encuentra dónde se encuentra el texto dentro de la ROI. Devuelve cuadros delimitadores alrededor de cada palabra o región de texto detectada.
  2. Reconocimiento de Texto: Lee los caracteres dentro de cada cuadro delimitador detectado y devuelve la cadena de texto con una puntuación de confianza.

Todo este proceso se ejecuta en la GPU NVIDIA Jetson Orin NX de la cámara. No se necesita conexión en la nube.

El modelo reconoce un amplio conjunto de caracteres que incluye:

  • Dígitos (0-9)
  • Letras latinas (A-Z, a-z, caracteres acentuados)
  • Puntuación y símbolos comunes
  • Letras griegas
  • Símbolos de moneda
  • Operadores matemáticos
nota

El conjunto de caracteres es fijo y no se puede personalizar. El modelo admite aproximadamente 480 caracteres que cubren la mayoría del texto industrial impreso en idiomas basados en el alfabeto latino.


Prerrequisitos

Antes de configurar OCR, necesita una cámara que esté:

  • Montada físicamente y estable
  • Conectada a su red y accesible desde un navegador
  • Enfocada en la pieza con el texto que desea leer

Si aún no lo ha hecho, siga primero las guías de inicio:


Paso 1: Crear una Nueva Receta

Toda inspección comienza con una receta. Una receta es un paquete completo: ajustes de imagen, alineación, regiones de interés (ROIs), modelos de IA y reglas de salida.

  1. Navegue a All Recipes en la barra lateral izquierda
  2. Haga clic en + New en la esquina superior derecha
  3. Asigne a su receta un nombre descriptivo (por ejemplo, "Serial Number Check", "Label Verification")
  4. Haga clic en Activar para convertirla en la receta activa, luego haga clic en Edit para abrir el editor de recetas

Vista general del editor de recetas mostrando todos los bloques

El editor de recetas muestra el pipeline de inspección completo. Lo trabajará de izquierda a derecha:

  • Imaging Setup (ajustes de la cámara)
  • Image Alignment & Inspection Setup (plantilla, ROIs)
  • AI Blocks (Clasificación, Segmentación, OCR, Medición)
  • Set Pass/Fail & IO Logic (reglas de salida)

Para un recorrido detallado sobre la creación de recetas, consulte Create First Inspection.


Paso 2: Configurar los Ajustes de Imagen

Una buena calidad de imagen es la base de un OCR preciso. El texto debe ser claramente visible con un contraste fuerte.

  1. Haga clic en Configure Imaging o navegue a la pestaña Imaging Setup
  2. Ajuste las siguientes configuraciones mientras observa la vista previa en vivo:
ConfiguraciónObjetivo para OCR
ExposureSuficientemente brillante para ver claramente todo el texto. Demasiado oscuro y los caracteres desaparecen en el fondo. Demasiado brillante y las etiquetas blancas se sobreexponen.
GainMantenga lo más bajo posible. Una ganancia alta introduce ruido que parece artefactos de texto al detector.
GammaAjuste para mejorar el contraste entre el texto y el fondo.
FocusEl texto debe estar nítido. Si los caracteres se ven borrosos o difusos, ajuste el anillo de enfoque del lente C-mount.
La iluminación es crítica para OCR

La precisión de OCR depende en gran medida de la calidad de la imagen. El texto debe ser claramente visible en la imagen de la cámara con buen contraste contra el fondo. Texto oscuro sobre fondo claro o texto claro sobre fondo oscuro funcionan bien. Evite:

  • Iluminación desigual que crea sombras a través de los caracteres
  • Reflejos en etiquetas brillantes
  • Subexposición que dificulta distinguir el texto del fondo
tip

Acerque el área de texto en la vista previa en vivo. ¿Puede leer cada carácter claramente? Si usted no puede leerlo, la IA tampoco podrá.

Para una guía detallada sobre todos los ajustes de imagen, consulte Image Settings.


Paso 3: Configurar la alineación de plantilla

La alineación de plantilla le indica a la cámara cómo rastrear la posición y orientación de su pieza. Esto es esencial porque las piezas no siempre caen en el mismo lugar exacto en el transportador o accesorio.

  1. Navegue a la pestaña Template Image and Alignment
  2. Coloque su pieza en el campo de visión de la cámara
  3. Haga clic en Capture Template para tomar una imagen de referencia
  4. Dibuje 2-3 pequeñas regiones de plantilla sobre características que siempre estén presentes y sean fáciles de identificar (por ejemplo, esquinas, logotipos, orificios de montaje)
nota

Coloque las regiones de plantilla tan alejadas como sea posible en la pieza. Esto reduce drásticamente la variación angular en la alineación. Dos regiones cercanas entre sí dan poca estabilidad rotacional; dos regiones en esquinas opuestas dan una excelente estabilidad.

aviso

Si omite la alineación, sus ROIs de OCR se fijarán a posiciones de píxeles absolutas. Cualquier movimiento de la pieza hará que el ROI no encuentre el texto. Siempre configure la alineación para uso en producción.

Para obtener una guía detallada sobre la alineación de plantilla, consulte Alignment.


Paso 4: Crear regiones de interés (ROIs) de OCR

Ahora definirá exactamente dónde en la pieza debe buscar texto la cámara. Este es el paso más importante para la precisión del OCR.

4a. Navegar a Inspection Setup

  1. Haga clic en la pestaña Inspection Setup en el editor de recetas
  2. Verá el Inspection Editor con su imagen de plantilla

4b. Agregar el modelo de OCR

  1. En el panel derecho, busque la sección Models
  2. Si no ve un modelo de OCR en la lista, haga clic en el botón Add en la parte inferior y seleccione OCR
  3. El modelo de OCR aparecerá en la lista de Models
nota

Solo puede tener un Bloque de OCR por receta. Sin embargo, puede crear múltiples ROIs dentro de ese bloque para leer texto de diferentes áreas de la pieza.

4c. Crear un ROI de OCR

  1. Asegúrese de que la fila del modelo de OCR esté seleccionada (resaltada) en la lista de Models
  2. Haga clic en Add ROI en la sección Region of Interest
  3. Aparecerá un nuevo ROI rectangular sobre la imagen
  4. Arrastre el ROI para posicionarlo sobre el texto que desea leer
  5. Cambie su tamaño arrastrando los controladores de las esquinas

Inspection Setup con ROI de OCR dibujado sobre texto

4d. Establecer la orientación del ROI

La orientación del ROI DEBE coincidir con la orientación del texto

Esto es lo más importante que debe configurar correctamente. La orientación de su ROI debe coincidir con la orientación del texto que desea leer.

El motor de OCR recorta la imagen usando el ángulo del ROI y luego procesa el recorte como si el texto fuera horizontal. Si el ángulo del ROI no coincide con el ángulo del texto, el motor intentará leer texto rotado y producirá resultados incoherentes.

Ejemplos:

  • Texto que se lee de izquierda a derecha horizontalmente: el ángulo del ROI debe ser 0 grados
  • Texto rotado 90 grados en sentido horario: el ángulo del ROI debe ser 90 grados
  • Texto al revés: el ángulo del ROI debe ser 180 grados
  • Texto en un ángulo de 45 grados: el ángulo del ROI debe ser 45 grados

Cómo rotar un ROI:

  1. Seleccione el ROI haciendo clic sobre él
  2. Use el controlador de rotación en la esquina del ROI, O
  3. Establezca el valor del ángulo directamente en los campos de posición en la parte inferior del lienzo

La barra de posición muestra: H (altura), W (anchura), X y Y (posición), y el ángulo en grados.

ROI seleccionado mostrando posición, dimensiones y ángulo de 90.96 grados

4e. Dimensione la ROI Correctamente

  • Haga la ROI lo más ajustada posible alrededor del área del texto. El fondo adicional introduce ruido y puede causar detecciones falsas.
  • Incluya un pequeño margen (10-20 píxeles) alrededor del texto para que los caracteres no queden recortados en los bordes.
  • No incluya otro texto que no desee leer. Si hay múltiples áreas de texto, cree ROIs separadas para cada una.
tip

Si necesita leer texto de múltiples áreas de la pieza (por ejemplo, un número de serie Y un código de fecha), cree una ROI separada para cada uno. Esto le brinda resultados independientes y facilita la configuración de las reglas de aprobado/rechazado.

4f. Crear ROIs Adicionales (Opcional)

Repita los pasos 4c-4e para cada área de texto que necesite leer. Cada ROI obtiene su propio nombre en la lista de región de interés. Cámbieles el nombre a algo descriptivo (por ejemplo, "Número de Serie", "Código de Fecha", "Etiqueta de Pieza") haciendo doble clic en el nombre.

tip

Use copiar y pegar para duplicar ROIs. Los nombres se incrementan automáticamente (por ejemplo, "ROI", "ROI (1)", "ROI (2)").


Paso 5: Configurar y Probar el Bloque OCR

5a. Navegue al Bloque OCR

Haga clic en la pestaña Bloque OCR en la barra de pestañas del editor de recetas. Verá la transmisión de la cámara a la izquierda y un panel de configuraciones a la derecha.

Página de descripción general del Bloque OCR

El panel derecho muestra:

  • Descripción de OPTICAL CHARACTER RECOGNITION
  • Explicación de que este es un modelo preentrenado que no requiere datos de entrenamiento
  • Instrucciones para usar Vista Previa en Vivo o Probar para validar

5b. Habilite la Vista Previa en Vivo

Marque la casilla Modo de Vista Previa en Vivo en la parte superior derecha. La cámara comenzará a procesar fotogramas en tiempo real.

Vista Previa en Vivo de OCR con panel de parámetros

Con la Vista Previa en Vivo activa, verá:

  • Tiempo de procesamiento: Cuánto tarda el modelo OCR por fotograma
  • Latencia: Tiempo total de ida y vuelta incluyendo la captura de imagen y el renderizado
  • Cuadros delimitadores morados alrededor de las regiones de texto detectadas superpuestos en la transmisión de la cámara
  • Texto detectado mostrado como etiquetas en cada cuadro delimitador
  • Panel de parámetros a la derecha para ajustar las configuraciones de detección

5c. Verifique que OCR esté Leyendo Correctamente

Con la Vista Previa en Vivo activada, coloque su pieza bajo la cámara y verifique:

  1. ¿Se detectan todas las regiones de texto? Debería ver cuadros morados alrededor de cada palabra/frase en la ROI.
  2. ¿El texto se está leyendo correctamente? Las etiquetas deben coincidir con el texto real en la pieza.
  3. ¿Hay detecciones falsas? ¿Se están identificando incorrectamente áreas sin texto como texto?
  4. Mueva ligeramente la pieza. ¿OCR continúa funcionando en diferentes posiciones (esto prueba la alineación)?

Si el texto no se está detectando o se está leyendo incorrectamente, verifique:

  • La orientación de la ROI coincide con la orientación del texto (consulte el Paso 4d)
  • La ROI está posicionada correctamente sobre el texto
  • La calidad de imagen es buena (enfoque nítido, buen contraste, iluminación uniforme)
  • Intente ajustar los parámetros de OCR (consulte la siguiente sección)

Paso 6: Ajustar los Parámetros de OCR

Cuando la Vista Previa en Vivo está habilitada, el panel derecho muestra cuatro parámetros ajustables. Estos controlan la etapa de detección de texto (encontrar dónde está el texto), no la etapa de reconocimiento (leer lo que dice).

ParámetroPredeterminadoQué hace
Text Segmentation Threshold0.10Qué tan seguro debe estar el detector de que una región contiene texto. Valores más altos = detección más estricta, menos falsos positivos pero puede perder texto tenue. Valores más bajos = más sensible, detecta texto tenue pero puede tener detecciones falsas. Rango: 0.0 a 1.0.
Unclip Ratio4.0Cuánto expandir los cuadros delimitadores detectados hacia afuera desde el contorno del texto. Valores más altos = cuadros más grandes. Auméntelo si los cuadros están recortando los bordes de caracteres grandes. Disminúyalo si las palabras cercanas se están fusionando en un solo cuadro.
Unclip Ceiling20Expansión máxima en píxeles del unclipping. Esto limita el crecimiento para que las expansiones de gran proporción en texto grande no creen cuadros enormes. Auméntelo si el texto grande aún se está recortando incluso después de aumentar Unclip Ratio.
Min Text Area500Área mínima (en píxeles) para una región de texto detectada. Cualquier cosa más pequeña se descarta como ruido. Auméntelo si pequeños artefactos se están detectando como texto. Disminúyalo si el texto pequeño pero válido se está filtrando.
Cuándo ajustar parámetros

Comience con los valores predeterminados. Solo ajuste si ve problemas específicos en la Vista Previa en Vivo:

ProblemaParámetro a ajustarDirección
Áreas sin texto detectadas como textoText Segmentation ThresholdAumentar
Se está perdiendo texto válidoText Segmentation ThresholdDisminuir
Los cuadros delimitadores recortan los bordes de los caracteresUnclip RatioAumentar
Las palabras cercanas se fusionan en un solo cuadroUnclip RatioDisminuir
Los cuadros crecen demasiado en texto grandeUnclip CeilingDisminuir
Texto grande aún recortado después de aumentar Unclip RatioUnclip CeilingAumentar
Ruido/artefactos detectados como textoMin Text AreaAumentar
Texto válido pequeño se está filtrandoMin Text AreaDisminuir

Los cambios de parámetros surten efecto inmediatamente en la Vista Previa en Vivo, por lo que puede ajustar de manera iterativa. Estos parámetros también se aplican durante las capturas de producción, no solo durante la vista previa.


Paso 7: Probar con Imágenes Capturadas

Después de ajustar los parámetros con Vista Previa en Vivo, valide el OCR en una variedad de muestras de producción.

7a. Usando el Panel de Pruebas

  1. Deshabilite el Modo de Vista Previa en Vivo (desmarque la casilla)
  2. Haga clic en el botón Test

Panel de Test OCR Block con opciones Select From Library y Upload

  1. Haga clic en Select From Library para elegir imágenes de inspecciones capturadas previamente, o haga clic en Upload Captures para subir imágenes desde su computadora
  2. Los resultados de la prueba muestran para cada ROI:
    • Detected Text (mostrado en formato monoespaciado/código)
    • Confidence (etiqueta codificada por color: verde por encima del 80%, naranja por encima del 50%, rojo por debajo del 50%)
    • Detection Count (cuántas regiones de texto fueron encontradas)

7b. Qué Observar

  • Consistencia: ¿El OCR lee el mismo texto cada vez para la misma pieza?
  • Precisión: ¿Las cadenas detectadas coinciden con el texto real en la pieza?
  • Puntajes de confianza: ¿Están consistentemente por encima del 80%? Una confianza baja a menudo indica problemas de calidad de imagen.
  • Casos límite: Pruebe con piezas que tengan texto manchado, descolorido o parcialmente oscurecido.
precaución

Si los puntajes de confianza están consistentemente por debajo del 80%, revise sus configuraciones de imagen (Paso 2). La precisión del OCR está directamente ligada a la calidad de la imagen. Ningún ajuste de parámetros puede compensar una imagen borrosa o mal iluminada.


Paso 8: Configurar Reglas de Aprobado/Rechazado (lógica de IO)

Después de que el OCR esté detectando texto correctamente, debe definir qué constituye un aprobado o rechazado. Navegue a la pestaña IO Logic.

Modo Básico

El Modo Básico proporciona una IU simple basada en reglas para la lógica de aprobado/rechazado del OCR. No se requiere conocimiento de Node-RED.

Modo Básico de aprobado/rechazado y lógica de IO con la sección OCR Rules

La página muestra:

  • Pestañas Preview / Test a la izquierda (para visualizar resultados contra sus reglas)
  • Sección OCR Rules a la derecha
  • Botón Save & Deploy para activar reglas
  • Botón Advanced Mode para cambiar a Node-RED

Creación de una Regla

Haga clic en + Add rule para crear una regla de aprobado/rechazado. Cada regla tiene tres campos:

Add rule mostrando el menú desplegable de ROIs, el menú desplegable de Operator y la entrada de Text

CampoDescripción
ROIsQué ROI(s) evaluar. Haga clic para expandir y seleccionar "All ROIs" o elegir regiones específicas.
OperatorLa comparación a realizar sobre el texto detectado.
TextLa cadena de texto esperada con la cual comparar.

Operadores Disponibles

Haga clic en el menú desplegable Operator para ver las cuatro opciones:

Menú desplegable Operator mostrando equals, not equals, includes, not includes

OperadorComportamientoEjemplo de caso de uso
= (equals)Todo el texto detectado unido debe coincidir exactamente con el texto esperadoVerificar que un número de serie lea exactamente "SN-2025-0042"
!= (not equals)El texto unido NO debe coincidir con el texto esperadoRechazar piezas con un código conocido como defectuoso
includesEl texto unido debe contener el texto esperado como subcadenaVerificar que una etiqueta contenga la palabra "SAFETY" en alguna parte
not includesEl texto unido NO debe contener el texto esperadoAsegurar que un código de producto obsoleto no aparezca

Cómo se Compara el Texto

Importante: Comportamiento de unión de texto

Cuando una ROI contiene múltiples regiones de texto detectadas (por ejemplo, el detector encuentra "LOT" y "2025" como palabras separadas), todas las cadenas de texto individuales se unen con espacios antes de la comparación.

Entonces, si el detector encuentra tres regiones de texto que leen "LOT", "2025" y "A1", el texto unido se convierte en "LOT 2025 A1". Su regla compara contra esta cadena unida completa.

Esto significa:

  • Una regla de equals para "LOT 2025 A1" sería aprobada
  • Una regla de includes para "2025" sería aprobada
  • Una regla de equals solo para "LOT" fallaría (porque el texto unido incluye más que solo "LOT")

Reglas Múltiples

Puede agregar múltiples reglas haciendo clic en + Add rule nuevamente. Todas las reglas usan lógica AND: cada regla debe aprobarse para que la verificación de OCR sea aprobada. Si una sola regla falla, toda la inspección falla.

Selección de ROI

Menú desplegable de ROIs mostrando la opción All ROIs

Haga clic en el menú desplegable de ROIs para seleccionar a qué región(es) se aplica la regla:

  • All ROIs: La regla evalúa el texto de todas las regiones OCR combinadas
  • Specific ROI: Expanda para elegir ROIs individuales por nombre (por esto es importante nombrar sus ROIs de forma descriptiva en el Paso 4f)

Guardar y Desplegar

Después de configurar sus reglas, haga clic en Save & Deploy para activarlas. Las reglas tendrán efecto inmediatamente para todas las inspecciones futuras.


Modo Avanzado (Node-RED)

Para una lógica de aprobado/rechazado más compleja que el Modo Básico no pueda manejar, cambie al Modo Avanzado.

Haga clic en el botón Advanced Mode para ver un diálogo de confirmación:

Diálogo de confirmación del Modo Básico explicando el cambio

El diálogo explica:

  • El Modo Avanzado utiliza el entorno completo de programación visual de Node-RED
  • Cualquier regla del Modo Básico será desactivada
  • Puede volver al Modo Básico en cualquier momento

Haga clic en Switch to Advanced Mode (o si ya está en Modo Avanzado, el botón dice Basic Mode).

Flujo de Node-RED en Modo Avanzado con nodo Check OCR

En Modo Avanzado, verá un lienzo de flujo de Node-RED con nodos preconstruidos que incluyen:

  • All Block Outputs: Recibe resultados de todos los Bloques AI (clasificación, segmentación, OCR, medición)
  • Check OCR (o similar): Un nodo de función que contiene JavaScript que evalúa los resultados de OCR
  • Classification Block Logic / Format Data for PLC / Trigger: Otros nodos de salida para integración
  • Inspection Pass/Fail: Determinación final de aprobado/rechazado
  • Save to Library: Almacena los resultados

Payload de Salida de OCR en Node-RED

En Modo Avanzado, los resultados de OCR están disponibles en el objeto msg.payload.ocr. Esto le da acceso programático completo a cada detección:

{
"predictions": [
{
"roi_id": 1,
"roi_name": "Serial Number",
"center_x_global": 450,
"center_y_global": 220,
"angle_global": 90,
"search_area_id": 1,
"detections": [
{
"text": "SN-2025-0042",
"confidence": 0.95,
"roi_bbox": {
"x": 10,
"y": 5,
"width": 120,
"height": 30,
"angle": 0
},
"global_bbox": {
"x": 450,
"y": 220,
"width": 120,
"height": 30,
"angle": 90
}
}
]
}
]
}
CampoDescripción
roi_idID numérico de la ROI que produjo este resultado
roi_nameEl nombre que le dio a la ROI (por ejemplo, "Serial Number")
center_x_global / center_y_globalPosición central de la ROI en coordenadas de cuadro completo
angle_globalÁngulo de rotación de la ROI en el cuadro completo
search_area_idEl tipo de inspección / área de búsqueda a la que pertenece esta ROI
detectionsArreglo de detecciones de texto individuales encontradas dentro de esta ROI
detections[].textLa cadena de texto reconocida
detections[].confidenceConfianza de reconocimiento de 0.0 a 1.0 (acotada)
detections[].roi_bboxPosición del cuadro delimitador relativa al origen del recorte de la ROI
detections[].global_bboxPosición del cuadro delimitador en el cuadro completo de la cámara (considera la rotación y alineación de la ROI)
tip

Use msg.payload.ocr.predictions[0].detections.map(d => d.text).join(" ") para obtener la misma cadena de texto unida que el Modo Básico usa para la comparación.

Con el Modo Avanzado, puede:

  • Aplicar patrones regex al texto detectado usando JavaScript
  • Filtrar detecciones por umbral de confianza
  • Combinar resultados de OCR con resultados de clasificación/segmentación para lógica compleja
  • Formatear texto OCR para salida a PLC (por ejemplo, enviar el número de serie detectado a través de EtherNet/IP)
  • Enviar mensajes personalizados a Microsoft Teams o correo electrónico basados en el contenido de OCR

Para una guía detallada sobre Node-RED, consulte Node-RED Basics.

Cambio entre modos

Puede cambiar entre Modo Básico y Avanzado en cualquier momento usando el botón de alternancia en la parte superior de la página de lógica de IO. Al cambiar a Modo Básico, cualquier lógica de Node-RED desplegada se desactiva y se reemplaza con las reglas del Modo Básico. Al cambiar de regreso, el flujo de Node-RED se restaura.


Paso 9: Desplegar la receta

Una vez que la configuración de OCR esté completa y probada:

  1. Regrese al editor de recetas (haga clic en editor de recetas en la barra lateral izquierda)
  2. Haga clic en el botón morado Desplegar receta en la parte inferior derecha
  3. La receta ahora está activa y ejecutando inspecciones

Visualización de resultados

HMI

La página HMI muestra los resultados de inspección en vivo. Con OCR activo, verá:

  • La transmisión en vivo de la cámara con cuadros delimitadores morados alrededor del texto detectado
  • Etiquetas de texto que muestran lo que se leyó
  • Estado de aprobado/rechazado según las reglas de su lógica de IO
  • Estadísticas en ejecución: inspecciones totales, aprobadas, rechazadas, porcentaje de rendimiento

Vista HMI mostrando resultados de inspección OCR en vivo

Biblioteca

Navegue a Biblioteca en la barra lateral izquierda para revisar los resultados almacenados de capturas pasadas. Cada entrada de captura muestra:

  • La imagen capturada con superposición de OCR
  • Texto detectado por ROI
  • Puntuaciones de confianza
  • Resultado de aprobado/rechazado

Solución de problemas

No se detecta texto

Posible causaSolución
ROI no está posicionado sobre el textoReposicione el ROI en la configuración de inspección
La orientación del ROI no coincide con el textoRote el ROI para alinearlo con la dirección del texto (Paso 4d)
Texto demasiado pequeño en la imagenAcerque la cámara o utilice una lente con mayor distancia focal
Texto demasiado pequeño en relación al ROIAjuste el ROI más cerca del área de texto
Min Text Area demasiado altoDisminuya el parámetro Min Text Area
Iluminación deficiente / bajo contrasteMejore la iluminación para maximizar el contraste entre el texto y el fondo
El texto está borrosoAjuste el enfoque de la lente C-mount y verifique que el montaje de la cámara sea estable
Alineación no configuradaLa detección de texto requiere alineación. Configure la alineación de plantilla (Paso 3)

Texto detectado incorrecto (lecturas erróneas)

Posible causaSolución
La orientación del ROI no coincide con la orientación del textoEsta es la causa #1. Rote el ROI para alinearlo con la dirección del texto (Paso 4d)
Baja calidad de imagen o ruidoAumente la exposición, reduzca la ganancia, mejore la iluminación
Text Segmentation Threshold demasiado bajoAuméntelo para filtrar las detecciones de texto falsas
Regiones de texto superpuestas que se fusionan en una sola detecciónDisminuya el Unclip Ratio para evitar la fusión de cuadros
Múltiples líneas de texto en un solo ROICree ROIs separados para cada línea si el orden de lectura es importante

La confianza del OCR es consistentemente baja

Posible causaSolución
Uniformidad de iluminación deficienteAsegure una iluminación uniforme en toda el área del texto
Brillo o reflejos en el texto (especialmente etiquetas brillantes)Ajuste el ángulo de iluminación para eliminar los reflejos especulares. Considere iluminación difusa.
Fuente muy pequeña o muy estilizadaAcerque la cámara o utilice una lente con mayor distancia focal para aumentar el tamaño del texto en la imagen
Texto dañado, descolorido o parcialmente impresoEl OCR solo puede leer lo que la cámara ve. Si el texto está físicamente degradado, la precisión será menor.
Ganancia alta en la configuración de imagenReduzca la ganancia. Una ganancia alta añade ruido que se parece a artefactos de texto.

Las reglas de aprobado/rechazado no funcionan como se espera

Posible causaSolución
El texto se une de forma diferente a la esperadaActive la Vista Previa en Vivo y verifique exactamente qué texto se está detectando. Recuerde, las detecciones múltiples se unen con espacios.
Usar "equals" cuando "includes" es más apropiadoSi solo le interesa una subcadena, use "includes" en lugar de "equals"
Reglas no desplegadasHaga clic en Save & Deploy después de cambiar las reglas en el Modo Básico
ROI incorrecto seleccionado en la reglaRevise el menú desplegable de ROIs en su regla para asegurarse de que apunta a la región correcta

Limitaciones

  • Máximo 1 bloque OCR por receta (puede tener múltiples ROIs dentro de ese bloque)
  • Modelo optimizado solo para inglés: El modelo preentrenado está optimizado para texto impreso basado en caracteres latinos. No se admite texto manuscrito, cursiva ni escrituras no latinas (chino, japonés, coreano, árabe).
  • Sin regex ni coincidencia de patrones en Modo Básico: Las reglas de aprobado/rechazado utilizan comparación simple de cadenas (igual a, no igual a, incluye, no incluye). Para patrones de validación complejos (por ejemplo, coincidir con "SN-####-####"), utilice el Modo Avanzado (Node-RED) con regex personalizado de JavaScript.
  • Sin conjunto de caracteres configurable por el usuario: El diccionario de 480 caracteres del modelo es fijo. Por ejemplo, no se puede restringir el reconocimiento solo a dígitos. Utilice reglas de aprobado/rechazado para validar el formato esperado.
  • Sin orden garantizado del texto: Cuando se detectan múltiples regiones de texto dentro de una ROI, se unen en orden de detección (por contorno), no necesariamente en orden de lectura (de izquierda a derecha, de arriba a abajo). Si el orden de lectura es importante, utilice ROIs separadas para cada línea de texto.
  • Solo modelo preentrenado: A diferencia de la clasificación y la segmentación, el modelo OCR no se puede reentrenar ni ajustar con sus fuentes o estilos de texto específicos. Utiliza el modelo OCR preentrenado integrado.

Consulte También