AI-POWERED DOCS
What do you want to know?
OCR (Optical Character Recognition)
OV80i có thể đọc văn bản in, số sê-ri, mã ngày tháng và các ký tự chữ-số khác trực tiếp từ hình ảnh camera bằng cách sử dụng một mô hình OCR đã được huấn luyện sẵn. Không giống như classifier và segmenter, OCR không yêu cầu dữ liệu huấn luyện. Nó hoạt động ngay khi sử dụng.
OCR hữu ích khi bạn cần:
- Xác minh số sê-ri hoặc mã lô khớp với các giá trị mong đợi
- Xác nhận nhãn có hiện diện và có thể đọc được
- Đọc mã ngày/hạn sử dụng để truy xuất nguồn gốc
- Kiểm tra mã linh kiện trên các bộ phận trong quá trình lắp ráp
OCR chỉ khả dụng độc quyền trên OV80i. OV20i và OV10i không hỗ trợ OCR.
Cách OCR Hoạt Động
OV80i sử dụng pipeline AI hai giai đoạn để nhận dạng văn bản:
- Text Detection: Tìm vị trí của văn bản trong ROI. Trả về các khung bao (bounding box) xung quanh mỗi từ hoặc vùng văn bản được phát hiện.
- Text Recognition: Đọc các ký tự bên trong mỗi khung bao đã phát hiện và trả về chuỗi văn bản kèm theo điểm tin cậy (confidence score).
Toàn bộ quá trình này chạy trên GPU NVIDIA Jetson Orin NX của camera. Không cần kết nối đám mây.
Mô hình nhận dạng một bộ ký tự rộng bao gồm:
- Chữ số (0-9)
- Chữ cái Latinh (A-Z, a-z, các ký tự có dấu)
- Dấu câu và ký hiệu thông dụng
- Chữ cái Hy Lạp
- Ký hiệu tiền tệ
- Toán tử toán học
Bộ ký tự được cố định và không thể tùy chỉnh. Mô hình hỗ trợ khoảng 480 ký tự bao phủ hầu hết văn bản công nghiệp được in bằng các ngôn ngữ dựa trên hệ Latinh.
Điều Kiện Tiên Quyết
Trước khi thiết lập OCR, bạn cần một camera:
- Được lắp đặt vật lý và ổn định
- Được kết nối với mạng của bạn và có thể truy cập qua trình duyệt
- Được lấy nét vào bộ phận có văn bản bạn muốn đọc
Nếu bạn chưa thực hiện những điều này, hãy làm theo các hướng dẫn bắt đầu trước:
Bước 1: Tạo Một Recipe Mới
Mỗi cuộc kiểm tra bắt đầu bằng một recipe. Một recipe là một gói hoàn chỉnh: cài đặt hình ảnh, căn chỉnh, các vùng quan tâm (ROI), mô hình AI và các quy tắc đầu ra.
- Điều hướng đến All Recipes trong thanh bên trái
- Nhấp vào + New ở phía trên bên phải
- Đặt cho recipe của bạn một tên mô tả (ví dụ: "Serial Number Check", "Label Verification")
- Nhấp vào Activate để biến nó thành recipe đang hoạt động, sau đó nhấp vào Edit để mở Recipe Editor

Recipe Editor hiển thị toàn bộ pipeline kiểm tra. Bạn sẽ làm việc theo thứ tự từ trái sang phải:
- Imaging Setup (cài đặt camera)
- Image Alignment & Inspection Setup (template, ROI)
- AI Blocks (Classification, Segmentation, OCR, Measurement)
- Set Pass/Fail & IO Logic (quy tắc đầu ra)
Để có hướng dẫn chi tiết về việc tạo recipe, xem Tạo Cuộc Kiểm Tra Đầu Tiên.
Bước 2: Cấu Hình Cài Đặt Hình Ảnh
Chất lượng hình ảnh tốt là nền tảng của OCR chính xác. Văn bản phải được nhìn thấy rõ ràng với độ tương phản mạnh.
- Nhấp vào Configure Imaging hoặc điều hướng đến tab Imaging Setup
- Điều chỉnh các cài đặt sau đây trong khi xem preview trực tiếp:
| Cài Đặt | Mục Tiêu Cho OCR |
|---|---|
| Exposure | Đủ sáng để nhìn thấy rõ tất cả văn bản. Quá tối thì các ký tự sẽ biến mất vào nền. Quá sáng thì các nhãn trắng sẽ bị cháy sáng. |
| Gain | Giữ ở mức thấp nhất có thể. Gain cao gây ra nhiễu trông giống như các tạo phẩm văn bản đối với bộ phát hiện. |
| Gamma | Điều chỉnh để cải thiện độ tương phản giữa văn bản và nền. |
| Focus | Văn bản phải sắc nét. Nếu các ký tự trông mờ hoặc nhòe, hãy điều chỉnh vòng lấy nét của ống kính C-mount. |
Độ chính xác của OCR phụ thuộc rất nhiều vào chất lượng hình ảnh. Văn bản phải được nhìn thấy rõ ràng trong hình ảnh camera với độ tương phản tốt so với nền. Văn bản tối trên nền sáng hoặc văn bản sáng trên nền tối đều hoạt động tốt. Tránh:
- Ánh sáng không đều tạo ra bóng đổ trên các ký tự
- Lóa trên các nhãn bóng
- Thiếu sáng khiến văn bản khó phân biệt với nền
Phóng to khu vực văn bản trong preview trực tiếp. Bạn có thể đọc rõ từng ký tự không? Nếu bạn không thể đọc được, AI cũng không thể.
Để có hướng dẫn chi tiết về tất cả cài đặt hình ảnh, xem Cài Đặt Hình Ảnh.
Bước 3: Thiết Lập Căn Chỉnh Template
Căn chỉnh template cho camera biết cách theo dõi vị trí và hướng của bộ phận. Điều này rất cần thiết vì các bộ phận không phải lúc nào cũng nằm ở vị trí chính xác giống nhau trên băng tải hoặc đồ gá.
- Điều hướng đến tab Template Image and Alignment
- Đặt bộ phận của bạn vào trường nhìn của camera
- Nhấp Capture Template để chụp một hình ảnh tham chiếu
- Vẽ 2-3 vùng template nhỏ trên các đặc điểm luôn hiện diện và dễ nhận dạng (ví dụ: góc, logo, lỗ lắp đặt)
Đặt các vùng template càng xa nhau càng tốt trên bộ phận. Điều này giảm đáng kể độ rung góc trong quá trình căn chỉnh. Hai vùng gần nhau sẽ cho độ ổn định xoay kém; hai vùng ở các góc đối diện sẽ cho độ ổn định xuất sắc.
Nếu bạn bỏ qua bước căn chỉnh, các ROI OCR của bạn sẽ được cố định ở vị trí pixel tuyệt đối. Bất kỳ chuyển động nào của bộ phận sẽ khiến ROI bỏ sót văn bản. Luôn luôn thiết lập căn chỉnh khi sử dụng trong sản xuất.
Để có hướng dẫn chi tiết về căn chỉnh template, xem Alignment.
Bước 4: Tạo Vùng Quan Tâm OCR (ROI)
Bây giờ bạn sẽ xác định chính xác vị trí trên bộ phận mà camera cần tìm văn bản. Đây là bước quan trọng nhất để đạt được độ chính xác OCR.
4a. Điều Hướng đến Inspection Setup
- Nhấp vào tab Inspection Setup trong Recipe Editor
- Bạn sẽ thấy Inspection Editor với hình ảnh template của bạn
4b. Thêm Model OCR
- Trong bảng bên phải, tìm phần Models
- Nếu bạn không thấy model OCR được liệt kê, nhấp vào nút Add ở phía dưới và chọn OCR
- Model OCR sẽ xuất hiện trong danh sách Models
Bạn chỉ có thể có một khối OCR cho mỗi recipe. Tuy nhiên, bạn có thể tạo nhiều ROI trong khối đó để đọc văn bản từ các khu vực khác nhau của bộ phận.
4c. Tạo Một ROI OCR
- Đảm bảo hàng model OCR được chọn (làm nổi bật) trong danh sách Models
- Nhấp Add ROI trong phần Region of Interest
- Một ROI hình chữ nhật mới sẽ xuất hiện trên hình ảnh
- Kéo ROI để định vị nó trên văn bản bạn muốn đọc
- Thay đổi kích thước bằng cách kéo các tay cầm ở góc

4d. Đặt Hướng ROI
Đây là điều quan trọng nhất cần làm đúng. Hướng của ROI phải khớp với hướng của văn bản bạn muốn đọc.
Công cụ OCR cắt hình ảnh bằng góc của ROI, sau đó xử lý phần cắt như thể văn bản nằm ngang. Nếu góc ROI của bạn không khớp với góc văn bản, công cụ sẽ cố gắng đọc văn bản xoay và tạo ra kết quả vô nghĩa.
Ví dụ:
- Văn bản đọc từ trái sang phải theo chiều ngang: góc ROI phải là 0 độ
- Văn bản xoay 90 độ theo chiều kim đồng hồ: góc ROI phải là 90 độ
- Văn bản bị lộn ngược: góc ROI phải là 180 độ
- Văn bản ở góc 45 độ: góc ROI phải là 45 độ
Cách xoay một ROI:
- Chọn ROI bằng cách nhấp vào nó
- Sử dụng tay cầm xoay ở góc của ROI, HOẶC
- Đặt giá trị góc trực tiếp trong các trường vị trí ở phía dưới canvas
Thanh vị trí hiển thị: H (chiều cao), W (chiều rộng), X và Y (vị trí), và góc tính bằng độ.

4e. Định Kích Thước ROI Chính Xác
- Đặt ROI càng sát càng tốt xung quanh khu vực văn bản. Nền thừa sẽ tạo ra nhiễu và có thể gây ra phát hiện sai.
- Bao gồm một lề nhỏ (10-20 pixel) xung quanh văn bản để các ký tự không bị cắt ở các cạnh.
- Không bao gồm các văn bản khác mà bạn không muốn đọc. Nếu có nhiều khu vực văn bản, hãy tạo các ROI riêng biệt cho từng khu vực.
Nếu bạn cần đọc văn bản từ nhiều khu vực của bộ phận (ví dụ: số sê-ri VÀ mã ngày), hãy tạo một ROI riêng cho mỗi khu vực. Điều này cung cấp cho bạn các kết quả độc lập và giúp cấu hình quy tắc pass/fail dễ dàng hơn.
4f. Tạo Các ROI Bổ Sung (Tùy Chọn)
Lặp lại các bước 4c-4e cho mỗi khu vực văn bản bạn cần đọc. Mỗi ROI có tên riêng trong danh sách Region of Interest. Đổi tên chúng thành tên mô tả (ví dụ: "Serial Number", "Date Code", "Part Label") bằng cách nhấp đúp vào tên.
Sử dụng copy-paste để nhân bản các ROI. Tên sẽ tự động tăng dần (ví dụ: "ROI", "ROI (1)", "ROI (2)").
Bước 5: Cấu Hình và Kiểm Tra OCR Block
5a. Điều Hướng Đến OCR Block
Nhấp vào tab OCR Block trong thanh tab Recipe Editor. Bạn sẽ thấy camera feed ở bên trái và bảng cài đặt ở bên phải.

Bảng bên phải hiển thị:
- Mô tả OPTICAL CHARACTER RECOGNITION
- Giải thích rằng đây là một mô hình được huấn luyện sẵn không yêu cầu dữ liệu huấn luyện
- Hướng dẫn sử dụng Live Preview hoặc Test để xác thực
5b. Bật Live Preview
Đánh dấu vào checkbox Live Preview Mode ở góc trên bên phải. Camera sẽ bắt đầu xử lý các khung hình theo thời gian thực.

Khi Live Preview đang hoạt động, bạn sẽ thấy:
- Processing Time: Thời gian mô hình OCR xử lý mỗi khung hình
- Latency: Tổng thời gian khứ hồi bao gồm chụp ảnh và hiển thị
- Khung bao màu tím xung quanh các vùng văn bản được phát hiện được phủ lên camera feed
- Văn bản được phát hiện được hiển thị dưới dạng nhãn trên mỗi khung bao
- Bảng tham số ở bên phải để tinh chỉnh cài đặt phát hiện
5c. Xác Minh OCR Đang Đọc Chính Xác
Khi Live Preview bật, đặt bộ phận của bạn dưới camera và xác minh:
- Tất cả các vùng văn bản có được phát hiện không? Bạn sẽ thấy các khung màu tím xung quanh mỗi từ/cụm từ trong ROI.
- Văn bản có được đọc chính xác không? Các nhãn phải khớp với văn bản thực tế trên bộ phận.
- Có phát hiện sai không? Có khu vực không phải văn bản nào bị xác định nhầm là văn bản không?
- Di chuyển bộ phận một chút. OCR có tiếp tục hoạt động ở các vị trí khác nhau không (điều này kiểm tra việc căn chỉnh)?
Nếu văn bản không được phát hiện hoặc bị đọc sai, hãy kiểm tra:
- Hướng ROI khớp với hướng văn bản (xem Bước 4d)
- ROI được đặt đúng vị trí trên văn bản
- Chất lượng hình ảnh tốt (lấy nét sắc nét, độ tương phản tốt, ánh sáng đều)
- Thử điều chỉnh các tham số OCR (xem phần tiếp theo)
Bước 6: Tinh Chỉnh Tham Số OCR
Khi Live Preview được bật, bảng bên phải hiển thị bốn tham số có thể tinh chỉnh. Các tham số này điều khiển giai đoạn phát hiện văn bản (tìm vị trí của văn bản), không phải giai đoạn nhận dạng (đọc nội dung văn bản).
| Tham số | Mặc định | Chức năng |
|---|---|---|
| Text Segmentation Threshold | 0.10 | Mức độ tự tin mà bộ phát hiện phải có rằng một vùng chứa văn bản. Giá trị cao hơn = phát hiện nghiêm ngặt hơn, ít kết quả dương tính giả hơn nhưng có thể bỏ sót văn bản mờ. Giá trị thấp hơn = nhạy hơn, bắt được văn bản mờ nhưng có thể có phát hiện sai. Phạm vi: 0.0 đến 1.0. |
| Unclip Ratio | 4.0 | Mức độ mở rộng các khung bao đã phát hiện ra ngoài từ đường viền văn bản. Giá trị cao hơn = khung lớn hơn. Tăng nếu các khung đang cắt vào các cạnh của ký tự lớn. Giảm nếu các từ gần nhau đang hợp nhất thành một khung. |
| Unclip Ceiling | 20 | Mở rộng tối đa tính bằng pixel từ unclipping. Điều này giới hạn sự tăng trưởng để các mở rộng tỷ lệ lớn trên văn bản lớn không tạo ra các khung khổng lồ. Tăng nếu văn bản lớn vẫn đang bị cắt ngay cả sau khi tăng Unclip Ratio. |
| Min Text Area | 500 | Diện tích tối thiểu (tính bằng pixel) cho một vùng văn bản được phát hiện. Bất cứ thứ gì nhỏ hơn sẽ bị loại bỏ như nhiễu. Tăng nếu các tạp chất nhỏ đang được phát hiện như văn bản. Giảm nếu văn bản nhỏ nhưng hợp lệ đang bị lọc ra. |
Bắt đầu với các giá trị mặc định. Chỉ điều chỉnh nếu bạn thấy các vấn đề cụ thể trong Live Preview:
| Vấn đề | Tham số cần điều chỉnh | Hướng |
|---|---|---|
| Khu vực không phải văn bản được phát hiện như văn bản | Text Segmentation Threshold | Tăng |
| Văn bản hợp lệ đang bị bỏ sót | Text Segmentation Threshold | Giảm |
| Khung bao cắt vào cạnh ký tự | Unclip Ratio | Tăng |
| Các từ gần nhau hợp nhất thành một khung | Unclip Ratio | Giảm |
| Khung phát triển quá lớn trên văn bản lớn | Unclip Ceiling | Giảm |
| Văn bản lớn vẫn bị cắt sau khi tăng Unclip Ratio | Unclip Ceiling | Tăng |
| Nhiễu/tạp chất được phát hiện như văn bản | Min Text Area | Tăng |
| Văn bản nhỏ hợp lệ bị lọc ra | Min Text Area | Giảm |
Các thay đổi tham số có hiệu lực ngay lập tức trong Live Preview, vì vậy bạn có thể tinh chỉnh lặp đi lặp lại. Các tham số này cũng áp dụng trong quá trình chụp sản xuất, không chỉ trong khi xem trước.
Bước 7: Kiểm Tra với Hình Ảnh Đã Chụp
Sau khi tinh chỉnh các tham số bằng Live Preview, hãy xác thực OCR trên một loạt các mẫu sản xuất.
7a. Sử Dụng Bảng Test
- Tắt chế độ Live Preview (bỏ chọn ô)
- Nhấp vào nút Test

- Nhấp vào Select From Library để chọn hình ảnh từ các lần kiểm tra đã chụp trước đó, hoặc nhấp Upload Captures để tải hình ảnh từ máy tính của bạn
- Kết quả kiểm tra hiển thị cho mỗi ROI:
- Detected Text (hiển thị ở định dạng monospace/code)
- Confidence (thẻ mã hóa màu: xanh lá trên 80%, cam trên 50%, đỏ dưới 50%)
- Detection Count (số vùng văn bản được tìm thấy)
7b. Những Điều Cần Lưu Ý
- Tính nhất quán: OCR có đọc cùng một văn bản mỗi lần cho cùng một bộ phận không?
- Độ chính xác: Các chuỗi được phát hiện có khớp với văn bản thực tế trên bộ phận không?
- Điểm confidence: Có liên tục trên 80% không? Confidence thấp thường cho thấy vấn đề về chất lượng hình ảnh.
- Trường hợp đặc biệt: Kiểm tra với các bộ phận có văn bản bị mờ, phai màu hoặc bị che khuất một phần.
Nếu điểm confidence liên tục dưới 80%, hãy xem lại cài đặt hình ảnh của bạn (Bước 2). Độ chính xác của OCR liên quan trực tiếp đến chất lượng hình ảnh. Không có sự tinh chỉnh tham số nào có thể bù đắp cho hình ảnh bị mờ hoặc thiếu sáng.
Bước 8: Thiết Lập Quy Tắc Pass/Fail (IO Logic)
Sau khi OCR phát hiện văn bản chính xác, bạn cần xác định điều gì cấu thành một pass hoặc fail. Điều hướng đến tab IO Logic.
Basic Mode
Basic Mode cung cấp giao diện dựa trên quy tắc đơn giản cho logic pass/fail của OCR. Không yêu cầu kiến thức về Node-RED.

Trang này hiển thị:
- Các tab Preview / Test ở bên trái (để trực quan hóa kết quả so với quy tắc của bạn)
- Phần OCR Rules ở bên phải
- Nút Save & Deploy để kích hoạt quy tắc
- Nút Advanced Mode để chuyển sang Node-RED
Tạo Quy Tắc
Nhấp vào + Add rule để tạo quy tắc pass/fail. Mỗi quy tắc có ba trường:

| Trường | Mô tả |
|---|---|
| ROIs | (Các) ROI cần đánh giá. Nhấp để mở rộng và chọn "All ROIs" hoặc chọn các vùng cụ thể. |
| Operator | Phép so sánh để thực hiện trên văn bản được phát hiện. |
| Text | Chuỗi văn bản dự kiến để so sánh. |
Các Operator Có Sẵn
Nhấp vào dropdown Operator để xem cả bốn tùy chọn:

| Operator | Hành vi | Ví dụ trường hợp sử dụng |
|---|---|---|
| = (equals) | Toàn bộ văn bản được phát hiện ghép lại phải khớp chính xác với văn bản dự kiến | Xác minh số sê-ri đọc chính xác là "SN-2025-0042" |
| != (not equals) | Văn bản ghép lại KHÔNG được khớp với văn bản dự kiến | Từ chối các bộ phận có mã lỗi đã biết |
| includes | Văn bản ghép lại phải chứa văn bản dự kiến như một chuỗi con | Kiểm tra rằng nhãn có chứa từ "SAFETY" ở đâu đó |
| not includes | Văn bản ghép lại KHÔNG được chứa văn bản dự kiến | Đảm bảo mã sản phẩm đã ngừng sử dụng không xuất hiện |
Cách So Sánh Text
Khi một ROI chứa nhiều vùng text được phát hiện (ví dụ: detector tìm thấy "LOT" và "2025" là các từ riêng biệt), tất cả các chuỗi text riêng lẻ được nối với nhau bằng dấu cách trước khi so sánh.
Vì vậy, nếu detector tìm thấy ba vùng text đọc được "LOT", "2025", và "A1", text đã nối sẽ trở thành "LOT 2025 A1". Quy tắc của bạn so sánh với toàn bộ chuỗi text đã nối này.
Điều này có nghĩa là:
- Một quy tắc equals cho
"LOT 2025 A1"sẽ pass - Một quy tắc includes cho
"2025"sẽ pass - Một quy tắc equals chỉ cho
"LOT"sẽ fail (vì text đã nối bao gồm nhiều hơn chỉ "LOT")
Nhiều Quy Tắc
Bạn có thể thêm nhiều quy tắc bằng cách nhấp vào + Add rule một lần nữa. Tất cả các quy tắc đều sử dụng AND logic: mỗi quy tắc phải pass thì kiểm tra OCR mới pass. Nếu bất kỳ quy tắc nào fail, toàn bộ kiểm tra sẽ fail.
Chọn ROI

Nhấp vào dropdown ROIs để chọn (các) vùng mà quy tắc sẽ áp dụng:
- All ROIs: Quy tắc đánh giá text từ tất cả các vùng OCR kết hợp
- Specific ROI: Mở rộng để chọn từng ROI theo tên (đây là lý do tại sao việc đặt tên các ROI một cách mô tả ở Bước 4f là quan trọng)
Lưu và Triển Khai
Sau khi cấu hình các quy tắc, nhấp vào Save & Deploy để kích hoạt chúng. Các quy tắc sẽ có hiệu lực ngay lập tức cho tất cả các kiểm tra trong tương lai.
Chế Độ Nâng Cao (Node-RED)
Đối với logic pass/fail phức tạp hơn mà Chế Độ Cơ Bản không thể xử lý, hãy chuyển sang Advanced Mode.
Nhấp vào nút Advanced Mode để xem hộp thoại xác nhận:

Hộp thoại giải thích:
- Advanced Mode sử dụng môi trường lập trình trực quan đầy đủ của Node-RED
- Mọi quy tắc Basic Mode sẽ bị vô hiệu hóa
- Bạn có thể chuyển trở lại Basic Mode bất kỳ lúc nào
Nhấp vào Switch to Advanced Mode (hoặc nếu bạn đã ở trong Advanced Mode, nút sẽ hiển thị Basic Mode).

Trong Advanced Mode, bạn sẽ thấy một canvas flow của Node-RED với các nodes được dựng sẵn bao gồm:
- All Block Outputs: Nhận kết quả từ tất cả các AI blocks (classification, segmentation, OCR, measurement)
- Check OCR (hoặc tương tự): Một function node chứa JavaScript đánh giá kết quả OCR
- Classification Block Logic / Format Data for PLC / Trigger: Các output nodes khác để tích hợp
- Inspection Pass/Fail: Quyết định pass/fail cuối cùng
- Save to Library: Lưu kết quả
OCR Output Payload trong Node-RED
Trong Advanced Mode, kết quả OCR có sẵn trong đối tượng msg.payload.ocr. Điều này cho phép bạn truy cập đầy đủ bằng lập trình tới mọi phát hiện:
{
"predictions": [
{
"roi_id": 1,
"roi_name": "Serial Number",
"center_x_global": 450,
"center_y_global": 220,
"angle_global": 90,
"search_area_id": 1,
"detections": [
{
"text": "SN-2025-0042",
"confidence": 0.95,
"roi_bbox": {
"x": 10,
"y": 5,
"width": 120,
"height": 30,
"angle": 0
},
"global_bbox": {
"x": 450,
"y": 220,
"width": 120,
"height": 30,
"angle": 90
}
}
]
}
]
}
| Trường | Mô tả |
|---|---|
| roi_id | ID dạng số của ROI đã tạo ra kết quả này |
| roi_name | Tên bạn đã đặt cho ROI (ví dụ: "Serial Number") |
| center_x_global / center_y_global | Vị trí trung tâm của ROI trong tọa độ toàn khung hình |
| angle_global | Góc xoay của ROI trong toàn khung hình |
| search_area_id | Loại kiểm tra / vùng tìm kiếm mà ROI này thuộc về |
| detections | Mảng các phát hiện text riêng lẻ được tìm thấy trong ROI này |
| detections[].text | Chuỗi text đã được nhận dạng |
| detections[].confidence | Độ tin cậy nhận dạng từ 0.0 đến 1.0 (đã giới hạn) |
| detections[].roi_bbox | Vị trí bounding box tương đối với gốc của ROI crop |
| detections[].global_bbox | Vị trí bounding box trong toàn khung hình của camera (tính đến góc xoay và căn chỉnh của ROI) |
Sử dụng msg.payload.ocr.predictions[0].detections.map(d => d.text).join(" ") để lấy cùng chuỗi text đã nối mà Basic Mode sử dụng để so sánh.
Với Advanced Mode, bạn có thể:
- Áp dụng các mẫu regex cho text đã phát hiện bằng JavaScript
- Lọc các phát hiện theo ngưỡng độ tin cậy
- Kết hợp kết quả OCR với kết quả classification/segmentation cho logic phức tạp
- Định dạng text OCR cho output PLC (ví dụ: gửi serial number đã phát hiện qua EtherNet/IP)
- Gửi tin nhắn tùy chỉnh đến Microsoft Teams hoặc email dựa trên nội dung OCR
Để có hướng dẫn chi tiết về Node-RED, xem Node-RED Basics.
Bạn có thể chuyển đổi giữa Basic và Advanced mode bất kỳ lúc nào bằng nút toggle ở phía trên cùng của trang IO Logic. Khi chuyển sang Basic Mode, mọi logic Node-RED đã triển khai sẽ bị vô hiệu hóa và được thay thế bằng các quy tắc Basic Mode. Khi chuyển trở lại, flow Node-RED sẽ được khôi phục.
Bước 9: Triển Khai Recipe
Sau khi thiết lập OCR hoàn tất và đã được kiểm tra:
- Quay lại Recipe Editor (nhấp vào Recipe Editor trong thanh bên trái)
- Nhấp vào nút Deploy Recipe màu tím ở góc dưới bên phải
- Recipe hiện đã hoạt động và đang chạy các lượt kiểm tra
Xem Kết Quả
HMI
Trang HMI hiển thị kết quả kiểm tra trực tiếp. Khi OCR đang hoạt động, bạn sẽ thấy:
- Hình ảnh trực tiếp từ camera với các khung bao màu tím xung quanh văn bản được phát hiện
- Nhãn văn bản hiển thị nội dung đã được đọc
- Trạng thái Pass/fail dựa trên các quy tắc IO Logic của bạn
- Thống kê đang chạy: tổng số lượt kiểm tra, số lượt đạt, số lượt không đạt, tỷ lệ phần trăm yield

Library
Điều hướng đến Library trong thanh bên trái để xem lại các kết quả đã lưu từ các lần chụp trước đó. Mỗi mục chụp sẽ hiển thị:
- Hình ảnh đã chụp kèm lớp phủ OCR
- Văn bản được phát hiện theo từng ROI
- Điểm số tin cậy (confidence)
- Kết quả pass/fail
Khắc Phục Sự Cố
Không phát hiện được văn bản
| Nguyên nhân có thể | Cách khắc phục |
|---|---|
| ROI không được đặt lên trên văn bản | Định vị lại ROI trong Inspection Setup |
| Hướng của ROI không khớp với hướng văn bản | Xoay ROI để căn chỉnh theo hướng văn bản (Bước 4d) |
| Văn bản quá nhỏ trong hình ảnh | Di chuyển camera lại gần hơn hoặc sử dụng ống kính có tiêu cự dài hơn |
| Văn bản quá nhỏ so với ROI | Thu hẹp ROI sát hơn quanh vùng văn bản |
| Min Text Area được đặt quá cao | Giảm tham số Min Text Area |
| Chiếu sáng kém / độ tương phản thấp | Cải thiện chiếu sáng để tối đa hóa độ tương phản giữa văn bản và nền |
| Văn bản bị mờ | Điều chỉnh tiêu cự trên ống kính C-mount và kiểm tra hệ thống lắp đặt camera có ổn định không |
| Chưa thiết lập alignment | Việc phát hiện văn bản yêu cầu alignment. Hãy thiết lập template alignment (Bước 3) |
Phát hiện sai văn bản (đọc nhầm)
| Nguyên nhân có thể | Cách khắc phục |
|---|---|
| Hướng của ROI không khớp với hướng văn bản | Đây là nguyên nhân hàng đầu. Xoay ROI để căn chỉnh theo hướng văn bản (Bước 4d) |
| Chất lượng hình ảnh thấp hoặc có nhiễu | Tăng exposure, giảm gain, cải thiện chiếu sáng |
| Text Segmentation Threshold quá thấp | Tăng giá trị này để lọc các phát hiện văn bản sai |
| Các vùng văn bản chồng lấn bị gộp thành một phát hiện | Giảm Unclip Ratio để tránh việc các khung bị gộp lại |
| Nhiều dòng văn bản trong một ROI | Tạo các ROI riêng biệt cho mỗi dòng nếu thứ tự đọc quan trọng |
Độ tin cậy OCR liên tục ở mức thấp
| Nguyên nhân có thể | Cách khắc phục |
|---|---|
| Độ đồng đều chiếu sáng kém | Đảm bảo độ chiếu sáng đồng đều trên toàn bộ vùng văn bản |
| Lóa hoặc phản chiếu trên văn bản (đặc biệt với nhãn bóng) | Điều chỉnh góc chiếu sáng để loại bỏ phản xạ gương. Cân nhắc sử dụng chiếu sáng khuếch tán. |
| Font chữ rất nhỏ hoặc cách điệu cao | Di chuyển camera lại gần hơn hoặc sử dụng ống kính có tiêu cự dài hơn để tăng kích thước văn bản trong hình ảnh |
| Văn bản bị hư hỏng, phai màu hoặc in thiếu | OCR chỉ có thể đọc những gì camera nhìn thấy. Nếu văn bản bị xuống cấp về mặt vật lý, độ chính xác sẽ thấp hơn. |
| Gain cao trong cài đặt hình ảnh | Giảm gain. Gain cao làm tăng nhiễu trông giống như các artifact của văn bản. |
Quy tắc Pass/fail không hoạt động như mong đợi
| Nguyên nhân có thể | Cách khắc phục |
|---|---|
| Văn bản được nối ghép khác với mong đợi | Bật Live Preview và kiểm tra chính xác văn bản nào đang được phát hiện. Lưu ý rằng nhiều phát hiện sẽ được nối với nhau bằng dấu cách. |
| Sử dụng "equals" trong khi "includes" sẽ phù hợp hơn | Nếu bạn chỉ quan tâm đến một chuỗi con, hãy dùng "includes" thay vì "equals" |
| Quy tắc chưa được triển khai | Nhấp vào Save & Deploy sau khi thay đổi quy tắc trong Basic Mode |
| Chọn sai ROI trong quy tắc | Kiểm tra dropdown ROIs trong quy tắc của bạn để đảm bảo nó nhắm đến đúng vùng |
Hạn Chế
- Tối đa 1 khối OCR mỗi recipe (bạn có thể có nhiều ROI trong khối đó)
- Chỉ tối ưu cho mô hình tiếng Anh: Mô hình được huấn luyện sẵn được tối ưu cho văn bản in dựa trên ký tự Latin. Chữ viết tay, chữ thảo, hoặc các chữ viết không phải Latin (tiếng Trung, Nhật, Hàn, Ả Rập) không được hỗ trợ.
- Không hỗ trợ regex hoặc pattern matching trong Basic Mode: Các quy tắc pass/fail sử dụng so sánh chuỗi đơn giản (equals, not equals, includes, not includes). Đối với các mẫu xác thực phức tạp (ví dụ: khớp "SN-####-####"), hãy sử dụng Advanced Mode (Node-RED) với regex JavaScript tùy chỉnh.
- Không có bộ ký tự có thể cấu hình bởi người dùng: Từ điển 480 ký tự của mô hình là cố định. Bạn không thể giới hạn nhận diện chỉ ở các chữ số, chẳng hạn. Hãy sử dụng các quy tắc pass/fail để xác thực định dạng mong đợi.
- Không đảm bảo thứ tự văn bản: Khi nhiều vùng văn bản được phát hiện trong một ROI, chúng sẽ được nối theo thứ tự phát hiện (theo contour), không nhất thiết theo thứ tự đọc (trái sang phải, trên xuống dưới). Nếu thứ tự đọc quan trọng, hãy sử dụng các ROI riêng biệt cho từng dòng văn bản.
- Chỉ sử dụng mô hình được huấn luyện sẵn: Không giống như classification và segmentation, mô hình OCR không thể được huấn luyện lại hoặc tinh chỉnh trên các font chữ hoặc kiểu văn bản cụ thể của bạn. Nó sử dụng mô hình OCR được huấn luyện sẵn tích hợp.
Xem Thêm
- Tạo Inspection Đầu Tiên - Hướng dẫn đầy đủ về tạo recipe
- Image Settings - Hướng dẫn thiết lập hình ảnh chi tiết
- Alignment - Tìm hiểu sâu về căn chỉnh template
- Regions of Interest (ROIs) - Kích thước và chiến lược ROI
- Thiết Lập Inspection và Các Loại ROI - Tham khảo các loại ROI
- Node-RED Cơ Bản - Lập trình logic IO nâng cao
- Nguyên Tắc Cơ Bản Về Thiết Lập Hình Ảnh - Lý thuyết về ánh sáng và chất lượng hình ảnh