AI-POWERED DOCS

What do you want to know?

Bước 4: Huấn Luyện Mô Hình AI

Các vùng quan tâm (ROI) của bạn đã được thiết lập. Giờ là lúc dạy AI hiểu thế nào là "tốt" và "xấu".

Ba quy tắc vàng khi huấn luyện

Trước khi bắt đầu bất cứ điều gì, hãy ghi nhớ ba quy tắc này. Chúng áp dụng dù bạn đang huấn luyện classifier hay segmenter, với 5 hình ảnh hay 500 hình ảnh.

Quy tắc 1: Gán nhãn chỉ dựa trên hình ảnh

Không bao giờ nhìn vào bộ phận thực tế (hoặc đặt nó dưới kính hiển vi) để quyết định nó tốt hay xấu. Nếu bạn không thể nhìn thấy lỗi trong hình ảnh camera, AI cũng không thể học được.

AI không phải là phép thuật. Nó chỉ có thể làm việc với những gì camera nhìn thấy. Nếu bạn gán nhãn một bộ phận là "lỗi" dựa trên những gì bạn nhận thấy khi chạm vào hoặc phóng to dưới kính lúp, nhưng hình ảnh camera trông vẫn ổn, bạn đang dạy AI nhìn thấy thứ không tồn tại.

Nếu bạn không thể gán nhãn chỉ từ hình ảnh, hãy quay lại bước Install và sửa lại thiết lập vật lý: ống kính tốt hơn, ánh sáng tốt hơn, lắp đặt gần hơn, góc nhìn khác.

Quy tắc 2: Kiểm tra nhãn của bạn hai và ba lần

Việc gán nhãn sai xảy ra với tất cả mọi người; các kỹ sư giàu kinh nghiệm cũng vậy. Nhưng một nhãn sai trong một tập dữ liệu nhỏ có thể phá hủy kết quả của bạn.

Với 5 hình ảnh huấn luyện, một nhãn sai làm hỏng 20% dữ liệu huấn luyện của bạn. Điều đó là thảm họa.

Trước mỗi lần huấn luyện: Nhấp vào View All ROIs và xác minh từng chú thích một. Đây là việc dễ sửa nhất và mang lại tác động lớn nhất.

Quy tắc 3: Bắt đầu nhỏ, lặp lại nhanh

Đừng gán nhãn 50 hình ảnh rồi nhấn train. Thay vào đó, hãy tạo một vòng lặp chặt chẽ: Gán nhãn 10-15 hình ảnh cho mỗi class, train (khoảng 30 giây), kiểm tra và cố gắng phá vỡ nó, sau đó bổ sung dữ liệu có mục tiêu tại những nơi nó thất bại. Lặp lại chu trình này 2-4 lần.

Vòng lặp này là con đường nhanh nhất để có một mô hình tốt.

Quy trình huấn luyện từng bước

Bạn đang sử dụng phiên bản giao diện nào?

Giao diện web OV20i đã được thiết kế lại trong v2026.5. Kiểm tra phiên bản phần mềm của bạn ở góc trên bên phải của giao diện camera và chọn tab tương ứng. Lựa chọn của bạn sẽ được áp dụng xuyên suốt mọi trang trong quy trình thiết lập này.

Older versions
v2026.5 and newer

Làm theo các bước được đánh số dưới đây để chụp, gán nhãn, huấn luyện và lặp lại.

1. Chụp hình ảnh huấn luyện ban đầu

Với recipe đang hoạt động và các bộ phận đang chạy qua (hoặc được đặt thủ công), hãy chụp hình ảnh. Bạn cần tối thiểu 10-15 hình ảnh cho mỗi class để bắt đầu.

Đối với một kiểm tra pass/fail đơn giản:

10-15 hình ảnh các bộ phận tốt
10-15 hình ảnh các bộ phận lỗi

2. Xác định các class của bạn

Chọn loại mô hình bạn đang huấn luyện, sau đó đọc các hướng dẫn tương ứng. Nút chuyển đổi bên dưới sẽ đồng bộ giữa Bước 2 và Bước 3, và lựa chọn của bạn được lưu trong URL để vẫn được giữ lại khi làm mới trang hoặc chia sẻ.

Classifier
Segmenter

Trong giao diện gán nhãn, thêm các class mà mỗi loại kiểm tra cần. Các bộ class classifier phổ biến:

Pass / Fail
Present / Absent
Good / Scratched / Cracked

Hãy giữ đơn giản lúc đầu. Bạn luôn có thể thêm class sau.

3. Gán nhãn hình ảnh

Classifier
Segmenter

Gán nhãn Classifier: chọn một lớp cho mỗi ROI từ menu thả xuống

Mỗi ROI có lớp phân loại riêng, hãy chọn lớp mô tả ROI đó trong hình ảnh đó (ví dụ: "pass" hoặc "fail").

Phân loại (Classification) nhanh hơn để gán nhãn

Nếu bạn không chắc nên sử dụng classification hay segmentation, hãy bắt đầu với classification. Nó nhanh hơn nhiều để gán nhãn và phù hợp với hầu hết các kịch bản pass/fail. Xem Classifier vs. Segmenter để được hướng dẫn.

4. Huấn luyện model

Classifier
Segmenter

Nhấp vào Train. Classifier cung cấp hai chế độ huấn luyện:

Fast mode, khoảng 30 giây đến một phút. Phù hợp nhất cho việc lặp nhanh trong quá trình thiết lập, kiểm tra nhanh các nhãn của bạn, và các bộ phận dễ/được phân tách rõ ràng. Độ chính xác thấp hơn so với production mode nhưng cho phép bạn nhanh chóng thấy được tín hiệu.
Production mode, mất nhiều thời gian hơn nhưng tạo ra một model chính xác hơn đáng kể. Luôn sử dụng Production mode trước khi triển khai lên dây chuyền. Đối với các bộ phận phức tạp, các lỗi khó phân biệt, hoặc bất cứ điều gì bạn sẽ tin cậy trong sản xuất, Production mode là lựa chọn đúng đắn.

Một nhịp độ tốt: lặp lại trong Fast mode trong khi bạn đang dọn dẹp nhãn và thêm dữ liệu, sau đó chạy Production khi kết quả trông tốt, và lại chạy một lần nữa trước khi triển khai.

5. Kiểm Tra với Live Preview

Nhấp vào Live Preview Mode và cho các bộ phận chạy qua. Quan sát kết quả:

Mô hình có xử lý đúng các trường hợp dễ không?
Mô hình gặp khó khăn ở đâu?
Các trường hợp ranh giới là gì?

Hãy thử làm cho mô hình thất bại. Tìm các trường hợp mà mô hình không xử lý được. Những thất bại này là lộ trình để cải thiện.

Classifier
Segmenter

Classifier live preview: per-ROI verdicts and confidence scores

Bảng Test hiển thị class dự đoán và confidence score cho từng ROI. Chạy thử một vài lần chụp và tìm các phán quyết có độ tin cậy thấp (thường dưới 70%), đó là các trường hợp ranh giới và là các bộ phận đáng được gán nhãn tiếp theo nhất.

6. Thêm dữ liệu có mục tiêu

Đừng thêm hình ảnh mới một cách ngẫu nhiên. Thêm hình ảnh nhắm cụ thể vào các chế độ thất bại mà bạn đã tìm thấy:

Nếu mô hình nhầm lẫn vết xước với phản chiếu, hãy thêm nhiều ví dụ về cả hai
Nếu mô hình bỏ sót các lỗi nhỏ, hãy thêm nhiều hình ảnh về các lỗi nhỏ
Nếu mô hình thất bại trên các bộ phận ở góc, hãy thêm nhiều ví dụ về góc

7. Huấn luyện lại và kiểm tra lại

Lặp lại các bước 4-6 từ hai đến bốn lần. Mỗi lần lặp sẽ cải thiện độ chính xác. Để có hướng dẫn chi tiết hơn, bao gồm cách thêm hình ảnh mới vào một mô hình hiện có mà không mất đi quá trình huấn luyện trước đó, hãy xem Thêm Dữ Liệu & Huấn Luyện Lại.

Mô hình mà bạn đã chọn khi tạo recipe sẽ có bước riêng của nó: Step 4: Classification cho classifier, hoặc Step 4: Segmentation cho segmenter. Các class của bạn đã được định nghĩa từ trước trong bước Region of Interest (ROIs), vì vậy bước này là nơi bạn chụp ảnh, gán nhãn, huấn luyện và kiểm tra. Cả hai đều có chung sáu tab phụ ở phía trên. Chọn loại mô hình của bạn:

Classifier
Segmenter

Giới Thiệu Về Classification

Một cẩm nang ngắn để có được mô hình chính xác. Nó trình bày vòng lặp iterate-to-accuracy (huấn luyện nhanh, tìm điểm yếu trong Live Preview, thêm dữ liệu có mục tiêu, huấn luyện lại, sau đó nâng cấp lên mô hình Production có độ chính xác cao) và các phương pháp hay nhất cho từng class quan trọng nhất: cân bằng các class, giữ tỷ lệ tín hiệu trên nhiễu cao, và bao phủ các trường hợp cực đoan của những gì bạn muốn phát hiện. Để có giải thích sâu hơn về cách classifier biến mỗi ROI thành một phán quyết, hãy đọc Tìm Hiểu Về Classifier.

About Classification best-practices tab

Capture & Label

Xây dựng bộ dữ liệu của bạn tại đây. Sử dụng Capture to Label để chụp khung hình từ camera trực tiếp, hoặc Import to Label để nhập các hình ảnh đã lưu. Các điều khiển Navigation (Previous, Next, Search by Capture ID, và tổng số lần chụp) giúp bạn di chuyển qua bộ dữ liệu. Đối với mỗi lần chụp, hãy gán mọi ROI vào một trong các class của nó. Số lượng theo từng class (ví dụ: Pass 17 / Fail 16) cho biết nhanh chóng mức độ cân bằng của bộ dữ liệu, và Manage classes sẽ chuyển đến nơi các class được định nghĩa.

Capture & Label tab with per-class counts

Review Labeling

Hiển thị mọi ROI crop đã được gán nhãn trong một lưới duy nhất, mỗi crop được gắn thẻ với class của nó, để bạn có thể quét tìm các nhãn sai một cách nhanh chóng. Sử dụng Filters và Select all để xử lý chúng hàng loạt. Đây là nơi thói quen "kiểm tra mọi nhãn trước khi huấn luyện" tồn tại trong v2026.5.

Lưới Review Labeling

Train

Chọn một preset và bắt đầu huấn luyện trên tập dữ liệu đã gán nhãn của bạn:

Development chạy trong khoảng 30 giây. Độ chính xác thấp hơn, nhưng đây là vòng lặp nhanh bạn sử dụng khi đang làm sạch nhãn và thêm dữ liệu.
Production mất 8 đến 15 phút. Đây là mô hình có độ chính xác cao mà bạn triển khai lên dây chuyền.

Advanced Settings mở các tùy chọn augmentation (brightness, contrast, hue, rotation, flip, Planckian, Gaussian noise, motion blur) và các tham số huấn luyện. Xem Augmentations bên dưới để biết khi nào nên sử dụng từng tùy chọn. Retrain chạy lại quá trình huấn luyện sau khi bạn thêm dữ liệu, và thời gian huấn luyện gần nhất được hiển thị bên cạnh nó.

Tab Train với các preset Development và Production

Advanced Settings: các augmentation và tham số huấn luyện

Live Preview

Chạy mô hình đã được huấn luyện trên luồng trực tiếp theo thời gian thực. Hiển thị class được dự đoán của mỗi ROI cùng với độ tin cậy của việc căn chỉnh và góc khớp, đồng thời phân tích thời gian xử lý theo từng khối (classification, ROIs, template và alignment) để bạn có thể thấy thời gian chu kỳ được sử dụng vào đâu. Cho các bộ phận chạy qua và tìm các phán đoán có độ tin cậy thấp; những bộ phận ranh giới đó là những cái đáng để gán nhãn tiếp theo.

Classification Live Preview với thời gian theo từng khối

Test

Chạy lại mô hình đã được huấn luyện trên một tập cố định gồm các capture đã lưu (Select From Library hoặc Upload Captures) để bạn có thể kiểm tra tính hợp lý trên các bộ phận khó mà không cần đợi chúng đến dây chuyền. Bật/tắt Bounding Boxes, Labels, và Heatmap để xem mô hình đang quyết định như thế nào.

Tab Test Classification Model

About Segmentation

Cùng một quy trình lặp-để-đạt-độ-chính-xác như classifier, với các thực hành tốt nhất dành riêng cho mask: vẽ mask sạch, ưu tiên một chút chồng lấn ở rìa của lỗi hơn là để khoảng trống, và bao phủ toàn bộ phạm vi kích thước và kết cấu lỗi mà bạn kỳ vọng. Để hiểu sâu hơn về cách một segmenter tạo ra các mask pixel, đếm và đo lường, hãy đọc Understanding the Segmenter.

Tab thực hành tốt nhất About Segmentation