AI-POWERED DOCS
What do you want to know?
Bước 4: Huấn Luyện Mô Hình AI
Các regions of interest (ROI) của bạn đã được thiết lập. Giờ là lúc dạy AI nhận biết thế nào là "tốt" và "xấu".
Ba quy tắc vàng khi huấn luyện
Trước hết, hãy ghi nhớ ba quy tắc này. Chúng áp dụng cho dù bạn đang huấn luyện classifier hay segmenter, với 5 hình ảnh hay 500.
Quy tắc 1: Gán nhãn chỉ dựa trên hình ảnh
Không bao giờ nhìn vào bộ phận thực tế (hoặc đặt nó dưới kính hiển vi) để quyết định nó tốt hay xấu. Nếu bạn không thể nhìn thấy lỗi trong hình ảnh camera, AI không thể học nó.
AI không phải là phép màu. Nó chỉ có thể làm việc với những gì camera nhìn thấy. Nếu bạn gán nhãn một bộ phận là "lỗi" dựa trên điều bạn nhận thấy khi chạm vào nó hoặc phóng to dưới kính lúp, nhưng hình ảnh camera trông ổn, bạn đang dạy AI nhìn thấy thứ không tồn tại.
Nếu bạn không thể gán nhãn chỉ từ hình ảnh, hãy quay lại bước Install và sửa thiết lập vật lý: ống kính tốt hơn, ánh sáng tốt hơn, lắp đặt gần hơn, góc khác.
Quy tắc 2: Kiểm tra nhãn hai và ba lần
Gán nhãn sai xảy ra với tất cả mọi người; ngay cả các kỹ sư có kinh nghiệm cũng mắc phải. Nhưng một nhãn sai trong tập dữ liệu nhỏ có thể phá hủy kết quả của bạn.
Với 5 hình ảnh huấn luyện, một nhãn sai làm hỏng 20% dữ liệu huấn luyện của bạn. Điều đó thật thảm họa.
Trước mỗi lần huấn luyện: Nhấp vào View All ROIs và xác minh từng chú thích. Đây là điều dễ sửa nhất và có tác động lớn nhất.
Quy tắc 3: Bắt đầu nhỏ, lặp lại nhanh
Đừng gán nhãn 50 hình ảnh rồi nhấn train. Thay vào đó, hãy tạo một vòng lặp chặt chẽ: Gán nhãn 10-15 hình ảnh mỗi lớp, huấn luyện (khoảng 30 giây), kiểm tra và cố gắng phá vỡ nó, sau đó thêm dữ liệu có mục tiêu vào nơi nó thất bại. Lặp lại chu trình này 2-4 lần.
Vòng lặp này là con đường nhanh nhất để có một mô hình tốt.
Quy trình huấn luyện từng bước
1. Chụp hình ảnh huấn luyện ban đầu
Với recipe của bạn đang hoạt động và các bộ phận đang chạy (hoặc đặt thủ công), hãy chụp hình ảnh. Bạn cần tối thiểu 10-15 hình ảnh mỗi lớp để bắt đầu.
Đối với kiểm tra pass/fail đơn giản:
- 10-15 hình ảnh của các bộ phận tốt
- 10-15 hình ảnh của các bộ phận lỗi
2. Xác định các lớp của bạn
Chọn loại mô hình bạn đang huấn luyện, sau đó đọc hướng dẫn tương ứng. Toggle bên dưới được đồng bộ giữa Bước 2 và Bước 3, và lựa chọn của bạn được lưu trong URL để nó tồn tại qua việc làm mới hoặc chia sẻ.
- Classifier
- Segmenter
Trong giao diện gán nhãn, hãy thêm các lớp mà mỗi loại kiểm tra cần. Các tập lớp classifier phổ biến:
- Pass / Fail
- Present / Absent
- Good / Scratched / Cracked
Hãy giữ đơn giản lúc đầu. Bạn luôn có thể thêm các lớp sau.
Trong giao diện gán nhãn, hãy thêm các lớp cho các lỗi (hoặc đặc điểm) bạn muốn AI mask. Các tập lớp segmenter phổ biến:
- Defect / Background
- Scratch / Crack / Stain
- Foreground / Background
Hãy giữ danh sách lớp ngắn lúc đầu. Mỗi lớp cần màu cọ riêng và các ví dụ được gán nhãn riêng, vì vậy thêm nhiều lớp ngay từ đầu sẽ nhân lên công việc gán nhãn của bạn.
3. Gán nhãn hình ảnh
- Classifier
- Segmenter

Mỗi ROI có class phân loại riêng — chọn class mô tả ROI đó trong hình ảnh đó (ví dụ: "pass" hoặc "fail").
Nếu bạn không chắc nên sử dụng classification hay segmentation, hãy bắt đầu với classification. Nó nhanh hơn nhiều khi gán nhãn và phù hợp với hầu hết các tình huống pass/fail. Xem Classifier vs. Segmenter để được hướng dẫn.

Đối với mỗi ROI trong mỗi hình ảnh, sử dụng công cụ cọ vẽ để tô các vùng bị lỗi từng pixel một. Các vùng được tô là những gì AI học để phát hiện — bất cứ thứ gì bạn không tô đều được coi là nền.
Nhãn Segmenter yêu cầu thao tác cọ vẽ ở cấp độ pixel, chậm hơn so với việc chọn từ menu thả xuống của classifier nhưng mang lại cho bạn bản đồ lỗi chính xác với vị trí và hình dạng. Bắt đầu với một tập hợp nhỏ các lỗi được xác định rõ ràng, và chỉ thêm các class khác khi mô hình đầu tiên của bạn hoạt động tốt.
4. Huấn luyện mô hình
- Classifier
- Segmenter
Nhấp vào Train. Classifier cung cấp hai chế độ huấn luyện:
- Fast mode — khoảng 30 giây đến một phút. Phù hợp nhất cho việc lặp lại nhanh trong quá trình thiết lập, kiểm tra nhanh các nhãn của bạn, và các bộ phận dễ/được phân tách rõ. Độ chính xác thấp hơn so với production mode nhưng cho phép bạn nhìn thấy tín hiệu nhanh chóng.
- Production mode — mất nhiều thời gian hơn nhưng tạo ra một mô hình chính xác hơn đáng kể. Luôn sử dụng Production mode trước khi triển khai lên dây chuyền sản xuất. Đối với các bộ phận khó, các lỗi khó phân biệt, hoặc bất cứ thứ gì bạn sẽ tin tưởng trong sản xuất, Production mode là lựa chọn đúng đắn.
Một nhịp độ tốt: lặp lại trong Fast mode khi bạn đang làm sạch các nhãn và thêm dữ liệu, sau đó chạy Production khi kết quả trông tốt — và một lần nữa trước khi triển khai.
Nhấp vào Train. Segmentation chỉ có một chế độ huấn luyện — Production — vì các mask ở cấp độ pixel cần lượt huấn luyện kỹ lưỡng hơn để đáng tin cậy. Thời gian huấn luyện tỷ lệ với số lượng hình ảnh và số lượng ROI bạn đã gán nhãn, vì vậy một tập hợp ban đầu nhỏ (10-15 hình ảnh mỗi class) sẽ huấn luyện trong vài phút; các tập dữ liệu lớn hơn sẽ mất nhiều thời gian hơn.
Không có tùy chọn "fast" để kiểm tra nhanh ở đây, vì vậy hãy đảm bảo các nhãn của bạn sạch sẽ trước khi huấn luyện (sử dụng View All ROIs để xem lại mọi mask).
5. Kiểm tra với Live Preview
Nhấp vào Live Preview Mode và chạy các bộ phận qua. Quan sát kết quả:
- Nó có xử lý đúng các trường hợp dễ không?
- Nó gặp khó khăn ở đâu?
- Các trường hợp ranh giới là gì?
Hãy thử làm cho nó thất bại. Tìm những trường hợp mà nó thất bại. Những thất bại này là lộ trình của bạn để cải thiện.
- Classifier
- Segmenter

Bảng Test hiển thị class dự đoán và confidence score cho mỗi ROI. Chạy qua một vài lần chụp và tìm các kết quả phán định có độ tin cậy thấp (thường dưới 70%) — đó là các trường hợp ranh giới của bạn và là các bộ phận đáng để gán nhãn tiếp theo nhất.

Live Preview phủ mask lỗi dự đoán trực tiếp lên hình ảnh. Hãy chú ý đến các mask quá nhỏ, quá lớn, hoặc xuất hiện ở nơi không có lỗi thực sự — đó là các kiểu thất bại mà bạn sẽ nhắm tới với vòng dữ liệu được gán nhãn tiếp theo.
6. Thêm dữ liệu có mục tiêu
Đừng thêm hình ảnh mới một cách ngẫu nhiên. Thêm hình ảnh nhắm cụ thể vào các chế độ lỗi bạn đã tìm thấy:
- Nếu mô hình nhầm lẫn vết xước với phản chiếu, thêm nhiều ví dụ cho cả hai
- Nếu mô hình bỏ sót các lỗi nhỏ, thêm nhiều hình ảnh về các lỗi nhỏ
- Nếu mô hình thất bại ở các bộ phận nằm trong góc, thêm nhiều ví dụ ở góc
7. Huấn luyện lại và kiểm tra lại
Lặp lại các bước 4-6 từ hai đến bốn lần. Mỗi lần lặp sẽ cải thiện độ chính xác. Để xem hướng dẫn chi tiết hơn — bao gồm cách thêm hình ảnh mới vào mô hình hiện có mà không làm mất quá trình huấn luyện trước đó — xem Thêm Dữ Liệu & Huấn Luyện Lại.
Augmentations: dạy AI xử lý sự biến đổi
Augmentations điều chỉnh ngẫu nhiên hình ảnh huấn luyện của bạn trong quá trình huấn luyện — điều chỉnh độ sáng, thêm xoay, tinh chỉnh độ tương phản, v.v. Mỗi hình ảnh được đưa vào AI hàng trăm lần với các augmentation khác nhau một chút, nhưng nhãn vẫn giữ nguyên. Đây là cách bạn làm cho một mô hình trở nên bền vững với các điều kiện thực tế mà không cần phải chụp một ví dụ cho mọi biến đổi có thể xảy ra.
Những gì nên bật theo mặc định
Một lượng nhỏ biến đổi brightness (độ sáng) hầu như luôn đáng để bật — ngay cả nhà máy được kiểm soát chặt chẽ nhất cũng có đèn trần nhấp nháy, bóng đổ thay đổi theo ca làm việc, và LED dịch chuyển nhẹ theo thời gian. Augmentation độ sáng làm cho mô hình bền vững với tất cả những điều đó về cơ bản là miễn phí.
Rotation: hữu ích, nhưng hãy chú ý đến hình dạng ROI
Augmentation xoay rất tuyệt nếu các bộ phận của bạn thực sự có thể đến ở các góc khác nhau (vít lỏng trên băng chuyền, các bộ phận được đặt bằng tay, bất cứ thứ gì không được giữ trong đồ gá). Nhưng nó tương tác với hình dạng ROI:
- ROI vuông: augmentation xoay hoạt động sạch sẽ — hình ảnh đã xoay vẫn nằm gọn bên trong khung ROI.
- ROI không vuông trên classifier: việc xoay có thể cắt xén hình ảnh. Khi một ROI cao và hẹp được xoay 45°, các góc của nội dung đã xoay rơi ra ngoài khung và mô hình huấn luyện trên một phần hình ảnh. Nếu bộ phận của bạn có thể xoay, hãy làm cho ROI vuông hoặc dựa vào Aligner để xử lý việc xoay từ trước để bạn không cần augmentation xoay ở đây.
- Segmenter: cùng một mối lo về cắt xén áp dụng, nhưng segmentation ít nhạy cảm hơn vì nó học từ mask pixel thay vì toàn bộ hình dạng ROI.
Khi nào KHÔNG nên sử dụng một augmentation cụ thể
Quy tắc chung: đừng augment thuộc tính mà bạn đang kiểm tra. Nếu bạn đang cố phát hiện hướng, augmentation xoay sẽ dạy mô hình rằng các bộ phận lộn ngược vẫn là "tốt."
- Kiểm tra tính nhất quán của màu sắc? Đừng sử dụng augmentation saturation.
- Kiểm tra độ mờ/tiêu cự? Đừng sử dụng augmentation motion blur.
- Kiểm tra hướng? Đừng sử dụng augmentation rotation (và có lẽ cũng đừng sử dụng Aligner).
Tính đa dạng của dữ liệu rất quan trọng
Dữ liệu huấn luyện của bạn nên đại diện cho toàn bộ phạm vi những gì AI sẽ thấy trong sản xuất:
- Các thời điểm khác nhau trong ngày (nếu ánh sáng thay đổi)
- Các lô bộ phận khác nhau (bề mặt hoàn thiện có thể khác nhau một chút)
- Các bộ phận ở các vị trí khác nhau trong khung hình
- Cả các trường hợp dễ và khó
Tập trung vào các trường hợp khó nhất. Nếu dữ liệu huấn luyện của bạn bao gồm 10 bộ phận khó phân loại nhất, thì 90% các bộ phận dễ sẽ là chuyện nhỏ đối với AI.
Khả năng học cao
AI của camera OV được thiết kế để liên tục cải thiện khi có thêm dữ liệu. Không giống như nhiều hệ thống AI bị chững lại sau 20 hình ảnh, mô hình này tiếp tục cải thiện với 50, 100, thậm chí hơn 500 hình ảnh. Hầu hết các kiểm tra hoạt động tốt với 5-10 hình ảnh, nhưng nếu bạn có vấn đề phức tạp với nhiều loại lỗi, đừng ngần ngại tiếp tục thêm dữ liệu.
Tăng tốc với dữ liệu tổng hợp: Defect Studio
Nếu bạn cần huấn luyện cho một loại lỗi hiếm gặp thì sao? Một con vít bị thiếu mà bạn phải cố ý tháo ra, một vết xước bạn phải tạo ra, một vết nứt chỉ xảy ra một lần trên một nghìn bộ phận? Chờ đợi hàng tháng để thu thập đủ ví dụ là không khả thi.
OV Auto-Defect Creator Studio tại tools.overview.ai giải quyết vấn đề này. Nó tạo ra các hình ảnh lỗi tổng hợp chân thực như ảnh thật, nhanh hơn tới 10.000 lần so với việc chờ đợi các lỗi thực tế xuất hiện trên dây chuyền sản xuất.
Cách hoạt động: 5 bước đơn giản
- Tải lên một hình ảnh tốt của bộ phận
- Đánh dấu khu vực mà lỗi sẽ xuất hiện
- Mô tả lỗi bằng tiếng Anh đơn giản (ví dụ: "deep scratch across the surface" hoặc "missing solder joint")
- Tạo các biến thể lỗi (AI tạo ra kết quả chân thực như ảnh thật)
- Xuất các hình ảnh tổng hợp trực tiếp vào bộ huấn luyện của bạn
Tại sao dữ liệu tổng hợp hoạt động
Các hình ảnh được tạo ra không chỉ là các tạo phẩm "dán lên". Chúng là các biến thể chân thực phù hợp với ánh sáng thực tế, góc camera và bề mặt bộ phận của bạn. AI hiểu được vật lý về cách các lỗi xuất hiện dưới điều kiện chụp ảnh cụ thể của bạn.
Trường hợp sử dụng:
- Lỗi hiếm gặp: Huấn luyện cho các chế độ lỗi mà bạn chưa bao giờ (hoặc hiếm khi) thấy
- Ra mắt sản phẩm mới: Xây dựng quy trình kiểm tra trước khi bộ phận lỗi đầu tiên rời khỏi dây chuyền
- Trường hợp biên: Tạo các ví dụ ranh giới để cải thiện ranh giới quyết định của AI
- Tăng cường dữ liệu: Bổ sung các bộ dữ liệu nhỏ với sự đa dạng tổng hợp
Xem thực tế
Cách tiếp cận tốt nhất: huấn luyện với 3-5 hình ảnh thực ban đầu trước, xác định nơi AI gặp khó khăn, sau đó sử dụng Defect Studio để tạo các ví dụ tổng hợp có mục tiêu cho các chế độ lỗi cụ thể đó. Dữ liệu thực dạy đường cơ sở; dữ liệu tổng hợp lấp đầy các khoảng trống.
Danh sách kiểm tra huấn luyện
Trước khi tiếp tục, hãy xác nhận:
- Đã chụp các hình ảnh ban đầu, tối thiểu 10-15 mỗi lớp
- Tất cả nhãn đã được kiểm tra lại (View All ROIs)
- Đã huấn luyện và kiểm tra với Live Preview
- Đã xác định các chế độ lỗi và thêm dữ liệu có mục tiêu
- Đã hoàn thành 2-4 lần lặp lại gán nhãn → huấn luyện → kiểm tra
- Kết quả đáp ứng kỳ vọng
Mô hình đã được huấn luyện và trông tốt? Chuyển sang Bước 5: Thiết Lập Đầu Ra.