AI-POWERED DOCS
What do you want to know?
Bước 4: Huấn Luyện Mô Hình AI Của Bạn
Các vùng kiểm tra của bạn đã được thiết lập. Giờ là lúc dạy cho AI biết thế nào là "tốt" và "xấu".
Ba quy tắc vàng trong huấn luyện
Trước hết, hãy ghi nhớ ba quy tắc này. Chúng áp dụng dù bạn đang huấn luyện classifier hay segmenter, với 5 hình ảnh hay 500 hình ảnh.
Quy tắc 1: Gán nhãn chỉ dựa trên hình ảnh
Không bao giờ nhìn vào bộ phận thực tế (hoặc đặt nó dưới kính hiển vi) để quyết định nó tốt hay xấu. Nếu bạn không thể thấy lỗi trong hình ảnh camera, AI không thể học được nó.
AI không phải phép thuật. Nó chỉ có thể làm việc với những gì camera nhìn thấy. Nếu bạn gán nhãn một bộ phận là "lỗi" dựa trên điều gì đó bạn nhận thấy khi chạm vào hoặc phóng to dưới kính lúp, nhưng hình ảnh camera trông bình thường, bạn đang dạy AI nhìn thấy thứ không tồn tại.
Nếu bạn không thể gán nhãn chỉ từ hình ảnh, hãy quay lại bước Install và khắc phục thiết lập vật lý: ống kính tốt hơn, ánh sáng tốt hơn, lắp đặt gần hơn, góc khác.
Quy tắc 2: Kiểm tra nhãn hai ba lần
Gán nhãn sai có thể xảy ra với bất kỳ ai; ngay cả các kỹ sư có kinh nghiệm cũng mắc phải. Nhưng một nhãn sai trong tập dữ liệu nhỏ có thể phá hủy kết quả của bạn.
Với 5 hình ảnh huấn luyện, một nhãn sai làm hỏng 20% dữ liệu huấn luyện của bạn. Đó là thảm họa.
Trước mỗi lần chạy huấn luyện: Nhấp vào View All ROIs và xác minh từng chú thích. Đây là điều dễ khắc phục nhất và có tác động lớn nhất.
Quy tắc 3: Bắt đầu nhỏ, lặp lại nhanh
Đừng gán nhãn 50 hình ảnh rồi nhấn train. Thay vào đó, tạo một vòng lặp chặt chẽ: Gán nhãn 3-5 hình ảnh cho mỗi class, huấn luyện ở development mode (khoảng 30 giây), kiểm tra và cố gắng phá vỡ nó, sau đó thêm dữ liệu có mục tiêu vào nơi nó thất bại. Lặp lại chu kỳ này 2-4 lần ở development mode, sau đó chuyển sang production mode.
Vòng lặp này là con đường nhanh nhất để có mô hình tốt. Chạy nó 2-4 lần ở development mode, sau đó chuyển sang production mode.
Quy trình huấn luyện từng bước
1. Chụp hình ảnh huấn luyện ban đầu
Với recipe của bạn đang hoạt động và các bộ phận đang di chuyển (hoặc được đặt thủ công), chụp hình ảnh. Bạn cần tối thiểu 3-5 hình ảnh cho mỗi class để bắt đầu.
Đối với kiểm tra pass/fail đơn giản:
- 3-5 hình ảnh của bộ phận tốt
- 3-5 hình ảnh của bộ phận lỗi
2. Định nghĩa các class của bạn
Trong giao diện gán nhãn, thêm các class mà mỗi loại kiểm tra cần. Đối với classifier, điều này có thể là:
- Pass / Fail
- Present / Absent
- Good / Scratched / Cracked
Giữ đơn giản lúc đầu. Bạn luôn có thể thêm class sau.
3. Gán nhãn cho hình ảnh

Đối với mỗi ROI trong mỗi hình ảnh, gán nhãn class chính xác:
- Classifier: Chọn class từ dropdown (ví dụ: "pass" hoặc "fail")
OV10i chỉ hỗ trợ classifier. Chọn class từ dropdown cho mỗi ROI (ví dụ: "pass" hoặc "fail"). Để phân đoạn ở cấp độ pixel, bạn cần OV20i hoặc OV80i.
4. Huấn luyện ở Development Mode
Nhấp vào Train và chọn Development Mode. Việc này mất khoảng 30 giây và tạo ra một mô hình có độ chính xác thấp hơn khoảng 20 lần so với production, nhưng đủ để kiểm tra tín hiệu.
"Kiểm tra tín hiệu" có nghĩa là: AI có đang bắt đầu học sự khác biệt giữa tốt và xấu không? Hay nó đang sai hoàn toàn mọi thứ?
- Nếu nó chủ yếu đúng → tín hiệu tốt, tiếp tục
- Nếu nó hoàn toàn sai → có điều gì đó không ổn. Kiểm tra nhãn sai, kiểm tra kích thước ROI, kiểm tra chất lượng hình ảnh
5. Kiểm tra với Live Preview

Nhấp vào Live Preview Mode và cho các bộ phận chạy qua. Quan sát kết quả:
- Nó có xử lý đúng các trường hợp dễ không?
- Nó gặp khó khăn ở đâu?
- Các trường hợp ranh giới là gì?
Cố gắng phá vỡ nó. Tìm các trường hợp nó thất bại. Những thất bại này là lộ trình cải thiện của bạn.
6. Thêm dữ liệu có mục tiêu
Đừng thêm hình ảnh mới ngẫu nhiên. Thêm hình ảnh nhắm cụ thể vào các kiểu thất bại bạn đã tìm thấy:
- Nếu nó nhầm lẫn vết xước với phản chiếu, thêm nhiều ví dụ của cả hai
- Nếu nó bỏ lỡ các lỗi nhỏ, thêm nhiều hình ảnh về các lỗi nhỏ
- Nếu nó thất bại với các bộ phận ở góc, thêm nhiều ví dụ về góc
7. Huấn luyện lại và kiểm tra lại
Lặp lại các bước 4-6 hai đến bốn lần. Mỗi lần lặp sẽ cải thiện độ chính xác.
8. Chuyển sang Production Mode
Khi development mode hoạt động tương đối tốt, chuyển sang Production Mode. Việc này mất 5-10 phút nhưng tạo ra một mô hình có độ chính xác cao hơn khoảng 20 lần so với development mode.
Nếu development mode đúng 80% các trường hợp, production mode có khả năng đạt 95% trở lên.
Augmentations: dạy AI xử lý sự biến thiên
Augmentations thay đổi ngẫu nhiên hình ảnh huấn luyện của bạn trong quá trình huấn luyện, điều chỉnh độ sáng, thêm xoay, chỉnh độ tương phản, v.v. Mỗi hình ảnh được đưa vào AI hàng trăm lần với các augmentation khác nhau một chút, nhưng nhãn vẫn giữ nguyên.
Điều này cực kỳ mạnh mẽ để xây dựng tính bền vững. Nếu ánh sáng của bạn thay đổi giữa các ca, brightness augmentation dạy AI xử lý nó. Nếu các bộ phận có thể đến ở bất kỳ góc nào, rotation augmentation làm cho hướng không còn quan trọng.
Khi nào sử dụng augmentations
| Augmentation | Sử dụng khi... | Kịch bản ví dụ |
|---|---|---|
| Brightness | Ánh sáng thay đổi (ngày/đêm, bóng đổ) | Đèn trần nhà máy thay đổi trong ngày |
| Rotation | Bộ phận có thể đến ở bất kỳ góc nào | Lỗ vít, nơi hướng không quan trọng |
| Motion blur | Bộ phận di chuyển nhanh hoặc camera rung | Băng tải tốc độ cao |
| Saturation | Màu sắc không phải một phần của kiểm tra | Cùng một bộ phận với các màu khác nhau nên đều pass |
| Contrast | Ánh sáng môi trường dao động | Thay đổi ánh sáng theo mùa qua cửa sổ |
Khi KHÔNG sử dụng augmentations
Đây là con dao hai lưỡi. Nếu bạn thêm rotation augmentation nhưng bạn đang kiểm tra liệu các bộ phận có được định hướng đúng không, bạn sẽ dạy AI rằng các bộ phận ngược đầu vẫn "tốt".
- Kiểm tra tính nhất quán màu sắc? Đừng sử dụng saturation augmentation
- Kiểm tra độ mờ/lấy nét? Đừng sử dụng motion blur augmentation
- Kiểm tra hướng? Đừng sử dụng rotation augmentation
Quy tắc: Augment mọi thứ trừ thuộc tính cụ thể bạn đang kiểm tra.
Đa dạng dữ liệu rất quan trọng
Dữ liệu huấn luyện của bạn nên đại diện cho toàn bộ phạm vi mà AI sẽ thấy trong production:
- Các thời điểm khác nhau trong ngày (nếu ánh sáng thay đổi)
- Các lô bộ phận khác nhau (bề mặt hoàn thiện có thể thay đổi một chút)
- Bộ phận ở các vị trí khác nhau trong khung hình
- Cả trường hợp dễ và khó
Tập trung vào các trường hợp khó nhất. Nếu dữ liệu huấn luyện của bạn bao gồm 10 bộ phận khó phân loại nhất, thì 90% các bộ phận dễ sẽ trở nên đơn giản đối với AI.
Khả năng học tập cao
AI của camera OV được thiết kế để tiếp tục cải thiện với nhiều dữ liệu hơn. Không giống như nhiều hệ thống AI đạt đỉnh sau 20 hình ảnh, mô hình này tiếp tục cải thiện với 50, 100, thậm chí 500+ hình ảnh. Hầu hết các kiểm tra hoạt động tốt với 5-10 hình ảnh, nhưng nếu bạn có một vấn đề đa lỗi phức tạp, đừng ngần ngại tiếp tục thêm dữ liệu.
Tăng tốc với dữ liệu tổng hợp: Defect Studio
Nếu bạn cần huấn luyện cho một lỗi hiếm gặp thì sao? Một con vít thiếu mà bạn phải cố ý tháo ra, một vết xước mà bạn phải tạo ra, một vết nứt xảy ra một lần trên một nghìn bộ phận? Chờ đợi nhiều tháng để thu thập đủ ví dụ là không thực tế.
OV Auto-Defect Creator Studio tại tools.overview.ai giải quyết điều này. Nó tạo ra các hình ảnh lỗi tổng hợp chân thực như ảnh chụp, nhanh hơn đến 10.000 lần so với việc chờ đợi các lỗi thực xuất hiện trên dây chuyền sản xuất.
Cách hoạt động: 5 bước đơn giản
- Upload một hình ảnh tốt của bộ phận của bạn
- Đánh dấu khu vực mà lỗi sẽ xuất hiện
- Mô tả lỗi bằng tiếng Anh đơn giản (ví dụ: "deep scratch across the surface" hoặc "missing solder joint")
- Generate các biến thể lỗi (AI tạo ra kết quả chân thực như ảnh chụp)
- Export hình ảnh tổng hợp trực tiếp vào tập huấn luyện của bạn
Tại sao dữ liệu tổng hợp hoạt động
Các hình ảnh được tạo ra không chỉ là các đối tượng được "dán lên". Chúng là các biến thể chân thực như ảnh chụp khớp với ánh sáng, góc camera và bề mặt bộ phận thực tế của bạn. AI hiểu vật lý của cách lỗi trông như thế nào trong điều kiện chụp ảnh cụ thể của bạn.
Trường hợp sử dụng:
- Lỗi hiếm gặp: Huấn luyện cho các kiểu thất bại bạn chưa bao giờ (hoặc hiếm khi) thấy
- Ra mắt sản phẩm mới: Xây dựng kiểm tra trước khi bộ phận lỗi đầu tiên ra khỏi dây chuyền
- Trường hợp ranh giới: Tạo ra các ví dụ ranh giới để cải thiện ranh giới quyết định của AI
- Tăng cường dữ liệu: Bổ sung các tập dữ liệu nhỏ với sự đa dạng tổng hợp
Xem nó hoạt động
Cách tiếp cận tốt nhất: huấn luyện với 3-5 hình ảnh thực ban đầu trước, xác định nơi AI gặp khó khăn, sau đó sử dụng Defect Studio để tạo ra các ví dụ tổng hợp có mục tiêu cho các kiểu thất bại cụ thể đó. Dữ liệu thực dạy đường cơ sở; dữ liệu tổng hợp lấp đầy các khoảng trống.
Danh sách kiểm tra huấn luyện
Trước khi tiếp tục, xác nhận:
- Đã chụp hình ảnh ban đầu, tối thiểu 3-5 hình cho mỗi class
- Tất cả nhãn đã được kiểm tra kỹ (View All ROIs)
- Development mode đã được huấn luyện và kiểm tra với Live Preview
- Các kiểu thất bại đã được xác định và dữ liệu có mục tiêu đã được thêm vào
- Đã hoàn thành 2-4 lần lặp của gán nhãn → huấn luyện → kiểm tra
- Production mode đã được huấn luyện; kết quả đáp ứng kỳ vọng
Mô hình đã được huấn luyện và trông ổn? Chuyển sang Bước 5: Thiết Lập Outputs.