AI-POWERED DOCS
What do you want to know?
Bước 4: Huấn Luyện Mô Hình AI
Các vùng kiểm tra đã được thiết lập. Bây giờ là lúc dạy AI phân biệt thế nào là "tốt" và "xấu".
Ba quy tắc cốt lõi khi huấn luyện
Trước tiên, hãy ghi nhớ ba quy tắc này. Chúng áp dụng cho dù bạn đang huấn luyện classifier hay segmenter, với 5 hay 500 hình ảnh.
Quy tắc 1: Gán nhãn chỉ dựa trên hình ảnh
Không bao giờ nhìn vào bộ phận vật lý (hay đặt nó dưới kính hiển vi) để quyết định nó tốt hay xấu. Nếu bạn không thể nhìn thấy lỗi trong hình ảnh camera, AI không thể học được nó.
AI không phải là phép màu. Nó chỉ có thể làm việc với những gì camera nhìn thấy. Nếu bạn gán nhãn một bộ phận là "lỗi" dựa trên điều bạn phát hiện khi sờ vào hoặc phóng to dưới kính lúp, nhưng hình ảnh camera trông vẫn ổn, bạn đang dạy AI nhìn thấy thứ không tồn tại.
Nếu bạn không thể gán nhãn chỉ dựa trên hình ảnh, hãy quay lại bước Install và khắc phục thiết lập vật lý: ống kính tốt hơn, ánh sáng tốt hơn, lắp đặt gần hơn, góc khác.
Quy tắc 2: Kiểm tra nhãn hai đến ba lần
Gán nhãn sai xảy ra với tất cả mọi người; các kỹ sư có kinh nghiệm cũng mắc phải. Nhưng một nhãn sai trong một dataset nhỏ có thể phá hỏng kết quả của bạn.
Với 5 hình ảnh huấn luyện, một nhãn sai làm hỏng 20% dữ liệu huấn luyện. Điều đó là thảm họa.
Trước mỗi lần huấn luyện: Nhấp vào View All ROIs và xác minh từng annotation. Đây là việc dễ khắc phục nhất và có tác động lớn nhất.
Quy tắc 3: Bắt đầu nhỏ, lặp lại nhanh
Đừng gán nhãn 50 hình ảnh rồi nhấn train. Thay vào đó, hãy tạo một vòng lặp chặt chẽ: Gán nhãn 3-5 hình ảnh cho mỗi class, huấn luyện ở development mode (khoảng 30 giây), kiểm tra và cố gắng phá vỡ nó, sau đó bổ sung dữ liệu có mục tiêu ở những nơi nó thất bại. Lặp lại chu trình này 2-4 lần ở development mode, sau đó chuyển sang production mode.
Vòng lặp này là con đường nhanh nhất để có một mô hình tốt. Hãy chạy nó 2-4 lần ở development mode, sau đó chuyển sang production mode.
Quy trình huấn luyện từng bước
1. Chụp hình ảnh huấn luyện ban đầu
Với recipe đang hoạt động và các bộ phận đang được đưa qua (hoặc đặt thủ công), hãy chụp hình ảnh. Bạn cần tối thiểu 3-5 hình ảnh cho mỗi class để bắt đầu.
Đối với kiểm tra pass/fail đơn giản:
- 3-5 hình ảnh của các bộ phận tốt
- 3-5 hình ảnh của các bộ phận lỗi
2. Định nghĩa các class
Trong giao diện gán nhãn, hãy thêm các class mà mỗi loại kiểm tra cần. Đối với classifier, các class này có thể là:
- Pass / Fail
- Present / Absent
- Good / Scratched / Cracked
Hãy giữ đơn giản lúc ban đầu. Bạn luôn có thể thêm class sau.
3. Gán nhãn hình ảnh

Đối với mỗi ROI trong mỗi hình ảnh, hãy gán nhãn class chính xác:
- Classifier: Chọn class từ menu thả xuống (ví dụ: "pass" hoặc "fail")
- Segmenter: Sử dụng công cụ brush để tô các vùng lỗi theo từng pixel
Nếu bạn không chắc nên sử dụng classification hay segmentation, hãy bắt đầu với classification. Gán nhãn nhanh hơn nhiều và phù hợp với hầu hết các tình huống pass/fail. Xem Classifier vs. Segmenter để được hướng dẫn.
4. Huấn luyện ở Development Mode
Nhấp vào Train và chọn Development Mode. Việc này mất khoảng 30 giây và tạo ra một mô hình kém chính xác hơn khoảng 20 lần so với production, nhưng đủ để kiểm tra tín hiệu.
Ý nghĩa của "kiểm tra tín hiệu": AI có đang bắt đầu học sự khác biệt giữa tốt và xấu không? Hay nó đang sai hoàn toàn?
- Nếu phần lớn đều đúng → tín hiệu tốt, tiếp tục
- Nếu sai hoàn toàn → có vấn đề gì đó. Kiểm tra nhãn sai, kiểm tra kích thước ROI, kiểm tra chất lượng hình ảnh
5. Kiểm Tra với Live Preview

Nhấp vào Live Preview Mode và cho các bộ phận chạy qua. Quan sát kết quả:
- Nó có nhận diện đúng các trường hợp dễ không?
- Nó gặp khó khăn ở đâu?
- Các trường hợp ranh giới là gì?
Hãy cố gắng làm nó thất bại. Tìm ra các trường hợp mà nó thất bại. Những thất bại này là lộ trình cải thiện của bạn.
6. Thêm dữ liệu có mục tiêu
Đừng thêm các hình ảnh mới ngẫu nhiên. Hãy thêm các hình ảnh nhắm mục tiêu cụ thể vào các chế độ thất bại mà bạn đã tìm thấy:
- Nếu nó nhầm lẫn giữa vết xước và phản chiếu ánh sáng, hãy thêm nhiều ví dụ của cả hai
- Nếu nó bỏ sót các lỗi nhỏ, hãy thêm nhiều hình ảnh về các lỗi nhỏ
- Nếu nó thất bại với các bộ phận ở góc, hãy thêm nhiều ví dụ ở góc
7. Huấn luyện lại và kiểm tra lại
Lặp lại các bước 4-6 từ hai đến bốn lần. Mỗi lần lặp sẽ cải thiện độ chính xác.
8. Chuyển sang Production Mode
Khi development mode hoạt động khá tốt, hãy chuyển sang Production Mode. Điều này mất 5-10 phút nhưng tạo ra một model có độ chính xác cao gấp khoảng 20 lần so với development mode.
Nếu development mode đạt 80% trường hợp đúng, production mode có thể đạt 95%+ trường hợp đúng.
Augmentations: dạy AI xử lý sự biến đổi
Augmentations ngẫu nhiên chỉnh sửa các hình ảnh huấn luyện trong quá trình huấn luyện, điều chỉnh độ sáng, thêm xoay, tinh chỉnh độ tương phản, v.v. Mỗi hình ảnh được đưa vào AI hàng trăm lần với các augmentations hơi khác nhau, nhưng nhãn vẫn giữ nguyên.
Điều này cực kỳ mạnh mẽ để xây dựng tính bền vững. Nếu ánh sáng thay đổi giữa các ca làm việc, augmentation độ sáng sẽ dạy AI xử lý điều đó. Nếu các bộ phận có thể đến ở bất kỳ góc nào, augmentation xoay sẽ làm cho hướng không còn quan trọng.
Khi nào nên sử dụng augmentations
| Augmentation | Sử dụng khi... | Ví dụ tình huống |
|---|---|---|
| Brightness | Ánh sáng thay đổi (ngày/đêm, bóng tối) | Đèn trần nhà máy thay đổi trong ngày |
| Rotation | Bộ phận có thể đến ở bất kỳ góc nào | Lỗ vít, nơi hướng không quan trọng |
| Motion blur | Bộ phận di chuyển nhanh hoặc camera rung | Băng tải tốc độ cao |
| Saturation | Màu sắc không phải là một phần của kiểm tra | Cùng bộ phận với các màu khác nhau đều phải được chấp nhận |
| Contrast | Ánh sáng môi trường dao động | Ánh sáng theo mùa thay đổi qua cửa sổ |
Khi nào KHÔNG nên sử dụng augmentations
Đây là con dao hai lưỡi. Nếu bạn thêm augmentation xoay nhưng bạn đang kiểm tra xem các bộ phận có được định hướng chính xác hay không, bạn sẽ dạy AI rằng các bộ phận ngược chiều vẫn là "tốt."
- Kiểm tra tính nhất quán về màu sắc? Không sử dụng saturation augmentation
- Kiểm tra độ mờ/tiêu điểm? Không sử dụng motion blur augmentation
- Kiểm tra hướng? Không sử dụng rotation augmentation
Quy tắc: Augment mọi thứ ngoại trừ thuộc tính cụ thể bạn đang kiểm tra.
Sự đa dạng của dữ liệu rất quan trọng
Dữ liệu huấn luyện của bạn nên đại diện cho toàn bộ phạm vi những gì AI sẽ thấy trong production:
- Các thời điểm khác nhau trong ngày (nếu ánh sáng thay đổi)
- Các lô bộ phận khác nhau (bề mặt hoàn thiện có thể thay đổi nhẹ)
- Các bộ phận ở các vị trí khác nhau trong khung hình
- Cả các trường hợp dễ và khó
Tập trung vào các trường hợp khó nhất. Nếu dữ liệu huấn luyện của bạn bao gồm 10 bộ phận khó phân loại nhất, thì 90% bộ phận dễ sẽ trở nên đơn giản đối với AI.
Khả năng học tập cao
AI của camera OV được thiết kế để liên tục cải thiện với nhiều dữ liệu hơn. Không giống như nhiều hệ thống AI khác bị chững lại sau 20 hình ảnh, mô hình này tiếp tục cải thiện với 50, 100, thậm chí 500+ hình ảnh. Hầu hết các kiểm tra hoạt động tốt với 5-10 hình ảnh, nhưng nếu bạn có vấn đề phức tạp với nhiều loại lỗi, đừng ngần ngại tiếp tục thêm dữ liệu.
Tăng tốc với dữ liệu tổng hợp: Defect Studio
Nếu bạn cần huấn luyện cho một lỗi hiếm khi gặp thì sao? Một con vít bị thiếu mà bạn phải cố ý tháo ra, một vết xước mà bạn phải tạo ra, một vết nứt chỉ xảy ra một lần trong một nghìn bộ phận? Chờ đợi hàng tháng để thu thập đủ ví dụ là không thực tế.
OV Auto-Defect Creator Studio tại tools.overview.ai giải quyết vấn đề này. Nó tạo ra các hình ảnh lỗi tổng hợp chân thực như ảnh thật, nhanh hơn tới 10.000 lần so với việc chờ đợi các lỗi thực tế xuất hiện trên dây chuyền sản xuất.
Cách hoạt động: 5 bước đơn giản
- Tải lên một hình ảnh tốt của bộ phận của bạn
- Đánh dấu khu vực nơi lỗi sẽ xuất hiện
- Mô tả lỗi bằng tiếng Anh đơn giản (ví dụ: "deep scratch across the surface" hoặc "missing solder joint")
- Tạo các biến thể lỗi (AI sẽ tạo ra kết quả chân thực như ảnh thật)
- Xuất hình ảnh tổng hợp trực tiếp vào tập huấn luyện của bạn
Tại sao dữ liệu tổng hợp hoạt động hiệu quả
Các hình ảnh được tạo ra không chỉ là những yếu tố "dán lên". Chúng là các biến thể chân thực phù hợp với ánh sáng, góc camera và bề mặt bộ phận thực tế của bạn. AI hiểu được vật lý của cách các lỗi xuất hiện dưới điều kiện chụp ảnh cụ thể của bạn.
Các trường hợp sử dụng:
- Lỗi hiếm gặp: Huấn luyện cho các chế độ lỗi mà bạn chưa bao giờ (hoặc hiếm khi) gặp
- Ra mắt sản phẩm mới: Xây dựng kiểm tra trước khi bộ phận lỗi đầu tiên xuất hiện trên dây chuyền
- Trường hợp biên: Tạo các ví dụ ở ranh giới để cải thiện ranh giới quyết định của AI
- Tăng cường dữ liệu: Bổ sung các tập dữ liệu nhỏ với đa dạng tổng hợp
Xem thực tế
Phương pháp tốt nhất: huấn luyện với 3-5 hình ảnh thực ban đầu trước, xác định nơi AI gặp khó khăn, sau đó sử dụng Defect Studio để tạo các ví dụ tổng hợp có mục tiêu cho những chế độ lỗi cụ thể đó. Dữ liệu thực dạy đường cơ sở; dữ liệu tổng hợp lấp đầy các khoảng trống.
Danh sách kiểm tra huấn luyện
Trước khi tiếp tục, hãy xác nhận:
- Đã chụp hình ảnh ban đầu, tối thiểu 3-5 hình mỗi class
- Tất cả nhãn đã được kiểm tra kỹ (View All ROIs)
- Development mode đã được huấn luyện và kiểm tra với Live Preview
- Các chế độ lỗi đã được xác định và dữ liệu có mục tiêu đã được thêm
- Đã hoàn thành 2-4 lần lặp lại gán nhãn → huấn luyện → kiểm tra
- Production mode đã được huấn luyện; kết quả đáp ứng mong đợi
Mô hình đã được huấn luyện và trông tốt? Chuyển sang Bước 5: Thiết Lập Outputs.