AI-POWERED DOCS
What do you want to know?
Bước 4: Huấn Luyện Mô Hình AI Của Bạn
Các vùng quan tâm (ROI) đã được thiết lập. Bây giờ là lúc dạy AI nhận biết thế nào là "tốt" và "xấu".
Ba quy tắc cốt lõi của việc huấn luyện
Trước hết, hãy nắm vững ba quy tắc này. Chúng áp dụng cho dù bạn đang huấn luyện classifier hay segmenter, với 5 hình ảnh hay 500.
Quy tắc 1: Gán nhãn chỉ dựa trên hình ảnh
Không bao giờ nhìn vào bộ phận vật lý (hoặc đặt nó dưới kính hiển vi) để quyết định xem nó tốt hay xấu. Nếu bạn không thể nhìn thấy khuyết tật trong hình ảnh camera, AI không thể học được nó.
AI không phải là phép thuật. Nó chỉ có thể làm việc với những gì camera nhìn thấy. Nếu bạn gán nhãn một bộ phận là "lỗi" dựa trên điều gì đó bạn nhận thấy khi chạm vào hoặc phóng to dưới kính lúp, nhưng hình ảnh camera trông vẫn ổn, thì bạn đang dạy AI nhìn thấy thứ không tồn tại.
Nếu bạn không thể gán nhãn chỉ từ hình ảnh, hãy quay lại bước Install và sửa thiết lập vật lý: ống kính tốt hơn, ánh sáng tốt hơn, lắp đặt gần hơn, góc khác.
Quy tắc 2: Kiểm tra hai và ba lần các nhãn của bạn
Gán nhãn sai xảy ra với tất cả mọi người; các kỹ sư có kinh nghiệm cũng vậy. Nhưng một nhãn sai trong tập dữ liệu nhỏ có thể phá hủy kết quả của bạn.
Với 5 hình ảnh huấn luyện, một nhãn sai làm hỏng 20% dữ liệu huấn luyện của bạn. Điều đó là thảm họa.
Trước mỗi lần chạy huấn luyện: Nhấp vào View All ROIs và xác minh từng chú thích một. Đây là điều dễ sửa nhất và có tác động lớn nhất.
Quy tắc 3: Bắt đầu nhỏ, lặp lại nhanh
Đừng gán nhãn 50 hình ảnh rồi nhấn train. Thay vào đó, hãy tạo một vòng lặp chặt chẽ: Gán nhãn 10-15 hình ảnh mỗi lớp, huấn luyện (khoảng 30 giây), kiểm tra và cố gắng làm cho nó thất bại, sau đó thêm dữ liệu nhắm mục tiêu vào nơi nó thất bại. Lặp lại chu kỳ này 2-4 lần.
Vòng lặp này là con đường nhanh nhất để có một mô hình tốt.
Quy trình huấn luyện từng bước
1. Chụp các hình ảnh huấn luyện ban đầu
Với recipe của bạn đang hoạt động và các bộ phận đang chạy qua (hoặc được đặt thủ công), hãy chụp hình ảnh. Bạn cần tối thiểu 10-15 hình ảnh mỗi lớp để bắt đầu.
Đối với kiểm tra pass/fail đơn giản:
- 10-15 hình ảnh các bộ phận tốt
- 10-15 hình ảnh các bộ phận lỗi
2. Định nghĩa các lớp của bạn
Chọn loại mô hình bạn đang huấn luyện, sau đó đọc hướng dẫn tương ứng. Nút chuyển đổi bên dưới được đồng bộ giữa Bước 2 và Bước 3, và lựa chọn của bạn được lưu trong URL nên nó vẫn được giữ lại sau khi làm mới hoặc chia sẻ.
- Classifier
- Segmenter
Trong giao diện gán nhãn, hãy thêm các lớp mà mỗi loại kiểm tra cần. Các bộ lớp classifier phổ biến:
- Pass / Fail
- Present / Absent
- Good / Scratched / Cracked
Hãy giữ cho đơn giản lúc đầu. Bạn luôn có thể thêm các lớp sau.
Trong giao diện gán nhãn, hãy thêm các lớp cho các khuyết tật (hoặc đặc điểm) mà bạn muốn AI tạo mask. Các bộ lớp segmenter phổ biến:
- Defect / Background
- Scratch / Crack / Stain
- Foreground / Background
Hãy giữ danh sách lớp ngắn lúc đầu. Mỗi lớp cần màu cọ riêng và các ví dụ được gán nhãn riêng, vì vậy việc thêm nhiều lớp ngay từ đầu sẽ làm tăng khối lượng công việc gán nhãn của bạn.
3. Gán nhãn hình ảnh
- Classifier
- Segmenter

Mỗi ROI nhận một class phân loại riêng — chọn class mô tả ROI đó trong hình ảnh đó (ví dụ: "pass" hoặc "fail").
Nếu bạn không chắc nên sử dụng classification hay segmentation, hãy bắt đầu với classification. Việc gán nhãn nhanh hơn nhiều và phù hợp với hầu hết các kịch bản pass/fail. Xem Classifier vs. Segmenter để được hướng dẫn.

Đối với mỗi ROI trong mỗi hình ảnh, sử dụng công cụ cọ vẽ để tô các vùng bị lỗi từng pixel một. Các vùng đã tô là những gì AI học để phát hiện — bất cứ thứ gì bạn không tô sẽ được coi là nền.
Nhãn Segmenter yêu cầu vẽ cọ ở mức pixel, chậm hơn so với việc chọn từ danh sách thả xuống của classifier nhưng cung cấp bản đồ lỗi chính xác với vị trí và hình dạng. Hãy bắt đầu với một tập nhỏ các lỗi được xác định rõ ràng, và chỉ thêm nhiều class hơn khi mô hình đầu tiên của bạn hoạt động tốt.
4. Huấn luyện mô hình
- Classifier
- Segmenter
Nhấp vào Train. Classifier cung cấp hai chế độ huấn luyện:
- Fast mode — khoảng 30 giây đến một phút. Tốt nhất cho việc lặp nhanh trong quá trình thiết lập, kiểm tra nhanh các nhãn của bạn, và các bộ phận dễ/được phân tách rõ ràng. Độ chính xác thấp hơn production mode nhưng cho phép bạn thấy tín hiệu nhanh chóng.
- Production mode — mất nhiều thời gian hơn nhưng tạo ra một mô hình chính xác hơn đáng kể. Luôn sử dụng Production mode trước khi triển khai lên dây chuyền. Đối với các bộ phận khó, các lỗi khó phân biệt, hoặc bất cứ điều gì bạn sẽ tin tưởng trong sản xuất, Production mode là câu trả lời đúng.
Một nhịp độ tốt: lặp lại trong Fast mode trong khi bạn đang dọn dẹp nhãn và thêm dữ liệu, sau đó chạy Production khi kết quả trông tốt — và một lần nữa trước khi triển khai.
Nhấp vào Train. Segmentation chỉ có một chế độ huấn luyện — Production — vì các mask ở mức pixel cần quá trình huấn luyện kỹ lưỡng hơn để đáng tin cậy. Thời gian huấn luyện tỷ lệ với số lượng hình ảnh và số lượng ROI bạn đã gán nhãn, vì vậy một tập ban đầu nhỏ (10-15 hình ảnh cho mỗi class) huấn luyện trong vài phút; bộ dữ liệu lớn hơn sẽ mất nhiều thời gian hơn.
Không có tùy chọn kiểm tra nhanh "fast" ở đây, vì vậy hãy đảm bảo rằng nhãn của bạn sạch trước khi bạn huấn luyện (sử dụng View All ROIs để xem lại từng mask).
Segmenter chỉ học kích thước và kết cấu của các lỗi mà chúng đã được thấy. Nếu tập huấn luyện của bạn chỉ có các chất gây ô nhiễm nhỏ và sau đó một mảnh lớn của cùng class lỗi đó xuất hiện trong sản xuất, mô hình sẽ chỉ phác thảo các phần của lỗi lớn giống với các ví dụ nhỏ — để lại phần lớn không được bao phủ. Mask trông loang lổ hoặc chỉ đánh dấu các cạnh và góc của lỗi thực.
Khắc phục: bao gồm các ví dụ huấn luyện trải dài toàn bộ phạm vi kích thước lỗi mà bạn mong đợi trên dây chuyền. Một vài ảnh chụp chất gây ô nhiễm lớn cùng với các ảnh nhỏ thường là đủ. Nguyên tắc tương tự áp dụng cho biến thể kết cấu và màu sắc — huấn luyện trên sự đa dạng mà bạn sẽ thấy.
Không có mẫu lỗi lớn? Sử dụng Defect Creator Studio để tạo các hình ảnh huấn luyện tổng hợp của cùng một lỗi ở các kích thước, vị trí và hướng khác nhau — không cần chờ một chất gây ô nhiễm lớn thực sự xuất hiện trên dây chuyền.
5. Kiểm Tra Với Live Preview
Nhấp Live Preview Mode và chạy các bộ phận qua. Quan sát kết quả:
- Mô hình có nhận diện đúng các trường hợp dễ không?
- Mô hình gặp khó khăn ở đâu?
- Các trường hợp ranh giới là gì?
Hãy cố gắng làm cho nó thất bại. Tìm các trường hợp mà mô hình thất bại. Những thất bại này chính là lộ trình cải thiện của bạn.
- Classifier
- Segmenter

Bảng Test hiển thị class dự đoán và confidence score cho mỗi ROI. Chạy một vài lần chụp và tìm các phán quyết có độ tin cậy thấp (thường dưới 70%) — đó là những trường hợp ranh giới và là các bộ phận đáng được gán nhãn tiếp theo nhất.

Live Preview phủ mask lỗi dự đoán trực tiếp lên hình ảnh. Hãy chú ý đến các mask quá nhỏ, quá lớn, hoặc xuất hiện ở những nơi không có lỗi thực sự — đó là các chế độ thất bại mà bạn sẽ nhắm đến trong vòng dữ liệu được gán nhãn tiếp theo.
6. Thêm dữ liệu có mục tiêu
Đừng thêm các hình ảnh mới một cách ngẫu nhiên. Thêm các hình ảnh nhắm cụ thể vào các chế độ thất bại bạn đã tìm thấy:
- Nếu mô hình nhầm lẫn vết xước với phản xạ, hãy thêm nhiều ví dụ về cả hai
- Nếu mô hình bỏ sót các lỗi nhỏ, hãy thêm nhiều hình ảnh về các lỗi nhỏ
- Nếu mô hình thất bại với các bộ phận ở góc, hãy thêm nhiều ví dụ về góc
7. Huấn luyện lại và kiểm tra lại
Lặp lại các bước 4-6 từ hai đến bốn lần. Mỗi lần lặp lại sẽ cải thiện độ chính xác. Để có hướng dẫn chi tiết hơn — bao gồm cách thêm hình ảnh mới vào một mô hình hiện có mà không mất quá trình huấn luyện trước đó — hãy xem Thêm Dữ Liệu & Huấn Luyện Lại.
Augmentations: dạy AI xử lý các biến thể
Augmentations chỉnh sửa ngẫu nhiên các hình ảnh huấn luyện của bạn trong quá trình huấn luyện — điều chỉnh độ sáng, thêm xoay, tinh chỉnh độ tương phản, v.v. Mỗi hình ảnh được đưa vào AI hàng trăm lần với các augmentation hơi khác nhau, nhưng nhãn vẫn giữ nguyên. Đây là cách bạn làm cho mô hình bền vững với các điều kiện thực tế mà không phải chụp ví dụ cho mọi biến thể có thể xảy ra.
Cần bật những gì theo mặc định
Một lượng nhỏ biến thể brightness hầu như luôn đáng được bật — ngay cả nhà máy được kiểm soát nghiêm ngặt nhất cũng có đèn trần nhấp nháy, bóng đổ thay đổi qua các ca làm việc, và sự trôi nhẹ của LED theo thời gian. Brightness augmentation giúp mô hình kháng cự lại tất cả điều đó về cơ bản là miễn phí.
Rotation: hữu ích, nhưng hãy chú ý đến hình dạng ROI
Rotation augmentation rất tuyệt nếu các bộ phận của bạn thực sự có thể đến ở các góc độ khác nhau (ốc vít lỏng trên băng chuyền, các bộ phận đặt bằng tay, bất cứ thứ gì không được giữ trong đồ gá). Nhưng nó tương tác với hình dạng ROI:
- ROI vuông: rotation augmentation hoạt động tốt — hình ảnh sau khi xoay vẫn nằm trong khung ROI.
- ROI không vuông trên một classifier: xoay có thể cắt xén hình ảnh. Khi một ROI cao, hẹp được xoay 45°, các góc của nội dung được xoay sẽ rơi ra ngoài khung và mô hình sẽ huấn luyện trên một phần hình ảnh. Nếu bộ phận của bạn có thể xoay, hãy làm cho ROI vuông hoặc dựa vào Aligner để xử lý xoay từ trước để bạn không cần rotation augmentation ở đây.
- Segmenter: mối lo ngại cắt xén tương tự cũng áp dụng, nhưng segmentation ít nhạy cảm hơn vì nó học từ pixel mask thay vì toàn bộ hình dạng ROI.
Khi nào KHÔNG nên sử dụng một phép augmentation cụ thể
Quy tắc chung: không augment thuộc tính mà bạn đang kiểm tra. Nếu bạn đang cố gắng phát hiện hướng, augmentation xoay sẽ dạy mô hình rằng các bộ phận lộn ngược vẫn là "tốt."
- Kiểm tra tính đồng nhất màu sắc? Không sử dụng augmentation độ bão hòa (saturation).
- Kiểm tra độ mờ/lấy nét? Không sử dụng augmentation motion blur.
- Kiểm tra hướng? Không sử dụng augmentation xoay (và có lẽ cũng không nên sử dụng Aligner).
Sự đa dạng dữ liệu rất quan trọng
Dữ liệu huấn luyện của bạn nên đại diện cho toàn bộ phạm vi mà AI sẽ thấy trong sản xuất:
- Các thời điểm khác nhau trong ngày (nếu ánh sáng thay đổi)
- Các lô bộ phận khác nhau (bề mặt hoàn thiện có thể hơi khác nhau)
- Các bộ phận ở các vị trí khác nhau trong khung hình
- Cả các trường hợp dễ và khó
Tập trung vào các trường hợp khó nhất. Nếu dữ liệu huấn luyện của bạn bao gồm 10 bộ phận khó phân loại nhất, thì 90% các bộ phận dễ sẽ là chuyện đơn giản đối với AI.
Khả năng học cao
AI của camera OV được thiết kế để liên tục cải thiện với nhiều dữ liệu hơn. Khác với nhiều hệ thống AI bị chững lại sau 20 hình ảnh, mô hình này tiếp tục cải thiện với 50, 100, thậm chí hơn 500 hình ảnh. Hầu hết các kiểm tra hoạt động tốt với 5-10 hình ảnh, nhưng nếu bạn có một vấn đề phức tạp với nhiều loại lỗi, đừng ngần ngại tiếp tục thêm dữ liệu.
Tăng tốc với dữ liệu tổng hợp: Defect Studio
Điều gì xảy ra nếu bạn cần huấn luyện cho một lỗi mà bạn hiếm khi thấy? Một con vít bị thiếu mà bạn phải cố ý tháo ra, một vết xước mà bạn phải tạo ra, một vết nứt xảy ra một lần trong một nghìn bộ phận? Việc chờ đợi hàng tháng để thu thập đủ ví dụ là không thực tế.
OV Auto-Defect Creator Studio tại tools.overview.ai giải quyết vấn đề này. Nó tạo ra các hình ảnh lỗi tổng hợp có tính chân thực cao, nhanh hơn tới 10.000 lần so với việc chờ đợi các lỗi thực xuất hiện trên dây chuyền sản xuất.
Cách thức hoạt động: 5 bước đơn giản
- Tải lên một hình ảnh tốt của bộ phận
- Đánh dấu vùng mà lỗi sẽ xuất hiện
- Mô tả lỗi bằng tiếng Anh đơn giản (ví dụ: "deep scratch across the surface" hoặc "missing solder joint")
- Tạo các biến thể lỗi (AI tạo ra kết quả có tính chân thực cao)
- Xuất các hình ảnh tổng hợp trực tiếp vào tập huấn luyện của bạn
Tại sao dữ liệu tổng hợp hiệu quả
Các hình ảnh được tạo ra không chỉ là các vật phẩm "dán lên." Chúng là các biến thể có tính chân thực cao khớp với ánh sáng, góc camera và bề mặt bộ phận thực tế của bạn. AI hiểu được vật lý của cách lỗi xuất hiện trong các điều kiện hình ảnh cụ thể của bạn.
Các trường hợp sử dụng:
- Lỗi hiếm gặp: Huấn luyện cho các chế độ lỗi mà bạn chưa bao giờ (hoặc hiếm khi) thấy
- Ra mắt sản phẩm mới: Xây dựng kiểm tra trước khi bộ phận lỗi đầu tiên ra khỏi dây chuyền
- Trường hợp biên: Tạo các ví dụ ranh giới để cải thiện ranh giới quyết định của AI
- Augmentation dữ liệu: Bổ sung các tập dữ liệu nhỏ với sự đa dạng tổng hợp
Xem hoạt động thực tế
Cách tiếp cận tốt nhất: huấn luyện với 3-5 hình ảnh thực ban đầu trước, xác định nơi AI gặp khó khăn, sau đó sử dụng Defect Studio để tạo ra các ví dụ tổng hợp có mục tiêu cho các chế độ lỗi cụ thể đó. Dữ liệu thực dạy nền tảng cơ bản; dữ liệu tổng hợp lấp đầy các khoảng trống.
Danh sách kiểm tra huấn luyện
Trước khi tiếp tục, hãy xác nhận:
- Đã chụp hình ảnh ban đầu, tối thiểu 10-15 hình mỗi lớp
- Tất cả nhãn đã được kiểm tra kỹ (View All ROIs)
- Đã huấn luyện và kiểm tra với Live Preview
- Đã xác định các chế độ lỗi và bổ sung dữ liệu mục tiêu
- Đã hoàn thành 2-4 lần lặp gán nhãn → huấn luyện → kiểm tra
- Kết quả đáp ứng kỳ vọng
Model đã được huấn luyện và hoạt động tốt? Chuyển sang Bước 5: Thiết Lập Đầu Ra.