Skip to main content

AI-POWERED DOCS

What do you want to know?

Bước 4: Huấn Luyện Mô Hình AI

Các vùng quan tâm (ROI) của bạn đã được thiết lập. Giờ là lúc dạy AI hiểu thế nào là "tốt" và "xấu".

Ba quy tắc vàng khi huấn luyện

Trước khi bắt đầu bất cứ điều gì, hãy ghi nhớ ba quy tắc này. Chúng áp dụng dù bạn đang huấn luyện classifier hay segmenter, với 5 hình ảnh hay 500 hình ảnh.

Quy tắc 1: Gán nhãn chỉ dựa trên hình ảnh

Không bao giờ nhìn vào bộ phận thực tế (hoặc đặt nó dưới kính hiển vi) để quyết định nó tốt hay xấu. Nếu bạn không thể nhìn thấy lỗi trong hình ảnh camera, AI cũng không thể học được.

AI không phải là phép thuật. Nó chỉ có thể làm việc với những gì camera nhìn thấy. Nếu bạn gán nhãn một bộ phận là "lỗi" dựa trên những gì bạn nhận thấy khi chạm vào hoặc phóng to dưới kính lúp, nhưng hình ảnh camera trông vẫn ổn, bạn đang dạy AI nhìn thấy thứ không tồn tại.

Nếu bạn không thể gán nhãn chỉ từ hình ảnh, hãy quay lại bước Install và sửa lại thiết lập vật lý: ống kính tốt hơn, ánh sáng tốt hơn, lắp đặt gần hơn, góc nhìn khác.

Quy tắc 2: Kiểm tra nhãn của bạn hai và ba lần

Việc gán nhãn sai xảy ra với tất cả mọi người; các kỹ sư giàu kinh nghiệm cũng vậy. Nhưng một nhãn sai trong một tập dữ liệu nhỏ có thể phá hủy kết quả của bạn.

Với 5 hình ảnh huấn luyện, một nhãn sai làm hỏng 20% dữ liệu huấn luyện của bạn. Điều đó là thảm họa.

Trước mỗi lần huấn luyện: Nhấp vào View All ROIs và xác minh từng chú thích một. Đây là việc dễ sửa nhất và mang lại tác động lớn nhất.

Quy tắc 3: Bắt đầu nhỏ, lặp lại nhanh

Đừng gán nhãn 50 hình ảnh rồi nhấn train. Thay vào đó, hãy tạo một vòng lặp chặt chẽ: Gán nhãn 10-15 hình ảnh cho mỗi class, train (khoảng 30 giây), kiểm tra và cố gắng phá vỡ nó, sau đó bổ sung dữ liệu có mục tiêu tại những nơi nó thất bại. Lặp lại chu trình này 2-4 lần.

Vòng lặp này là con đường nhanh nhất để có một mô hình tốt.

Quy trình huấn luyện từng bước

Bạn đang sử dụng phiên bản giao diện nào?

Giao diện web OV20i đã được thiết kế lại trong v2026.5. Kiểm tra phiên bản phần mềm của bạn ở góc trên bên phải của giao diện camera và chọn tab tương ứng. Lựa chọn của bạn sẽ được áp dụng xuyên suốt mọi trang trong quy trình thiết lập này.

Làm theo các bước được đánh số dưới đây để chụp, gán nhãn, huấn luyện và lặp lại.

1. Chụp hình ảnh huấn luyện ban đầu

Với recipe đang hoạt động và các bộ phận đang chạy qua (hoặc được đặt thủ công), hãy chụp hình ảnh. Bạn cần tối thiểu 10-15 hình ảnh cho mỗi class để bắt đầu.

Đối với một kiểm tra pass/fail đơn giản:

  • 10-15 hình ảnh các bộ phận tốt
  • 10-15 hình ảnh các bộ phận lỗi

2. Xác định các class của bạn

Chọn loại mô hình bạn đang huấn luyện, sau đó đọc các hướng dẫn tương ứng. Nút chuyển đổi bên dưới sẽ đồng bộ giữa Bước 2 và Bước 3, và lựa chọn của bạn được lưu trong URL để vẫn được giữ lại khi làm mới trang hoặc chia sẻ.

Trong giao diện gán nhãn, thêm các class mà mỗi loại kiểm tra cần. Các bộ class classifier phổ biến:

  • Pass / Fail
  • Present / Absent
  • Good / Scratched / Cracked

Hãy giữ đơn giản lúc đầu. Bạn luôn có thể thêm class sau.

3. Gán nhãn hình ảnh

Gán nhãn Classifier: chọn một lớp cho mỗi ROI từ menu thả xuống

Mỗi ROI có lớp phân loại riêng, hãy chọn lớp mô tả ROI đó trong hình ảnh đó (ví dụ: "pass" hoặc "fail").

Phân loại (Classification) nhanh hơn để gán nhãn

Nếu bạn không chắc nên sử dụng classification hay segmentation, hãy bắt đầu với classification. Nó nhanh hơn nhiều để gán nhãn và phù hợp với hầu hết các kịch bản pass/fail. Xem Classifier vs. Segmenter để được hướng dẫn.

4. Huấn luyện model

Nhấp vào Train. Classifier cung cấp hai chế độ huấn luyện:

  • Fast mode, khoảng 30 giây đến một phút. Phù hợp nhất cho việc lặp nhanh trong quá trình thiết lập, kiểm tra nhanh các nhãn của bạn, và các bộ phận dễ/được phân tách rõ ràng. Độ chính xác thấp hơn so với production mode nhưng cho phép bạn nhanh chóng thấy được tín hiệu.
  • Production mode, mất nhiều thời gian hơn nhưng tạo ra một model chính xác hơn đáng kể. Luôn sử dụng Production mode trước khi triển khai lên dây chuyền. Đối với các bộ phận phức tạp, các lỗi khó phân biệt, hoặc bất cứ điều gì bạn sẽ tin cậy trong sản xuất, Production mode là lựa chọn đúng đắn.

Một nhịp độ tốt: lặp lại trong Fast mode trong khi bạn đang dọn dẹp nhãn và thêm dữ liệu, sau đó chạy Production khi kết quả trông tốt, và lại chạy một lần nữa trước khi triển khai.

5. Kiểm Tra với Live Preview

Nhấp vào Live Preview Mode và cho các bộ phận chạy qua. Quan sát kết quả:

  • Mô hình có xử lý đúng các trường hợp dễ không?
  • Mô hình gặp khó khăn ở đâu?
  • Các trường hợp ranh giới là gì?

Hãy thử làm cho mô hình thất bại. Tìm các trường hợp mà mô hình không xử lý được. Những thất bại này là lộ trình để cải thiện.

Classifier live preview: per-ROI verdicts and confidence scores

Bảng Test hiển thị class dự đoán và confidence score cho từng ROI. Chạy thử một vài lần chụp và tìm các phán quyết có độ tin cậy thấp (thường dưới 70%), đó là các trường hợp ranh giới và là các bộ phận đáng được gán nhãn tiếp theo nhất.

6. Thêm dữ liệu có mục tiêu

Đừng thêm hình ảnh mới một cách ngẫu nhiên. Thêm hình ảnh nhắm cụ thể vào các chế độ thất bại mà bạn đã tìm thấy:

  • Nếu mô hình nhầm lẫn vết xước với phản chiếu, hãy thêm nhiều ví dụ về cả hai
  • Nếu mô hình bỏ sót các lỗi nhỏ, hãy thêm nhiều hình ảnh về các lỗi nhỏ
  • Nếu mô hình thất bại trên các bộ phận ở góc, hãy thêm nhiều ví dụ về góc

7. Huấn luyện lại và kiểm tra lại

Lặp lại các bước 4-6 từ hai đến bốn lần. Mỗi lần lặp sẽ cải thiện độ chính xác. Để có hướng dẫn chi tiết hơn, bao gồm cách thêm hình ảnh mới vào một mô hình hiện có mà không mất đi quá trình huấn luyện trước đó, hãy xem Thêm Dữ Liệu & Huấn Luyện Lại.

Augmentations: dạy AI xử lý sự biến đổi

Augmentations sẽ ngẫu nhiên sửa đổi các hình ảnh huấn luyện của bạn trong quá trình huấn luyện, điều chỉnh độ sáng, thêm xoay, tinh chỉnh độ tương phản, v.v. Mỗi hình ảnh được đưa vào AI hàng trăm lần với các augmentation hơi khác nhau, nhưng nhãn vẫn giữ nguyên. Đây là cách bạn làm cho một mô hình trở nên mạnh mẽ trước các điều kiện thực tế mà không cần phải chụp một ví dụ cho mọi biến thể có thể xảy ra.

Những gì nên bật mặc định

Một lượng nhỏ biến đổi brightness gần như luôn đáng để bật, ngay cả nhà máy được kiểm soát chặt chẽ nhất cũng có đèn trần nhấp nháy, bóng tối thay đổi suốt ca làm việc, và LED bị trôi nhẹ theo thời gian. Augmentation độ sáng làm cho mô hình thích ứng với tất cả những điều đó một cách miễn phí.

Rotation: hữu ích, nhưng hãy chú ý đến hình dạng ROI

Augmentation xoay rất hữu ích nếu các bộ phận của bạn thực sự có thể đến ở các góc khác nhau (ốc vít lỏng trên băng tải, các bộ phận đặt bằng tay, bất cứ thứ gì không được giữ trong đồ gá). Nhưng nó tương tác với hình dạng ROI:

  • ROI vuông: augmentation xoay hoạt động sạch sẽ, hình ảnh đã xoay vẫn nằm gọn trong hộp ROI.
  • ROI không vuông trên một classifier: việc xoay có thể cắt hình ảnh. Khi một ROI cao, hẹp bị xoay 45°, các góc của nội dung đã xoay rơi ra ngoài hộp và mô hình huấn luyện trên một hình ảnh không hoàn chỉnh. Nếu bộ phận của bạn có thể xoay, hãy làm cho ROI vuông hoặc dựa vào Aligner để xử lý việc xoay ở phía trước nhằm không cần augmentation xoay ở đây.
  • Segmenter: mối lo về việc bị cắt vẫn tương tự, nhưng segmentation ít nhạy cảm hơn vì nó học từ các mask pixel chứ không phải từ toàn bộ hình dạng ROI.

Tính đa dạng của dữ liệu rất quan trọng

Dữ liệu huấn luyện của bạn nên đại diện cho toàn bộ phạm vi mà AI sẽ thấy trong sản xuất:

  • Các thời điểm khác nhau trong ngày (nếu ánh sáng thay đổi)
  • Các lô bộ phận khác nhau (bề mặt hoàn thiện có thể thay đổi đôi chút)
  • Các bộ phận ở các vị trí khác nhau trong khung hình
  • Cả các trường hợp dễ và khó

Tập trung vào các trường hợp khó nhất. Nếu dữ liệu huấn luyện của bạn bao gồm 10 bộ phận khó phân loại nhất, thì 90% các bộ phận dễ sẽ trở nên đơn giản đối với AI.

Bạn thực sự cần bao nhiêu dữ liệu

Bạn cần ít dữ liệu hơn nhiều so với hầu hết các hệ thống AI khác. Hầu hết các kiểm tra đều hoạt động tốt với chỉ 5 đến 10 hình ảnh mỗi class. Đối với vấn đề khó hơn, đa lỗi, 15 đến 20 hình ảnh mỗi class thường là đủ. Hãy bắt đầu nhỏ, tìm những chỗ mà model gặp khó khăn trong Live Preview, và chỉ thêm các hình ảnh có mục tiêu ở những nơi cần thiết, thay vì thu thập hàng trăm hình ảnh từ trước.

Tăng tốc với dữ liệu tổng hợp: Defect Studio

Nếu bạn cần huấn luyện cho một lỗi mà bạn hiếm khi gặp thì sao? Một con vít bị thiếu mà bạn phải cố ý tháo ra, một vết xước mà bạn phải tự tạo ra, một vết nứt chỉ xảy ra một lần trên một nghìn bộ phận? Việc chờ đợi hàng tháng để thu thập đủ ví dụ là không khả thi.

OV Auto-Defect Creator Studio tại tools.overview.ai giải quyết vấn đề này. Nó tạo ra các hình ảnh lỗi tổng hợp giống ảnh thật, nhanh hơn tới 10.000 lần so với việc chờ đợi các lỗi thực tế xuất hiện trên dây chuyền sản xuất.

Cách hoạt động: 5 bước đơn giản

  1. Upload một hình ảnh tốt của bộ phận của bạn
  2. Đánh dấu khu vực mà lỗi sẽ xuất hiện
  3. Mô tả lỗi bằng tiếng Anh đơn giản (ví dụ: "deep scratch across the surface" hoặc "missing solder joint")
  4. Tạo các biến thể lỗi (AI tạo ra kết quả giống ảnh thật)
  5. Export các hình ảnh tổng hợp trực tiếp vào bộ dữ liệu huấn luyện của bạn

Tại sao dữ liệu tổng hợp hoạt động

Các hình ảnh được tạo ra không chỉ là các yếu tố "dán lên". Chúng là các biến thể giống ảnh thật phù hợp với ánh sáng, góc camera và bề mặt bộ phận thực tế của bạn. AI hiểu được vật lý về cách các lỗi xuất hiện dưới các điều kiện chụp ảnh cụ thể của bạn.

Các trường hợp sử dụng:

  • Lỗi hiếm gặp: Huấn luyện cho các chế độ lỗi mà bạn chưa bao giờ (hoặc hiếm khi) thấy
  • Ra mắt sản phẩm mới: Xây dựng kiểm tra trước khi bộ phận lỗi đầu tiên xuất hiện trên dây chuyền
  • Trường hợp biên: Tạo các ví dụ ở ranh giới để cải thiện đường ranh giới quyết định của AI
  • Tăng cường dữ liệu: Bổ sung các tập dữ liệu nhỏ với sự đa dạng tổng hợp

Xem nó hoạt động

Bắt đầu với dữ liệu thật, tăng tốc với dữ liệu tổng hợp

Cách tiếp cận tốt nhất: huấn luyện với 3-5 hình ảnh thật ban đầu trước, xác định nơi AI gặp khó khăn, sau đó sử dụng Defect Studio để tạo ra các ví dụ tổng hợp có mục tiêu cho các chế độ lỗi cụ thể đó. Dữ liệu thật dạy mức cơ sở; dữ liệu tổng hợp lấp đầy các khoảng trống.

Danh Sách Kiểm Tra Huấn Luyện

Trước khi tiếp tục, hãy xác nhận:

  • Đã chụp hình ảnh ban đầu, tối thiểu 10-15 hình mỗi lớp
  • Tất cả nhãn đã được kiểm tra lại (View All ROIs)
  • Đã huấn luyện và kiểm tra với Live Preview
  • Đã xác định các chế độ lỗi và thêm dữ liệu mục tiêu
  • Đã hoàn thành 2-4 vòng lặp gán nhãn → huấn luyện → kiểm tra
  • Kết quả đáp ứng kỳ vọng

Mô hình đã được huấn luyện và trông tốt? Chuyển sang Bước 5: Thiết Lập Đầu Ra.