Skip to main content

AI-POWERED DOCS

What do you want to know?

Bước 4: Huấn Luyện Mô Hình AI Của Bạn

Các vùng quan tâm (ROI) của bạn đã được thiết lập. Bây giờ là lúc dạy AI biết thế nào là "tốt" và "xấu".

Ba quy tắc cốt lõi của việc huấn luyện

Trước hết, hãy ghi nhớ ba quy tắc này. Chúng áp dụng cho dù bạn đang huấn luyện một classifier hay segmenter, với 5 hình ảnh hay 500.

Quy tắc 1: Gán nhãn chỉ dựa trên hình ảnh

Không bao giờ nhìn vào bộ phận vật lý (hoặc đặt nó dưới kính hiển vi) để quyết định xem nó tốt hay xấu. Nếu bạn không thể nhìn thấy lỗi trong hình ảnh camera, AI không thể học được.

AI không phải là phép màu. Nó chỉ có thể làm việc với những gì camera nhìn thấy. Nếu bạn gán nhãn một bộ phận là "lỗi" dựa trên điều bạn nhận thấy khi chạm vào hoặc phóng to dưới kính lúp, nhưng hình ảnh camera trông vẫn ổn, bạn đang dạy AI nhìn thấy thứ không tồn tại.

Nếu bạn không thể gán nhãn chỉ từ hình ảnh, hãy quay lại bước Install và sửa thiết lập vật lý: ống kính tốt hơn, ánh sáng tốt hơn, lắp đặt gần hơn, góc khác.

Quy tắc 2: Kiểm tra nhãn hai và ba lần

Việc gán nhãn sai xảy ra với tất cả mọi người; các kỹ sư có kinh nghiệm cũng vậy. Nhưng một nhãn sai trong một tập dữ liệu nhỏ có thể phá hủy kết quả của bạn.

Với 5 hình ảnh huấn luyện, một nhãn sai làm hỏng 20% dữ liệu huấn luyện của bạn. Đó là một thảm họa.

Trước mỗi lần chạy huấn luyện: Nhấp vào View All ROIs và xác minh từng chú thích một. Đây là điều dễ sửa nhất và có tác động lớn nhất.

Quy tắc 3: Bắt đầu nhỏ, lặp lại nhanh

Đừng gán nhãn 50 hình ảnh rồi nhấn huấn luyện. Thay vào đó, hãy tạo một vòng lặp chặt chẽ: Gán nhãn 10-15 hình ảnh cho mỗi class, huấn luyện (khoảng 30 giây), kiểm tra và cố gắng làm cho nó thất bại, sau đó thêm dữ liệu có mục tiêu vào nơi nó thất bại. Lặp lại chu kỳ này 2-4 lần.

Vòng lặp này là con đường nhanh nhất đến một mô hình tốt.

Quy trình huấn luyện từng bước

1. Chụp hình ảnh huấn luyện ban đầu

Với recipe của bạn đang hoạt động và các bộ phận đang chạy qua (hoặc được đặt thủ công), hãy chụp hình ảnh. Bạn cần tối thiểu 10-15 hình ảnh cho mỗi class để bắt đầu.

Đối với kiểm tra pass/fail đơn giản:

  • 10-15 hình ảnh của các bộ phận tốt
  • 10-15 hình ảnh của các bộ phận lỗi

2. Định nghĩa các class

Chọn loại mô hình bạn đang huấn luyện, sau đó đọc hướng dẫn tương ứng. Nút chuyển đổi bên dưới được đồng bộ giữa Bước 2 và Bước 3, và lựa chọn của bạn được lưu trong URL để nó tồn tại sau khi làm mới hoặc chia sẻ.

Trong giao diện gán nhãn, hãy thêm các class mà mỗi loại kiểm tra cần. Các tập class classifier thông dụng:

  • Pass / Fail
  • Present / Absent
  • Good / Scratched / Cracked

Hãy giữ đơn giản lúc đầu. Bạn luôn có thể thêm các class sau.

3. Gán nhãn hình ảnh

Gán nhãn Classifier: chọn một lớp cho mỗi ROI từ danh sách thả xuống

Mỗi ROI nhận được lớp phân loại riêng — chọn lớp mô tả ROI đó trong hình ảnh đó (ví dụ: "pass" hoặc "fail").

Phân loại nhanh hơn khi gán nhãn

Nếu bạn không chắc nên sử dụng classification hay segmentation, hãy bắt đầu với classification. Việc gán nhãn nhanh hơn nhiều và phù hợp với hầu hết các kịch bản pass/fail. Xem Classifier vs. Segmenter để được hướng dẫn.

4. Huấn luyện mô hình

Nhấp vào Train. Classifier cung cấp hai chế độ huấn luyện:

  • Fast mode — khoảng 30 giây đến một phút. Tốt nhất cho việc lặp lại nhanh chóng trong quá trình thiết lập, kiểm tra nhanh nhãn của bạn và các bộ phận dễ/được phân biệt rõ ràng. Độ chính xác thấp hơn production mode nhưng nó cho phép bạn nhìn thấy tín hiệu nhanh chóng.
  • Production mode — mất nhiều thời gian hơn nhưng tạo ra một mô hình chính xác hơn rõ rệt. Luôn sử dụng Production mode trước khi triển khai vào dây chuyền. Đối với các bộ phận khó, các lỗi khó phân biệt, hoặc bất cứ điều gì bạn sẽ tin tưởng trong production, Production mode là lựa chọn đúng đắn.

Một nhịp độ tốt: lặp lại trong Fast mode trong khi bạn đang dọn dẹp nhãn và thêm dữ liệu, sau đó chạy Production khi kết quả trông tốt — và một lần nữa trước khi triển khai.

5. Kiểm Tra với Live Preview

Nhấp vào Live Preview Mode và cho các bộ phận chạy qua. Quan sát kết quả:

  • Nó có xử lý đúng các trường hợp dễ không?
  • Nó gặp khó khăn ở đâu?
  • Đâu là các trường hợp ranh giới?

Hãy cố gắng làm cho nó thất bại. Tìm những trường hợp mà nó thất bại. Những thất bại này là lộ trình để cải thiện.

Classifier live preview: per-ROI verdicts and confidence scores

Bảng Test hiển thị class dự đoán và confidence score cho mỗi ROI. Hãy chạy thử vài lần chụp và tìm các phán đoán có độ tin cậy thấp (thường dưới 70%) — đó là các trường hợp ranh giới và là các bộ phận đáng được gán nhãn tiếp theo nhất.

6. Thêm dữ liệu có mục tiêu

Đừng thêm hình ảnh mới ngẫu nhiên. Thêm hình ảnh nhắm cụ thể vào các chế độ thất bại mà bạn đã tìm thấy:

  • Nếu nó nhầm lẫn giữa vết xước và phản chiếu, hãy thêm nhiều ví dụ về cả hai
  • Nếu nó bỏ sót các lỗi nhỏ, hãy thêm nhiều hình ảnh về các lỗi nhỏ
  • Nếu nó thất bại với các bộ phận ở góc, hãy thêm nhiều ví dụ ở góc

7. Huấn luyện lại và kiểm tra lại

Lặp lại các bước 4-6 từ hai đến bốn lần. Mỗi lần lặp sẽ cải thiện độ chính xác. Để có hướng dẫn chi tiết hơn — bao gồm cách thêm hình ảnh mới vào mô hình hiện có mà không mất quá trình huấn luyện trước đó — hãy xem Thêm Dữ Liệu & Huấn Luyện Lại.

Augmentations: dạy AI xử lý biến thể

Augmentations chỉnh sửa ngẫu nhiên hình ảnh huấn luyện của bạn trong quá trình huấn luyện — điều chỉnh độ sáng, thêm xoay, tinh chỉnh độ tương phản, v.v. Mỗi hình ảnh được đưa vào AI hàng trăm lần với các augmentations hơi khác nhau, nhưng nhãn vẫn giữ nguyên. Đây là cách bạn làm cho mô hình trở nên mạnh mẽ trước các điều kiện thực tế mà không cần phải chụp ví dụ cho mọi biến thể có thể xảy ra.

Những gì nên bật mặc định

Một lượng nhỏ biến thể brightness (độ sáng) gần như luôn đáng được bật — ngay cả nhà máy được kiểm soát chặt chẽ nhất cũng có đèn trần nhấp nháy, bóng đổ thay đổi theo ca làm việc, và LED bị trôi nhẹ theo thời gian. Brightness augmentation giúp mô hình chống chịu được tất cả những điều đó về cơ bản miễn phí.

Rotation: hữu ích, nhưng hãy chú ý hình dạng ROI

Rotation augmentation rất tuyệt nếu các bộ phận của bạn thực sự có thể đến với các góc khác nhau (ốc vít lỏng trên băng tải, các bộ phận được đặt bằng tay, bất cứ thứ gì không được giữ trong một đồ gá). Nhưng nó tương tác với hình dạng ROI:

  • ROI vuông: rotation augmentation hoạt động hoàn hảo — hình ảnh đã xoay vẫn nằm gọn trong khung ROI.
  • ROI không vuông trên classifier: xoay có thể cắt hình ảnh. Khi một ROI cao và hẹp bị xoay 45°, các góc của nội dung đã xoay sẽ rơi ra ngoài khung và mô hình sẽ huấn luyện trên hình ảnh không đầy đủ. Nếu bộ phận của bạn có thể xoay, hãy hoặc là làm cho ROI vuông hoặc dựa vào Aligner để xử lý xoay ở giai đoạn trước, để bạn không cần rotation augmentation ở đây.
  • Segmenter: vấn đề cắt tương tự cũng áp dụng, nhưng segmentation ít nhạy cảm hơn vì nó học từ mặt nạ pixel thay vì toàn bộ hình dạng ROI.

Khi KHÔNG nên sử dụng một phép augmentation cụ thể

Quy tắc chung: đừng augment thuộc tính mà bạn đang kiểm tra. Nếu bạn đang cố gắng phát hiện hướng, augmentation xoay sẽ dạy cho model rằng các bộ phận bị lộn ngược vẫn là "tốt."

  • Kiểm tra độ đồng nhất màu sắc? Đừng sử dụng augmentation độ bão hòa.
  • Kiểm tra độ mờ/nét? Đừng sử dụng augmentation motion blur.
  • Kiểm tra hướng? Đừng sử dụng augmentation xoay (và có lẽ cũng không nên sử dụng Aligner).

Sự đa dạng dữ liệu rất quan trọng

Dữ liệu huấn luyện của bạn nên đại diện cho toàn bộ phạm vi những gì AI sẽ thấy trong sản xuất:

  • Các thời điểm khác nhau trong ngày (nếu ánh sáng thay đổi)
  • Các lô bộ phận khác nhau (bề mặt hoàn thiện có thể hơi khác)
  • Các bộ phận ở các vị trí khác nhau trong khung hình
  • Cả các trường hợp dễ và khó

Tập trung vào các trường hợp khó nhất. Nếu dữ liệu huấn luyện của bạn bao gồm 10 bộ phận khó phân loại nhất, thì 90% các bộ phận dễ sẽ trở nên đơn giản đối với AI.

Khả năng học cao

AI của camera OV được thiết kế để liên tục cải thiện với nhiều dữ liệu hơn. Không giống như nhiều hệ thống AI bị chững lại sau 20 hình ảnh, model này tiếp tục cải thiện với 50, 100, thậm chí hơn 500 hình ảnh. Hầu hết các kiểm tra hoạt động tốt với 5-10 hình ảnh, nhưng nếu bạn có một vấn đề đa lỗi phức tạp, đừng ngần ngại tiếp tục thêm dữ liệu.

Tăng tốc với dữ liệu tổng hợp: Defect Studio

Sẽ thế nào nếu bạn cần huấn luyện cho một lỗi mà bạn hiếm khi thấy? Một con vít bị thiếu mà bạn phải cố ý tháo ra, một vết xước mà bạn phải tự tạo, một vết nứt xảy ra một lần trên một nghìn bộ phận? Chờ đợi hàng tháng để thu thập đủ ví dụ là không thực tế.

OV Auto-Defect Creator Studio tại tools.overview.ai giải quyết vấn đề này. Nó tạo ra các hình ảnh lỗi tổng hợp chân thực, nhanh hơn tới 10.000 lần so với việc chờ đợi các lỗi thực xuất hiện trên dây chuyền sản xuất.

Cách hoạt động: 5 bước đơn giản

  1. Tải lên một hình ảnh tốt của bộ phận của bạn
  2. Đánh dấu khu vực nơi lỗi nên xuất hiện
  3. Mô tả lỗi bằng tiếng Anh đơn giản (ví dụ: "deep scratch across the surface" hoặc "missing solder joint")
  4. Tạo các biến thể lỗi (AI tạo ra các kết quả chân thực như ảnh thật)
  5. Xuất các hình ảnh tổng hợp trực tiếp vào tập huấn luyện của bạn

Tại sao dữ liệu tổng hợp hoạt động

Các hình ảnh được tạo ra không chỉ là các thành phần "dán lên". Chúng là các biến thể chân thực như ảnh thật, phù hợp với ánh sáng, góc camera và bề mặt bộ phận thực tế của bạn. AI hiểu được vật lý của cách các lỗi trông như thế nào trong điều kiện chụp ảnh cụ thể của bạn.

Các trường hợp sử dụng:

  • Lỗi hiếm: Huấn luyện cho các chế độ lỗi mà bạn chưa bao giờ (hoặc hiếm khi) thấy
  • Ra mắt sản phẩm mới: Xây dựng kiểm tra trước khi bộ phận lỗi đầu tiên xuất hiện trên dây chuyền
  • Trường hợp biên: Tạo các ví dụ ranh giới để cải thiện ranh giới quyết định của AI
  • Augmentation dữ liệu: Bổ sung các tập dữ liệu nhỏ với sự đa dạng tổng hợp

Xem hoạt động thực tế

Bắt đầu với dữ liệu thực, tăng tốc với dữ liệu tổng hợp

Cách tiếp cận tốt nhất: huấn luyện với 3-5 hình ảnh thực ban đầu trước, xác định những nơi AI gặp khó khăn, sau đó sử dụng Defect Studio để tạo các ví dụ tổng hợp có mục tiêu cho các chế độ lỗi cụ thể đó. Dữ liệu thực dạy nền tảng cơ bản; dữ liệu tổng hợp lấp đầy các khoảng trống.

Danh sách kiểm tra huấn luyện

Trước khi tiếp tục, hãy xác nhận:

  • Đã chụp hình ảnh ban đầu, tối thiểu 10-15 hình mỗi lớp
  • Tất cả nhãn đã được kiểm tra lại (View All ROIs)
  • Đã huấn luyện và kiểm tra với Live Preview
  • Đã xác định các chế độ lỗi và bổ sung dữ liệu mục tiêu
  • Đã hoàn thành 2-4 vòng lặp gán nhãn → huấn luyện → kiểm tra
  • Kết quả đáp ứng kỳ vọng

Mô hình đã được huấn luyện và đạt yêu cầu? Chuyển sang Bước 5: Thiết Lập Đầu Ra.