Skip to main content

AI-POWERED DOCS

What do you want to know?

Bước 4: Huấn Luyện Mô Hình AI Của Bạn

Các vùng kiểm tra đã được thiết lập. Bây giờ là lúc dạy cho AI biết "tốt" và "xấu" trông như thế nào.

Ba nguyên tắc cơ bản của việc huấn luyện

Trước khi làm bất cứ điều gì khác, hãy ghi nhớ ba nguyên tắc này. Chúng áp dụng cho dù bạn đang huấn luyện classifier hay segmenter, với 5 hình ảnh hay 500.

Nguyên tắc 1: Gán nhãn chỉ dựa vào hình ảnh

Không bao giờ nhìn vào bộ phận vật lý (hoặc đặt nó dưới kính hiển vi) để quyết định xem nó tốt hay xấu. Nếu bạn không thể thấy lỗi trong hình ảnh từ camera, AI không thể học được nó.

AI không phải là phép màu. Nó chỉ có thể làm việc với những gì camera nhìn thấy. Nếu bạn gán nhãn một bộ phận là "lỗi" dựa trên điều gì đó bạn nhận thấy khi chạm vào hoặc phóng to dưới kính lúp, nhưng hình ảnh camera trông vẫn ổn, bạn đang dạy cho AI nhìn thấy thứ không tồn tại.

Nếu bạn không thể gán nhãn chỉ từ hình ảnh, hãy quay lại bước Install và sửa lại thiết lập vật lý: ống kính tốt hơn, ánh sáng tốt hơn, lắp đặt gần hơn, góc chụp khác.

Nguyên tắc 2: Kiểm tra lại nhãn hai, ba lần

Gán nhãn sai xảy ra với bất kỳ ai; ngay cả các kỹ sư có kinh nghiệm cũng mắc phải. Nhưng chỉ một nhãn sai trong một tập dữ liệu nhỏ có thể phá hủy kết quả của bạn.

Với 5 hình ảnh huấn luyện, một nhãn sai sẽ làm hỏng 20% dữ liệu huấn luyện của bạn. Đó là thảm họa.

Trước mỗi lần huấn luyện: Nhấp vào View All ROIs và xác minh từng chú thích một. Đây là việc dễ sửa nhất và có tác động lớn nhất.

Nguyên tắc 3: Bắt đầu nhỏ, lặp nhanh

Đừng gán nhãn 50 hình ảnh rồi nhấn train. Thay vào đó, hãy tạo một vòng lặp chặt chẽ: Gán nhãn 3-5 hình ảnh mỗi lớp, huấn luyện ở chế độ development (khoảng 30 giây), thử nghiệm và cố gắng phá nó, sau đó thêm dữ liệu có mục tiêu vào những nơi nó thất bại. Lặp lại chu trình này 2-4 lần ở chế độ development, sau đó chuyển sang chế độ production.

Vòng lặp này là con đường nhanh nhất đến một mô hình tốt. Chạy nó 2-4 lần ở chế độ development, sau đó chuyển sang chế độ production.

Quy trình huấn luyện từng bước

1. Chụp các hình ảnh huấn luyện ban đầu

Với recipe đang hoạt động và các bộ phận đang chạy qua (hoặc đặt thủ công), hãy chụp các hình ảnh. Bạn cần tối thiểu 3-5 hình ảnh mỗi lớp để bắt đầu.

Đối với kiểm tra pass/fail đơn giản:

  • 3-5 hình ảnh của các bộ phận tốt
  • 3-5 hình ảnh của các bộ phận lỗi

2. Xác định các lớp của bạn

Trong giao diện gán nhãn, thêm các lớp mà mỗi loại kiểm tra cần. Đối với một classifier, điều này có thể là:

  • Pass / Fail
  • Present / Absent
  • Good / Scratched / Cracked

Giữ cho đơn giản lúc đầu. Bạn luôn có thể thêm các lớp sau.

3. Gán nhãn các hình ảnh

Giao diện gán nhãn và huấn luyện

Đối với mỗi ROI trong mỗi hình ảnh, gán nhãn lớp chính xác:

  • Classifier: Chọn lớp từ danh sách thả xuống (ví dụ: "pass" hoặc "fail")
  • Segmenter: Sử dụng công cụ cọ để tô các vùng lỗi từng pixel một
Classification gán nhãn nhanh hơn

Nếu bạn không chắc nên sử dụng classification hay segmentation, hãy bắt đầu với classification. Việc gán nhãn nhanh hơn nhiều và phù hợp với hầu hết các tình huống pass/fail. Xem Classifier vs. Segmenter để được hướng dẫn.

4. Huấn luyện ở Development Mode

Nhấp vào Train và chọn Development Mode. Quá trình này mất khoảng 30 giây và tạo ra một mô hình có độ chính xác thấp hơn khoảng 20 lần so với production, nhưng đủ để kiểm tra tín hiệu.

"Kiểm tra tín hiệu" nghĩa là gì: AI có đang bắt đầu học được sự khác biệt giữa tốt và xấu không? Hay nó đang sai hoàn toàn?

  • Nếu hầu hết đúng → tín hiệu tốt, tiếp tục
  • Nếu hoàn toàn sai → có gì đó không ổn. Kiểm tra các nhãn sai, kiểm tra kích thước ROI, kiểm tra chất lượng hình ảnh

5. Kiểm Tra với Live Preview

Live preview mode: testing your model in real time

Nhấp vào Live Preview Mode và cho các bộ phận chạy qua. Quan sát kết quả:

  • Nó có nhận diện đúng các trường hợp dễ không?
  • Nó gặp khó khăn ở đâu?
  • Các trường hợp ranh giới là gì?

Hãy thử làm nó thất bại. Tìm các trường hợp mà nó không xử lý được. Những thất bại này chính là lộ trình để bạn cải thiện.

6. Thêm dữ liệu có mục tiêu

Đừng thêm các hình ảnh mới một cách ngẫu nhiên. Hãy thêm các hình ảnh nhắm cụ thể vào các chế độ thất bại mà bạn đã phát hiện:

  • Nếu nó nhầm lẫn giữa vết xước và phản xạ ánh sáng, hãy thêm nhiều ví dụ về cả hai
  • Nếu nó bỏ sót các lỗi nhỏ, hãy thêm nhiều hình ảnh về các lỗi nhỏ
  • Nếu nó thất bại với các bộ phận ở góc, hãy thêm nhiều ví dụ ở góc

7. Huấn luyện lại và kiểm tra lại

Lặp lại các bước 4-6 từ hai đến bốn lần. Mỗi lần lặp sẽ cải thiện độ chính xác.

8. Chuyển sang Production Mode

Khi development mode đã hoạt động tương đối tốt, hãy chuyển sang Production Mode. Quá trình này mất 5-10 phút nhưng tạo ra một mô hình có độ chính xác cao gấp khoảng 20 lần so với development mode.

Nếu development mode đạt 80% các trường hợp đúng, thì production mode có khả năng đạt trên 95%.

Augmentations: dạy AI xử lý sự biến đổi

Augmentations điều chỉnh ngẫu nhiên các hình ảnh huấn luyện của bạn trong quá trình huấn luyện, như điều chỉnh độ sáng, thêm xoay, tinh chỉnh độ tương phản, v.v. Mỗi hình ảnh được đưa vào AI hàng trăm lần với các augmentation hơi khác nhau, nhưng nhãn vẫn giữ nguyên.

Điều này cực kỳ mạnh mẽ để xây dựng tính mạnh mẽ của mô hình. Nếu ánh sáng của bạn thay đổi giữa các ca làm việc, brightness augmentation sẽ dạy AI xử lý điều đó. Nếu các bộ phận có thể đến ở bất kỳ góc độ nào, rotation augmentation làm cho hướng trở nên không quan trọng.

Khi nào nên sử dụng augmentations

AugmentationSử dụng khi...Kịch bản ví dụ
BrightnessÁnh sáng thay đổi (ngày/đêm, bóng tối)Đèn trần nhà máy thay đổi trong suốt cả ngày
RotationBộ phận có thể đến ở bất kỳ góc độ nàoLỗ vít, nơi hướng không quan trọng
Motion blurBộ phận di chuyển nhanh hoặc camera rungBăng chuyền tốc độ cao
SaturationMàu sắc không phải là yếu tố kiểm tra của bạnCùng một bộ phận với các màu khác nhau nên đều đạt
ContrastÁnh sáng môi trường dao độngÁnh sáng theo mùa qua cửa sổ

Khi nào KHÔNG nên sử dụng augmentations

Đừng augment chính thứ bạn đang kiểm tra

Đây là con dao hai lưỡi. Nếu bạn thêm rotation augmentation nhưng bạn đang kiểm tra liệu các bộ phận có được định hướng đúng hay không, bạn sẽ dạy AI rằng các bộ phận bị lộn ngược vẫn "tốt."

  • Kiểm tra tính nhất quán của màu sắc? Đừng sử dụng saturation augmentation
  • Kiểm tra độ mờ/nét? Đừng sử dụng motion blur augmentation
  • Kiểm tra hướng? Đừng sử dụng rotation augmentation

Quy tắc: Augment mọi thứ trừ thuộc tính cụ thể mà bạn đang kiểm tra.

Tính đa dạng của dữ liệu rất quan trọng

Dữ liệu huấn luyện của bạn nên đại diện cho toàn bộ phạm vi mà AI sẽ nhìn thấy trong production:

  • Các thời điểm khác nhau trong ngày (nếu ánh sáng thay đổi)
  • Các lô bộ phận khác nhau (bề mặt hoàn thiện có thể hơi khác nhau)
  • Các bộ phận ở các vị trí khác nhau trong khung hình
  • Cả các trường hợp dễ và khó

Tập trung vào các trường hợp khó nhất. Nếu dữ liệu huấn luyện của bạn bao gồm 10 bộ phận khó phân loại nhất, thì 90% các bộ phận dễ sẽ trở nên đơn giản đối với AI.

Khả năng học cao

AI của camera OV được thiết kế để tiếp tục cải thiện với nhiều dữ liệu hơn. Không giống như nhiều hệ thống AI dừng cải thiện sau 20 hình ảnh, mô hình này tiếp tục cải thiện với 50, 100, thậm chí hơn 500 hình ảnh. Hầu hết các kiểm tra đều hoạt động tốt với 5-10 hình ảnh, nhưng nếu bạn có vấn đề phức tạp với nhiều loại lỗi, đừng ngần ngại tiếp tục thêm dữ liệu.

Tăng tốc với dữ liệu tổng hợp: Defect Studio

Sẽ thế nào nếu bạn cần huấn luyện cho một lỗi hiếm khi gặp? Một con vít bị thiếu mà bạn phải cố ý tháo ra, một vết xước mà bạn phải tạo ra, một vết nứt xảy ra một lần trên một nghìn bộ phận? Chờ đợi hàng tháng để thu thập đủ ví dụ là không thực tế.

OV Auto-Defect Creator Studio tại tools.overview.ai giải quyết vấn đề này. Nó tạo ra các hình ảnh lỗi tổng hợp chân thực, nhanh hơn tới 10.000 lần so với việc chờ đợi các lỗi thực tế xuất hiện trên dây chuyền sản xuất.

Cách thức hoạt động: 5 bước đơn giản

  1. Tải lên một hình ảnh tốt của bộ phận
  2. Đánh dấu khu vực mà lỗi sẽ xuất hiện
  3. Mô tả lỗi bằng tiếng Anh đơn giản (ví dụ: "deep scratch across the surface" hoặc "missing solder joint")
  4. Tạo các biến thể lỗi (AI tạo ra kết quả chân thực)
  5. Xuất các hình ảnh tổng hợp trực tiếp vào bộ huấn luyện của bạn

Tại sao dữ liệu tổng hợp hoạt động hiệu quả

Các hình ảnh được tạo không chỉ là những tạo tác "dán lên". Chúng là các biến thể chân thực phù hợp với điều kiện ánh sáng thực tế, góc camera và bề mặt bộ phận của bạn. AI hiểu được vật lý của cách các lỗi xuất hiện dưới các điều kiện hình ảnh cụ thể của bạn.

Các trường hợp sử dụng:

  • Lỗi hiếm gặp: Huấn luyện cho các chế độ lỗi mà bạn chưa từng (hoặc hiếm khi) thấy
  • Ra mắt sản phẩm mới: Xây dựng một hệ thống kiểm tra trước khi bộ phận lỗi đầu tiên rời khỏi dây chuyền
  • Các trường hợp biên: Tạo các ví dụ biên để cải thiện ranh giới quyết định của AI
  • Bổ sung dữ liệu: Bổ sung cho các tập dữ liệu nhỏ với sự đa dạng tổng hợp

Xem thực tế

Bắt đầu với dữ liệu thực, tăng tốc với dữ liệu tổng hợp

Cách tiếp cận tốt nhất: huấn luyện với 3-5 hình ảnh thực ban đầu trước, xác định nơi AI gặp khó khăn, sau đó sử dụng Defect Studio để tạo các ví dụ tổng hợp có mục tiêu cho các chế độ lỗi cụ thể đó. Dữ liệu thực dạy đường cơ sở; dữ liệu tổng hợp lấp đầy các khoảng trống.

Danh sách kiểm tra huấn luyện

Trước khi tiếp tục, hãy xác nhận:

  • Đã chụp hình ảnh ban đầu, tối thiểu 3-5 hình cho mỗi lớp
  • Tất cả các nhãn đã được kiểm tra lại (View All ROIs)
  • Đã huấn luyện chế độ development và kiểm tra với Live Preview
  • Đã xác định các chế độ lỗi và thêm dữ liệu có mục tiêu
  • Đã hoàn thành 2-4 lần lặp của gán nhãn → huấn luyện → kiểm tra
  • Đã huấn luyện chế độ production; kết quả đáp ứng kỳ vọng

Mô hình đã được huấn luyện và trông ổn? Chuyển sang Bước 5: Thiết Lập Outputs.