Skip to main content

AI-POWERED DOCS

What do you want to know?

Cải Thiện Mô Hình Theo Thời Gian

Hệ thống kiểm tra của bạn đã được triển khai. Vậy làm thế nào để duy trì hiệu suất tốt khi điều kiện thay đổi, xuất hiện các loại lỗi mới, hoặc thông số kỹ thuật được cập nhật?

Library: Công cụ cải tiến liên tục của bạn

Mỗi hình ảnh được camera chụp đều được lưu trong Library, cùng với dự đoán của AI và điểm tin cậy (confidence score). Đây chính là kho báu để cải thiện mô hình.

Library view: browse captures, filter by prediction and confidence

Tìm những trường hợp AI dự đoán sai

  1. Vào Library
  2. Duyệt các hình ảnh đã chụp gần đây
  3. Chú ý hai điểm:
    • Misses: hình ảnh mà AI dự đoán rõ ràng sai (ô chọn ở góc trên bên trái của mỗi hình thu nhỏ)
    • Dự đoán có độ tin cậy thấp: cuộn xuống trên bất kỳ hình ảnh nào để xem giá trị confidence. Confidence thấp = AI không chắc chắn
Một hình ảnh gán nhãn sai có thể ảnh hưởng nghiêm trọng đến độ chính xác

Trong một tập dữ liệu nhỏ, một nhãn sai có tác động lớn không tương xứng. Với chỉ 5 hình ảnh huấn luyện, một nhãn sai làm hỏng 20% dữ liệu của bạn. Luôn kiểm tra kỹ từng nhãn trước khi retrain, đặc biệt khi tập dữ liệu còn nhỏ.

Retrain với dữ liệu có mục tiêu

  1. Chọn các hình ảnh mà AI dự đoán sai hoặc không chắc chắn
  2. Nhấp "Add to Active Recipe Train Set"
  3. Sửa nhãn nếu cần
  4. Nhấp Retrain

Adding Library images to your training set

Tập trung vào các trường hợp misses và hình có confidence thấp, không phải dữ liệu mới ngẫu nhiên. Đây là cách hiệu quả nhất để cải thiện.

Kiểm tra hình ảnh đã lưu với Metadata Viewer

Nếu bạn cần xem chính xác AI đã dự đoán gì trên một hình ảnh cụ thể, hãy tải file JPEG đã lưu lên Metadata Viewer. Camera OV nhúng kết quả dự đoán, điểm tin cậy và thiết lập camera trực tiếp vào từng hình ảnh đã chụp.

Sử dụng Haystack để phát hiện nhãn sai ở quy mô lớn

Khi tập dữ liệu của bạn lớn dần, việc kiểm tra thủ công từng nhãn trở nên không khả thi. Haystack cho phép bạn khám phá trực quan dữ liệu huấn luyện, phân cụm các hình ảnh tương tự và nhanh chóng phát hiện các nhãn trông không phù hợp. Hãy chạy công cụ này định kỳ để giữ tập dữ liệu sạch.

Quy trình cải thiện Classifier

  1. Xem lại hình ảnh trong Library → tìm lỗi và các dự đoán có độ tin cậy thấp
  2. Thêm chúng vào tập huấn luyện
  3. Gán lại nhãn nếu cần
  4. Retrain
  5. Sử dụng Haystack để khám phá dữ liệu trực quan và tìm các hình ảnh gán nhãn sai ở quy mô lớn

Quy trình cải thiện Segmenter

Segmenter mất nhiều thời gian hơn để gán nhãn (annotation ở cấp pixel), nên có một phương pháp tắt:

  1. Import các hình ảnh có vấn đề vào segmentation recipe
  2. Nhấp Generate Predictions để mô hình tự gán nhãn trước cho các hình ảnh mới hết khả năng có thể
  3. Sửa các dự đoán thay vì gán nhãn từ đầu (nhanh hơn nhiều)
  4. Retrain

Giảm false positive trong segmentation

Nếu segmenter của bạn đang phát hiện nhiều blob nhỏ ngẫu nhiên không đáng có, bạn có hai công cụ mạnh: lọc các blob nhỏ ra khỏi logic pass/fail, và huấn luyện mô hình hiểu rõ hơn về trạng thái "bình thường".

Lọc blob nhỏ bằng ngưỡng kích thước tối thiểu

Cách khắc phục nhanh nhất là yêu cầu hệ thống bỏ qua các blob có diện tích pixel dưới một ngưỡng nhất định. Các blob nhiễu nhỏ hầu như luôn nhỏ hơn nhiều so với lỗi thực tế, nên bộ lọc kích thước loại bỏ chúng mà không ảnh hưởng đến việc phát hiện thực tế.

Trong Basic Mode (IO Logic): Đặt ngưỡng minimum blob area trong thiết lập pass/fail. Bất kỳ blob nào nhỏ hơn số pixel này sẽ bị bỏ qua hoàn toàn. Bắt đầu với giá trị khoảng 50 pixels và điều chỉnh tăng lên cho đến khi nhiễu biến mất nhưng các lỗi thực vẫn được phát hiện.

Trong Advanced Mode (Node-RED): Lọc blob theo blob.pixel_count trong function node của bạn. Ví dụ, để bỏ qua bất kỳ blob nào dưới 50 pixels:

const minBlobSize = 50;
const allBlobs = msg.payload.segmentation.blobs;
const realBlobs = allBlobs.filter(blob => blob.pixel_count >= minBlobSize);
const results = realBlobs.length <1; // Pass if no real blobs remain
msg.payload = results;
return msg;

Điều chỉnh giá trị minBlobSize dựa trên ứng dụng của bạn. Xem số pixel của các blob nhiễu so với lỗi thực trong debug output để tìm ngưỡng cắt phù hợp.

Thêm hình ảnh tốt vào tập huấn luyện

Đây là cách hiệu quả nhất để giảm phát hiện false positive, và là điều mà mọi người thường bỏ qua nhất.

Vấn đề: nếu bạn chỉ huấn luyện với những hình ảnh có chứa lỗi, mô hình không bao giờ học được một linh kiện sạch trông như thế nào. Nó bắt đầu thấy "lỗi" trong kết cấu bề mặt bình thường, độ chuyển màu của ánh sáng và các biến thể nhỏ -- tất cả các blob nhỏ ngẫu nhiên mà bạn đang đối mặt.

Cách khắc phục:

  1. Vào Library và tìm hình ảnh các linh kiện tốt -- bề mặt sạch không có lỗi
  2. Thêm những hình ảnh này vào tập huấn luyện (Add to Active Recipe Train Set)
  3. Trong chế độ gán nhãn, chọn các ROI nhưng không thêm bất kỳ annotation lỗi nào. Chỉ đưa chúng vào như hiện trạng mà không có dấu vẽ
  4. Retrain mô hình

Bằng cách cho mô hình xem các ví dụ về "bình thường" trông như thế nào, bạn đang dạy nó ngừng gắn cờ các biến thể bề mặt thông thường là lỗi. Điều này giảm nhiễu đáng kể.

Hướng dẫn:

  • Bắt đầu với 3-5 hình ảnh tốt và retrain. Kiểm tra kết quả
  • Nếu nhiễu vẫn còn, thêm nhiều hơn. Nhắm tới ít nhất 20-30 hình ảnh tốt trộn lẫn với hình ảnh có lỗi
  • Điều này đặc biệt quan trọng nếu tập huấn luyện ban đầu chỉ chứa các hình ảnh có lỗi
  • Đảm bảo hình ảnh tốt bao phủ dải biến thể bình thường mà bạn thấy trong sản xuất (ánh sáng khác nhau, thay đổi màu nhẹ, kết cấu bề mặt)
Đây là cách khắc phục #1 cho segmenter bị nhiễu

Chín trong mười lần, khi có người phàn nàn về các blob nhỏ ngẫu nhiên xuất hiện khắp nơi, nguyên nhân gốc là tập huấn luyện không có hình ảnh tốt nào trong đó. Thêm chúng vào và retrain -- cải thiện thường là ngay lập tức và đáng kể.

Các mẹo khác để giảm nhiễu

  • Cải thiện tính nhất quán của ánh sáng. Ánh sáng không nhất quán tạo ra bóng và điểm sáng mà mô hình có thể nhầm thành lỗi. Đảm bảo các LED tích hợp được cấu hình đúng và nguồn sáng bên ngoài không gây lóa hoặc bóng di động
  • Kiểm tra căn chỉnh template. Nếu aligner hoạt động không tốt, ROI sẽ dịch chuyển giữa các lần chụp. Mô hình thấy các vùng nền khác nhau mỗi lần, làm tăng nhiễu. Xác nhận việc căn chỉnh ổn định
  • Sử dụng chế độ huấn luyện Accurate (production). Chế độ Development nhanh nhưng kém chính xác hơn nhiều. Luôn retrain ở chế độ production trước khi đánh giá chất lượng segmentation
  • Lặp lại từng bước nhỏ. Thêm 3-5 hình ảnh tốt, retrain, kiểm tra. Lặp lại cho đến khi kết quả sạch. Cách này nhanh hơn việc đổ 50 hình ảnh vào cùng lúc và hy vọng điều tốt nhất

Triết lý

  • Không bao giờ ngừng lặp lại. AI có khả năng học cao và tiếp tục cải thiện với 50, 100, thậm chí hơn 500 hình ảnh
  • Nhắm mục tiêu cụ thể vào các trường hợp thất bại. Đừng thêm dữ liệu ngẫu nhiên. Thêm các trường hợp mà AI gặp khó khăn
  • Kiểm tra nhãn sai thường xuyên. Khi tập dữ liệu của bạn lớn dần, nhãn sai trở nên khó phát hiện hơn nhưng vẫn ảnh hưởng đến độ chính xác

Tăng tốc với các công cụ GenAI

Ba công cụ được hỗ trợ bởi AI tại tools.overview.ai có thể tăng tốc đáng kể chu trình cải thiện của bạn:

  • Defect Studio -- Tạo hình ảnh lỗi tổng hợp chân thực nhanh hơn tới 10.000 lần so với chờ đợi lỗi thực tế
  • Integration Builder -- Xây dựng các flow Node-RED sẵn sàng cho production từ mô tả bằng tiếng Anh thông thường
  • AI Expert Helper -- Nhận hướng dẫn chuyên gia 24/7 cho bất kỳ câu hỏi nào về camera
Lợi thế của bộ công cụ GenAI

Cùng nhau, ba công cụ này có thể giảm thời gian triển khai từ nhiều ngày xuống còn vài giờ. Tạo dữ liệu huấn luyện tổng hợp thay vì chờ đợi lỗi thực tế, xây dựng integration bằng cách mô tả những gì bạn muốn và nhận hướng dẫn chuyên gia ngay lập tức mà không cần chờ support ticket.

Xem hướng dẫn đầy đủ về GenAI Toolkit