Skip to main content

AI-POWERED DOCS

What do you want to know?

Cải Thiện Mô Hình Theo Thời Gian

Quá trình kiểm tra của bạn đã được triển khai. Vậy làm thế nào để duy trì hiệu suất tốt khi điều kiện thay đổi, xuất hiện các loại lỗi mới, hoặc thông số kỹ thuật thay đổi?

Library: Công cụ cải tiến liên tục của bạn

Mỗi lần camera chụp ảnh đều được lưu vào Library, cùng với dự đoán của AI và điểm tin cậy (confidence score). Đây chính là mỏ vàng để cải tiến.

Chế độ xem Library: duyệt ảnh chụp, lọc theo dự đoán và độ tin cậy

Tìm những lỗi AI đã mắc phải

  1. Vào Library
  2. Duyệt các ảnh chụp gần đây
  3. Tìm hai điều:
    • Misses (Bỏ sót): những hình ảnh mà dự đoán của AI rõ ràng sai (ô đánh dấu ở góc trên bên trái của mỗi hình thu nhỏ)
    • Dự đoán có độ tin cậy thấp: cuộn xuống trên bất kỳ hình ảnh nào để xem giá trị độ tin cậy. Độ tin cậy thấp = AI không chắc chắn
Hình ảnh bị gán nhãn sai có thể ảnh hưởng đáng kể đến độ chính xác

Một hình ảnh bị gán nhãn sai trong một tập dữ liệu nhỏ có tác động rất lớn. Với chỉ 5 hình ảnh huấn luyện, một nhãn sai duy nhất sẽ làm hỏng 20% dữ liệu của bạn. Luôn kiểm tra kỹ nhãn trước khi huấn luyện lại, đặc biệt khi tập dữ liệu của bạn còn nhỏ.

Huấn luyện lại với dữ liệu có mục tiêu

  1. Chọn các hình ảnh mà AI đã dự đoán sai hoặc không chắc chắn
  2. Nhấp "Add to Active Recipe Train Set"
  3. Sửa nhãn nếu cần
  4. Nhấp Retrain

Thêm hình ảnh Library vào tập huấn luyện của bạn

Tập trung vào các trường hợp bỏ sót và ảnh chụp có độ tin cậy thấp, không phải dữ liệu mới ngẫu nhiên. Đây là cách hiệu quả nhất để cải thiện.

Kiểm tra hình ảnh đã lưu bằng Metadata Viewer

Nếu bạn cần xem chính xác AI đã dự đoán gì trên một hình ảnh cụ thể, hãy tải JPEG đã lưu lên Metadata Viewer. Camera OV nhúng kết quả dự đoán, điểm tin cậy, và cài đặt camera trực tiếp vào mỗi hình ảnh đã chụp.

Quy trình cải thiện Classifier

  1. Xem lại hình ảnh trong Library → tìm lỗi và các dự đoán có độ tin cậy thấp
  2. Thêm chúng vào tập huấn luyện
  3. Gán nhãn lại nếu cần
  4. Huấn luyện lại
  5. Sử dụng Haystack để khám phá dữ liệu trực quan và tìm hình ảnh bị gán nhãn sai ở quy mô lớn

Quy trình cải thiện Segmenter

Segmenter mất nhiều thời gian hơn để gán nhãn (chú thích cấp độ pixel), vì vậy có một lối tắt:

  1. Import các hình ảnh có vấn đề vào recipe phân đoạn
  2. Nhấp Generate Predictions để mô hình gán nhãn trước cho các hình ảnh mới tốt nhất có thể
  3. Sửa các dự đoán thay vì gán nhãn từ đầu (nhanh hơn nhiều)
  4. Huấn luyện lại
Sử dụng Haystack để phát hiện nhãn sai ở quy mô lớn

Haystack là công cụ khám phá dữ liệu trực quan cho phép bạn duyệt toàn bộ tập huấn luyện và nhanh chóng phát hiện các hình ảnh trông lạc lõng. Khi tập dữ liệu của bạn vượt quá 50-100 hình ảnh, việc xem xét thủ công trở nên không khả thi. Haystack phân cụm các hình ảnh tương tự lại với nhau, giúp các nhãn sai lạc loài nổi bật trực quan.

Giảm false positive trong phân đoạn

Nếu segmenter của bạn phát hiện nhiều blob nhỏ ngẫu nhiên không nên có, bạn có hai công cụ mạnh mẽ: lọc các blob nhỏ ra khỏi logic pass/fail, và huấn luyện mô hình để hiểu rõ hơn "bình thường" trông như thế nào.

Lọc các blob nhỏ với ngưỡng kích thước tối thiểu

Cách khắc phục nhanh nhất là yêu cầu hệ thống bỏ qua các blob dưới một diện tích pixel nhất định. Các blob nhiễu gần như luôn nhỏ hơn nhiều so với lỗi thực tế, vì vậy bộ lọc kích thước sẽ loại bỏ chúng mà không ảnh hưởng đến việc phát hiện thực tế của bạn.

Trong Basic Mode (IO Logic): Đặt ngưỡng minimum blob area trong cài đặt pass/fail. Bất kỳ blob nào nhỏ hơn số pixel này sẽ bị bỏ qua hoàn toàn. Bắt đầu với giá trị như 50 pixel và điều chỉnh tăng lên cho đến khi nhiễu biến mất nhưng lỗi thực tế vẫn kích hoạt.

Trong Advanced Mode (Node-RED): Lọc blob theo blob.pixel_count trong function node của bạn. Ví dụ, để bỏ qua bất kỳ blob nào dưới 50 pixel:

const minBlobSize = 50;
const allBlobs = msg.payload.segmentation.blobs;
const realBlobs = allBlobs.filter(blob => blob.pixel_count >= minBlobSize);
const results = realBlobs.length <1; // Pass if no real blobs remain
msg.payload = results;
return msg;

Điều chỉnh giá trị minBlobSize dựa trên ứng dụng của bạn. Xem số pixel của các blob nhiễu so với lỗi thực tế trong đầu ra debug để tìm điểm cắt phù hợp.

Thêm hình ảnh tốt vào tập huấn luyện

Đây là cách hiệu quả nhất để giảm phát hiện false positive, và đây cũng là cách mà mọi người thường bỏ qua nhất.

Vấn đề: nếu bạn chỉ huấn luyện với các hình ảnh có lỗi, mô hình chưa bao giờ học được chi tiết sạch trông như thế nào. Nó bắt đầu nhìn thấy "lỗi" trong kết cấu bề mặt bình thường, gradient ánh sáng và các biến đổi nhỏ -- tất cả những blob nhỏ ngẫu nhiên mà bạn đang phải đối phó.

Cách khắc phục:

  1. Vào Library và tìm hình ảnh của chi tiết tốt -- bề mặt sạch không có lỗi
  2. Thêm các hình ảnh này vào tập huấn luyện (Add to Active Recipe Train Set)
  3. Trong chế độ xem gán nhãn, chọn các ROI nhưng không thêm bất kỳ chú thích lỗi nào. Chỉ bao gồm chúng nguyên trạng mà không có dấu vẽ
  4. Huấn luyện lại mô hình

Bằng cách cho mô hình thấy ví dụ về "bình thường" trông như thế nào, bạn đang dạy nó ngừng đánh dấu các biến thể bề mặt thông thường là lỗi. Điều này giảm đáng kể nhiễu.

Hướng dẫn:

  • Bắt đầu với 3-5 hình ảnh tốt và huấn luyện lại. Kiểm tra kết quả
  • Nếu nhiễu vẫn tồn tại, thêm nữa. Hướng tới ít nhất 20-30 hình ảnh tốt trộn với hình ảnh lỗi
  • Điều này đặc biệt quan trọng nếu tập huấn luyện ban đầu của bạn chỉ chứa hình ảnh có lỗi
  • Đảm bảo các hình ảnh tốt bao phủ phạm vi biến thể bình thường mà bạn thấy trong sản xuất (ánh sáng khác nhau, dịch chuyển màu sắc nhẹ, kết cấu bề mặt)
Đây là cách khắc phục số 1 cho segmenter nhiễu

Chín trên mười lần, khi ai đó phàn nàn về các blob nhỏ ngẫu nhiên xuất hiện khắp nơi, nguyên nhân gốc rễ là tập huấn luyện không có hình ảnh tốt trong đó. Thêm chúng vào và huấn luyện lại -- sự cải thiện thường ngay lập tức và đáng kể.

Các mẹo khác để giảm nhiễu

  • Cải thiện tính nhất quán của ánh sáng. Ánh sáng không nhất quán tạo ra bóng tối và vùng sáng mà mô hình có thể nhầm lẫn với lỗi. Đảm bảo các LED tích hợp được cấu hình đúng và các nguồn sáng bên ngoài không gây ra chói hoặc bóng dịch chuyển
  • Kiểm tra căn chỉnh template. Nếu aligner không hoạt động tốt, ROI sẽ dịch chuyển giữa các lần chụp. Mô hình sẽ thấy các khu vực nền khác nhau mỗi lần, làm tăng nhiễu. Xác minh căn chỉnh ổn định
  • Sử dụng chế độ huấn luyện Accurate (production). Chế độ development nhanh nhưng kém chính xác hơn nhiều. Luôn huấn luyện lại ở chế độ production trước khi đánh giá chất lượng phân đoạn
  • Lặp từng bước nhỏ. Thêm 3-5 hình ảnh tốt, huấn luyện lại, kiểm tra. Lặp lại cho đến khi kết quả sạch. Điều này nhanh hơn là đưa 50 hình ảnh vào cùng một lúc và hy vọng vào điều tốt nhất

Triết lý

  • Không bao giờ ngừng lặp lại. AI có khả năng học cao, và nó tiếp tục cải thiện với 50, 100, thậm chí 500+ hình ảnh
  • Nhắm vào các thất bại cụ thể. Đừng thêm dữ liệu ngẫu nhiên. Thêm các trường hợp mà AI gặp khó khăn
  • Kiểm tra nhãn sai thường xuyên. Khi tập dữ liệu của bạn phát triển, các nhãn sai trở nên khó phát hiện hơn nhưng vẫn gây hại cho độ chính xác

Tăng tốc với các công cụ GenAI

Ba công cụ được hỗ trợ bởi AI tại tools.overview.ai có thể tăng tốc đáng kể chu kỳ cải tiến của bạn:

  • Defect Studio -- Tạo hình ảnh lỗi tổng hợp chân thực như ảnh thật nhanh hơn tới 10.000 lần so với chờ đợi lỗi thực tế
  • Integration Builder -- Xây dựng các luồng Node-RED sẵn sàng cho sản xuất từ mô tả bằng tiếng Anh đơn giản
  • AI Expert Helper -- Nhận hướng dẫn chuyên gia 24/7 cho bất kỳ câu hỏi nào về camera
Lợi thế của bộ công cụ GenAI

Cùng nhau, ba công cụ này có thể giảm thời gian triển khai của bạn từ nhiều ngày xuống còn vài giờ. Tạo dữ liệu huấn luyện tổng hợp thay vì chờ đợi lỗi thực tế, xây dựng tích hợp bằng cách mô tả những gì bạn muốn, và nhận hướng dẫn chuyên gia tức thì mà không cần chờ đợi ticket hỗ trợ.

Xem hướng dẫn đầy đủ về GenAI Toolkit