AI-POWERED DOCS
What do you want to know?
Tạo Recipe Đầu Tiên
Phần đi sâu này giải thích Recipe là gì, nêu rõ sự khác biệt giữa Classification và Segmentation, và cung cấp hướng dẫn từng bước để tạo một Recipe. Nó cũng bao gồm hướng dẫn chi tiết về cấu hình Imaging Setup, chụp Template Image và thiết lập Aligner, tối ưu hóa ROI, thu thập dữ liệu và huấn luyện AI, cũng như cấu hình tăng cường hình ảnh.
Xem chủ đề này trong thực tế: Cách tạo một recipe segmentation trong vài phút
Mục Tiêu Học Tập
Sau khi hoàn thành phần đi sâu này, bạn sẽ hiểu:
- recipe là gì
- sự khác biệt giữa classification và segmentation – và khi nào nên sử dụng từng loại
- cách tạo một recipe
- cách cấu hình Imaging Setup
- cách chụp Template Image và cấu hình Aligner
- ROI (Regions of Interest) là gì và cách tối ưu hóa chúng
- thu thập dữ liệu để huấn luyện AI
- Kiểm Thử và Xác Nhận recipe
Recipe Là Gì?
- Một bộ hướng dẫn được cấu hình chỉ dẫn camera cách kiểm tra một bộ phận hoặc sản phẩm cụ thể.
- Xác định cài đặt camera, bao gồm exposure, focus, và các thông số chiếu sáng để chụp hình ảnh nhất quán.
- Bao gồm logic xử lý như định nghĩa ROI, Aligner, các lớp classification hoặc segmentation.
- Lưu trữ cấu hình input/output để tích hợp với các hệ thống tự động hóa cho tín hiệu pass/fail hoặc các tín hiệu nâng cao.
- Có thể được lưu và tái sử dụng để đảm bảo kiểm tra nhất quán giữa các ca làm việc, dây chuyền hoặc nhà máy.
Classification và Segmentation
Định Nghĩa
- Classification: Xác định loại đối tượng trong ROI
- Segmentation: Định vị và phân tích các vùng trong hình ảnh/ROI
Ví Dụ
| Image Classification | Image Segmentation | Image Classification | Image Segmentation |
|---|---|---|---|
| Con cừu là gì? | Pixel nào thuộc về đối tượng nào? | Chiếc pizza này đạt yêu cầu hay bị lỗi? | Mỗi miếng pepperoni ở đâu? |
![]() | ![]() | ![]() | ![]() |
So Sánh Chính
| Classification | Segmentation | |
|---|---|---|
| Tốc độ | Tốc độ phụ thuộc vào Image Setup và độ phức tạp. Thường hiệu quả và nhanh chóng với các thiết lập đơn giản | Có thể nhanh tương đương hoặc thậm chí nhanh hơn classification khi được tối ưu hóa, đặc biệt với các mô hình tinh gọn |
| Độ chính xác | Tốt cho pass/fail tổng thể hoặc xác định loại bộ phận | Độ chính xác cao hơn cho định vị lỗi chính xác |
| Độ phức tạp | Đơn giản để thiết lập và duy trì; ít thông số hơn | Phức tạp – Cần nhiều dữ liệu, gán nhãn và tinh chỉnh hơn |
| Yêu cầu dữ liệu | Thấp – Cần ít hình ảnh được gán nhãn | Trung bình – Yêu cầu nhiều hình ảnh với chú thích chính xác đến từng pixel |
| Trường hợp sử dụng | Sự hiện diện của bộ phận, định hướng, kiểm tra chất lượng cơ bản, bộ phận đã lắp/chưa lắp v.v. | Lỗi bề mặt, kiểm tra đặc điểm chi tiết, phát hiện nhiều lỗi, đếm, đo lường v.v. |
Tạo và Xuất Recipe
Sử dụng nút Export Recipe bên cạnh một Recipe để xuất một Recipe riêng lẻ.
Sử dụng nút Export ở đầu màn hình để xuất nhiều Recipe cùng một lúc.

Sử dụng nút Import ở đầu màn hình để nhập Recipe.

Lưu ý: Mỗi recipe chỉ hỗ trợ một loại kiểm tra tại một thời điểm, hoặc segmentation hoặc classification. Hãy chọn đúng loại trước khi bắt đầu thiết lập.
Thiết Lập Hình Ảnh
Focus
- Định nghĩa: Điều chỉnh độ sắc nét của hình ảnh được chụp.
- Cách sử dụng: Trượt cho đến khi các cạnh và chi tiết trong hình ảnh trở nên sắc nét và rõ ràng.
Sử dụng một vật thể mục tiêu có các cạnh rõ ràng (như thước kẻ hoặc thẻ hiệu chuẩn) khi lấy nét.
Image Rotation
- Định nghĩa: Xoay hình ảnh (0° hoặc 180°).
- Khi nào sử dụng: Khi camera được lắp ở một góc nhưng bạn muốn hình ảnh hiển thị theo hướng khác trong giao diện.
Nếu bạn cần xoay hình ảnh 90°, hãy xoay camera.
Exposure (ms)
- Định nghĩa: Thời gian cảm biến tiếp xúc với ánh sáng trong quá trình chụp ảnh.
- Tác động:
- Exposure cao hơn → hình ảnh sáng hơn, nhưng có nguy cơ bị nhòe chuyển động.
- Exposure thấp hơn → ít ánh sáng hơn, nhưng hình ảnh sắc nét hơn trong các ứng dụng có chuyển động nhanh.
| Thiếu sáng | Phơi sáng đúng | Quá sáng |
|---|---|---|
Exposure là logarit, và exposure cao hơn đồng nghĩa với độ trễ cao hơn (vì cần nhiều thời gian hơn để chụp ảnh).
Gain
- Định nghĩa: Làm sáng hình ảnh một cách kỹ thuật số (giống như ISO trên máy ảnh).
- Tác động:
- Gain cao hơn → hình ảnh sáng hơn, nhưng tăng nhiễu (hình ảnh bị hạt).
- Gain thấp hơn → hình ảnh sạch hơn, nhưng cần ánh sáng tốt.
| Gain Cao | Gain Thấp |
|---|---|
![]() | ![]() |
| Sáng hơn và nhiễu hơn | Tối hơn và ít nhiễu hơn |
Chỉ tăng gain nếu việc điều chỉnh exposure hoặc ánh sáng là không khả thi.
Auto White Balance
- Định nghĩa: Tự động điều chỉnh cân bằng màu sao cho màu trắng hiển thị đúng là màu trắng.
- Khi nào sử dụng:
- Lý tưởng cho môi trường có điều kiện ánh sáng thay đổi hoặc dao động.
- Đối với các thiết lập ổn định, cân bằng trắng thủ công mang lại kết quả nhất quán và có thể lặp lại.
Để điều chỉnh cân bằng trắng thủ công:
- Bật ON nút chuyển Auto White Balance.
- Đặt một tờ giấy trắng dưới camera hoặc trước ống kính.
- Tắt nút chuyển OFF để khóa cài đặt cân bằng trắng.
Gamma
- Là gì: Điều chỉnh độ sáng của các vùng tông trung gian mà không ảnh hưởng quá nhiều đến vùng tối hoặc sáng.
- Tác dụng: Hữu ích để làm rõ chi tiết trong vùng bóng tối hoặc giảm các vùng sáng quá mức.
Lens Correction
- Là gì: Khắc phục méo hình từ ống kính góc rộng.
- Khi nào kích hoạt: Nếu các cạnh của hình ảnh trông cong hoặc bị méo, hãy bật tính năng này ON để đảm bảo độ chính xác trong các tác vụ căn chỉnh.
LED Strobe Mode
- Là gì: Điều khiển thời điểm đèn LED tích hợp của camera kích hoạt.
- Tùy chọn:
- Off: Đèn LED bật liên tục.
- On: Đèn LED chỉ nhấp nháy trong quá trình chụp, giúp giảm phản chiếu.
LED Light Pattern
- Là gì: Lựa chọn cách các đèn LED phát sáng (ví dụ: Tất cả bật, tất cả tắt, Trái và phải, trên và dưới, v.v.).
- Trường hợp sử dụng: Điều chỉnh dựa trên thiết lập ánh sáng của bạn để chiếu sáng bộ phận một cách tối ưu.
Sử dụng các pattern chiếu sáng theo hướng để giảm chói hoặc phản chiếu bằng cách tắt các đèn LED chiếu trực tiếp vào bề mặt phản chiếu, trong khi vẫn giữ các nguồn sáng nghiêng hoạt động để có khả năng quan sát tốt hơn.
LED Light Intensity
- Là gì: Điều chỉnh độ sáng của ánh sáng LED.
- Thực hành tốt nhất: Bắt đầu với mức thấp và tăng dần để tránh chói hoặc phản chiếu.
Photometric Control
- Là gì: Chụp nhiều hình ảnh (thường là bốn) với các hướng chiếu sáng khác nhau (trái, phải, trên và dưới) sau đó kết hợp chúng thành một hình ảnh nâng cao duy nhất.
- Mục đích: Kỹ thuật này giảm bóng tối và làm nổi bật các đặc điểm bề mặt tinh tế bằng cách cung cấp ánh sáng đồng đều, nhất quán trên bộ phận.
- Khi nào sử dụng: Lý tưởng cho các bộ phận phức tạp, bề mặt phản chiếu cao, hoặc các bộ phận có kết cấu không đồng đều, nơi mà hình ảnh chụp với một nguồn sáng tiêu chuẩn có thể bỏ sót các chi tiết quan trọng.
Trigger Settings
Manual Trigger
- Là gì: Chụp hình ảnh khi bạn nhấn nút trên màn hình HMI.
- Phù hợp nhất cho: Kiểm thử, thiết lập, hoặc kiểm tra thủ công.
Hardware Trigger
- Là gì: Sử dụng tín hiệu điện (ví dụ: từ một cảm biến) để kích hoạt camera.
- Phù hợp nhất cho: Các dây chuyền tự động nơi cảm biến phát hiện sự có mặt của bộ phận.
PLC Trigger
- Là gì: Tín hiệu kích hoạt được gửi qua bộ điều khiển công nghiệp (PLC) để đồng bộ hoạt động với các máy khác.
- Phù hợp nhất cho: Các hệ thống hoàn toàn tự động yêu cầu thời gian chính xác.
Aligner Trigger
- Là gì: Tự động kích hoạt khi hệ thống phát hiện sự căn chỉnh của bộ phận trong trường nhìn.
- Phù hợp nhất cho: Các ứng dụng mà bộ phận cần được định vị nhất quán trước khi chụp hoặc khi không có các trigger đáng tin cậy nào khác.
Interval Trigger
- Là gì: Kích hoạt camera theo các khoảng thời gian định sẵn.
- Phù hợp nhất cho: Các quy trình liên tục hoặc giám sát các dây chuyền chuyển động mà không có cảm biến phát hiện bộ phận.
Template Image and Alignment
Skip Aligner
- Là gì: Tắt bước căn chỉnh trong quá trình kiểm tra.
- Khi nào sử dụng: Khi bộ phận luôn ở cùng một vị trí và hướng trong hình ảnh.
Template Regions
- Là gì: Xác định (các) vùng của hình ảnh template được sử dụng để căn chỉnh.
- Rectangle: Vẽ một vùng quan tâm hình chữ nhật.
- Circle: Vẽ một vùng quan tâm hình tròn.
- Ignore Template Region: Loại trừ các vùng nhất định khỏi quá trình căn chỉnh để tránh các họa tiết gây nhiễu hoặc các đặc điểm không liên quan.
- Cách sử dụng tốt nhất: Giúp hệ thống chỉ tập trung vào các đặc điểm nổi bật nhất của bộ phận để căn chỉnh chính xác.
Rotation Range
- Là gì: Đặt mức độ xoay (theo độ) mà hệ thống sẽ chấp nhận khi khớp bộ phận với template.
- Ví dụ: Đặt ±20° cho phép bộ phận xoay nhẹ nhưng vẫn được phát hiện.
- Khi nào điều chỉnh: Tăng nếu các bộ phận có xu hướng xoay trong quá trình sản xuất; giảm đối với các hướng có tính nhất quán cao.
Sensitivity
- Là gì: Kiểm soát mức độ tinh chỉnh mà hệ thống tìm kiếm sự khớp giữa hình ảnh trực tiếp và template.
- Hiệu ứng:
- Độ nhạy cao → phát hiện các chi tiết tinh tế hơn, hữu ích cho các bộ phận phức tạp.
- Độ nhạy thấp hơn → giảm các kết quả khớp sai nhưng có thể bỏ sót các đặc điểm nhỏ.
Confidence Threshold
- Là gì: Đặt điểm tin cậy tối thiểu cần thiết để hệ thống chấp nhận một phát hiện.
- Hiệu ứng:
- Ngưỡng cao hơn → ít kết quả dương tính giả hơn nhưng có thể bỏ sót các kết quả khớp ở ranh giới.
- Ngưỡng thấp hơn → nhiều phát hiện hơn, nhưng tăng rủi ro về kết quả dương tính giả.
Bắt đầu ở mức trung bình và điều chỉnh dựa trên kết quả thử nghiệm.
Scale Invariant
- Là gì: Cho phép hệ thống phát hiện các bộ phận lớn hơn hoặc nhỏ hơn một chút so với hình ảnh template ban đầu.
- Khi nào kích hoạt: Nếu kích thước bộ phận có thể thay đổi nhẹ do vị trí, thay đổi khoảng cách hoặc dung sai sản xuất.
Live Preview Legend

1. Một bounding box có thể cấu hình xác định vùng cụ thể trong trường nhìn FOV của camera để giám sát trong quá trình kích hoạt (triggering).
- Mục đích: Đảm bảo camera chỉ tập trung vào vùng có liên quan, bỏ qua các vùng nền không cần thiết.
- Cách sử dụng tốt nhất:
- Đối với các đối tượng chuyển động, để đảm bảo bộ phận nằm hoàn toàn trong vùng phát hiện.
- Để tối ưu hóa tốc độ xử lý bằng cách giảm lượng dữ liệu hình ảnh được phân tích.
2. Một chấm đỏ trực quan hiển thị điểm trung tâm của tất cả các ROI (Regions of Interest) đã xác định trong hình ảnh.
- Mục đích: Giúp bạn căn chỉnh và định vị vùng tìm kiếm so với bộ phận hoặc khung nhìn camera.
3. Đường màu xanh lá cho biết cạnh của đối tượng đã được phát hiện.
Nếu bạn thấy đường này chuyển sang màu đỏ, hãy thử tăng kích thước ROI, điều chỉnh ROI hoặc tăng Sensitivity.

Định Nghĩa và Tối Ưu Hóa ROI (Region of Interest)
Loại Kiểm Tra
- Là gì: Xác định loại kiểm tra đang được thực hiện và nhóm các ROI (Regions of Interest) tương tự lại với nhau.
- Ví dụ: "Holes" để kiểm tra sự hiện diện, kích thước hoặc chất lượng của các lỗ trên một bộ phận.
- Tính năng chính:
- Add Inspection Type: Tạo các danh mục mới cho các yêu cầu kiểm tra khác nhau.
- # of ROIs: Hiển thị số lượng ROI hiện được gán cho loại kiểm tra đó.
Transformation

- Là gì: Điều chỉnh vị trí và hình học của các ROI được chọn để căn chỉnh và đặt vị trí một cách chính xác.
- Các trường và mục đích của chúng:
- Height/Width: Thay đổi kích thước của ROI.
- X / Y: Di chuyển vị trí của ROI theo trục ngang (X) và trục dọc (Y).
- Angle: Xoay ROI quanh tâm của nó.
- Sử dụng tốt nhất: Tăng tốc quá trình thiết lập khi bạn có các mẫu lặp lại, chẳng hạn như nhiều lỗ giống hệt nhau.
Regions of Interest (ROIs)

- Là gì: Danh sách tất cả các ROI được định nghĩa trong hình ảnh template.
- Tính năng:
- Add Region of Interest (ROI): Tạo một ROI mới theo cách thủ công.
- Ignore Regions: Loại trừ các vùng cụ thể khỏi quá trình xử lý.
- Edit: Lưu, xóa hoặc hủy.
- Lock Icon: Cho biết các ROI đã bị khóa và không thể di chuyển nếu không mở khóa.
Chế Độ Live Preview
- Là gì: Hiển thị phản hồi theo thời gian thực sau khi điều chỉnh hoặc thêm ROI.
- Trường hợp sử dụng: Rất hữu ích để tinh chỉnh vị trí và kích thước ROI trong quá trình thiết lập.
Nút Test
- Là gì: Chạy backtesting dựa trên các hình ảnh cũ để xác minh các thay đổi.
- Trường hợp sử dụng: So sánh kết quả hiện tại với các cài đặt trước đó để đảm bảo độ chính xác và tính nhất quán.
Thu Thập Dữ Liệu và Huấn Luyện AI
Xác định các lớp kiểm tra khác nhau và gán nhãn cho từng ROI dựa trên loại kiểm tra được chỉ định (xem ví dụ bên dưới).

Sử dụng Annotation Tools để gán nhãn/chú thích hình ảnh. Sử dụng menu thả xuống Brush Class để chọn lớp cần chú thích. Giới hạn hiện tại là tối đa 10 lớp cho mỗi recipe đối với segmentation.

Tầm quan trọng của dữ liệu tốt

-
Garbage In, Garbage Out: Các mô hình AI chỉ tốt khi dữ liệu bạn cung cấp cho chúng tốt. Dữ liệu kém chất lượng hoặc không nhất quán sẽ dẫn đến kết quả không chính xác.
-
Sự đa dạng rất quan trọng: Thu thập dữ liệu đại diện cho tất cả các biến thể trong thực tế: các ca làm việc khác nhau, điều kiện ánh sáng, vị trí bộ phận và tình trạng bề mặt.
-
Chất lượng hơn số lượng: Một bộ dữ liệu nhỏ hơn, sạch và được gán nhãn tốt thường hoạt động tốt hơn một bộ dữ liệu lớn nhưng nhiễu hoặc không nhất quán.
Kiến Thức Cơ Bản về Annotation:
- Classification: Gắn thẻ toàn bộ hình ảnh hoặc ROI thành một lớp cụ thể (ví dụ: "Good", "Damaged").
- Segmentation: Tô, vẽ đường viền hoặc làm nổi bật các khu vực quan tâm cụ thể với độ chính xác ở cấp độ pixel (ví dụ: vị trí vết xước trên bề mặt).
- Tính nhất quán: Sử dụng các quy tắc và định nghĩa nhất quán cho việc gán nhãn để tránh nhầm lẫn trong quá trình huấn luyện.

Những Sai Lầm Phổ Biến
- Dữ liệu không đủ: Quá ít mẫu sẽ dẫn đến underfitting, gây ra hiệu suất kém trong thực tế.
- Các lớp mất cân bằng: Một lớp được biểu diễn quá nhiều (ví dụ: nhiều bộ phận "good" nhưng ít bộ phận lỗi) sẽ làm sai lệch mô hình.
- Gán nhãn kém: Việc gán nhãn không chính xác, không nhất quán hoặc vội vàng dẫn đến giảm đáng kể độ chính xác.
- Bỏ qua các thay đổi của môi trường: Không cập nhật bộ dữ liệu khi ánh sáng, hướng bộ phận hoặc tình trạng bề mặt thay đổi sẽ dẫn đến trôi (drift) độ chính xác.
- Không xác thực dữ liệu: Bỏ qua kiểm tra chất lượng trước khi huấn luyện thường dẫn đến lãng phí thời gian và phải làm lại.
Data Augmentation
Image augmentations chỉnh sửa nhân tạo các hình ảnh huấn luyện của bạn để cải thiện độ bền vững của model. Chúng mô phỏng các biến thể trong thế giới thực như thay đổi độ sáng, xoay, hoặc nhiễu để model hoạt động tốt trong các điều kiện khác nhau.
Color Augmentations

Brightness
- Định nghĩa: Điều chỉnh độ sáng tối của hình ảnh.
- Trường hợp sử dụng: Để xử lý những thay đổi nhỏ về ánh sáng trong quá trình sản xuất.
Sử dụng ±0.1 cho các thiết lập ổn định; tăng lên nếu ánh sáng thay đổi nhiều hơn.
Contrast
- Định nghĩa: Thay đổi sự khác biệt giữa các vùng sáng và tối.
- Trường hợp sử dụng: Hữu ích cho các bộ phận có kết cấu hoặc bề mặt đa dạng, giúp model thích ứng với các khác biệt về thị giác.
Hue
- Định nghĩa: Dịch chuyển nhẹ các tông màu.
- Trường hợp sử dụng: Phù hợp cho các thiết lập mà màu của ánh sáng (ví dụ: nhiệt độ LED) có thể thay đổi theo thời gian.
Saturation
- Định nghĩa: Điều chỉnh cường độ của màu sắc.
- Trường hợp sử dụng: Giúp xử lý các biến thể trong ánh sáng làm cho hình ảnh xuất hiện mờ hơn hoặc rực rỡ hơn.
Geometric Augmentations

Rotation Range
- Định nghĩa: Xoay hình ảnh ngẫu nhiên trong phạm vi đã đặt (ví dụ: ±20°).
- Trường hợp sử dụng: Cho các bộ phận có thể đến ở vị trí hơi xoay.
Tránh xoay quá mức đối với các bộ phận thường được cố định về hướng.
Flip
- Định nghĩa: Lật hình ảnh theo chiều ngang, chiều dọc, hoặc cả hai.
- Trường hợp sử dụng: Hữu ích cho các bộ phận đối xứng hoặc khi hướng có thể bị lật trong quá trình xử lý.
Lighting & Color Simulation
Planckian
- Định nghĩa: Mô phỏng các biến thể về nhiệt độ màu (ví dụ: ánh sáng ấm hoặc lạnh).
- Trường hợp sử dụng: Xử lý các ca làm việc khác nhau hoặc các work cell với các nguồn sáng khác nhau.
Gaussian Noise
- Định nghĩa: Thêm nhiễu nhẹ vào hình ảnh.
- Trường hợp sử dụng: Cải thiện độ bền vững nếu môi trường sản xuất của bạn có nhiễu thị giác nhỏ hoặc các ảnh giả từ cảm biến camera.
Motion Simulation

Motion Blur
- Định nghĩa: Mô phỏng độ mờ nhẹ như thể bộ phận di chuyển trong lúc chụp.
- Trường hợp sử dụng: Quan trọng đối với các dây chuyền tốc độ cao nơi có thể xảy ra hiện tượng mờ do chuyển động.
Probability (prob)
- Định nghĩa: Đặt khả năng áp dụng mỗi augmentation trong quá trình huấn luyện.
- Ví dụ: 0.50 = 50% khả năng áp dụng thay đổi đó cho bất kỳ hình ảnh huấn luyện nào.
Bắt đầu ở mức 0.5 cho hầu hết các augmentation và điều chỉnh dựa trên sự biến đổi trong thực tế.
Training Parameters (Segmentation)
Training parameters (còn gọi là hyperparameters) là các cài đặt kiểm soát cách mô hình machine learning học từ dữ liệu.
Learning Rate
- Định nghĩa: Kiểm soát tốc độ model cập nhật các trọng số nội bộ trong quá trình huấn luyện.
- Giá trị (0.003): Learning rate càng cao, model học càng nhanh, nhưng quá cao có thể gây ra sự không ổn định hoặc độ chính xác kém.
- Phạm vi Slider: Từ 10^-4 (rất chậm) đến 10^-1 (rất nhanh).
Thông thường, giá trị từ 0.001–0.01 là điểm khởi đầu tốt cho các tác vụ segmentation.
Kích thước ROI (Region of Interest)
- Định nghĩa: Xác định kích thước (chiều rộng × chiều cao) của vùng ảnh được sử dụng trong quá trình huấn luyện.
- Không chọn: Theo mặc định, mô hình tự động xác định ROI dựa trên dữ liệu của bạn.
- Khi được chọn: Bạn có thể thiết lập chiều rộng và chiều cao thủ công nếu cần kích thước đầu vào nhất quán (ví dụ: tất cả hình ảnh được cắt thành 256×256 pixel).
Sử dụng kích thước cố định (ví dụ: 256×256) khi tập dữ liệu của bạn có hình ảnh với kích thước khác nhau và bạn muốn đầu vào nhất quán để có tính ổn định, tính tái lập tốt hơn, hoặc để khớp với một kiến trúc mô hình đã biết.
Để hệ thống tự động chọn khi dữ liệu của bạn đã có độ phân giải đồng nhất hoặc khi bạn muốn hệ thống tối ưu hóa region of interest tốt nhất dựa trên đặc điểm của tập dữ liệu.
Số Lần Lặp (Epochs)
- Định nghĩa: Một epoch = một lượt đi qua toàn bộ tập dữ liệu huấn luyện.
- Giá trị (100): Mô hình sẽ huấn luyện qua 100 lượt hoàn chỉnh.
Tăng số này thường cải thiện độ chính xác đến một mức nào đó nhưng mất nhiều thời gian hơn.
Quy tắc chung: Theo dõi training loss và validation loss trong quá trình huấn luyện. Nếu validation loss ngừng giảm trong khi training loss vẫn tiếp tục giảm, đó là dấu hiệu mô hình đang bị overfitting và bạn nên dừng huấn luyện sớm hơn.
Kiến Trúc
- Định nghĩa: Chọn kích thước và độ phức tạp của mạng nơ-ron.
- Small: Huấn luyện nhanh hơn và thường đủ cho hầu hết các tập dữ liệu. Lý tưởng cho thử nghiệm nhanh hoặc các tập dữ liệu nhỏ hơn.
- Các mô hình lớn hơn có thể nắm bắt nhiều chi tiết hơn nhưng có thể bị overfitting trên các tập dữ liệu nhỏ, trong khi các mô hình nhỏ hơn hiệu quả hơn và tổng quát hóa tốt hơn khi dữ liệu bị hạn chế.
Bắt đầu với Small, nó thường đã đủ và giúp bạn lặp lại nhanh hơn trước khi mở rộng quy mô.
External GPU
Liên hệ Support để biết thêm về External GPU.
Tham Số Huấn Luyện (Classification)
Các tham số huấn luyện (còn gọi là hyperparameters) là các thiết lập kiểm soát cách một mô hình machine learning học từ dữ liệu.
Learning Rate
- Định nghĩa: Kiểm soát tốc độ mô hình cập nhật các trọng số nội bộ trong quá trình huấn luyện.
- Giá trị (0.003): Learning rate càng cao, mô hình học càng nhanh, nhưng quá cao có thể gây mất ổn định hoặc độ chính xác kém.
- Phạm Vi Thanh Trượt: Từ 10^-4 (rất chậm) đến 10^-1 (rất nhanh).
Thông thường, giá trị từ 0.001–0.01 là điểm khởi đầu tốt cho các tác vụ segmentation.
Phần Trăm Validation
- Định nghĩa: Xác định phần dữ liệu nào trong tập dữ liệu của bạn sẽ được dành riêng để validation (kiểm tra trong quá trình huấn luyện).
- Mục đích: Dữ liệu validation giúp theo dõi mô hình hoạt động tốt như thế nào trên các ví dụ chưa thấy, ngăn ngừa overfitting.
- Phạm vi: 0–50%.
Lựa chọn phổ biến là 10–20%.
Nếu đặt ở 0%, toàn bộ dữ liệu được sử dụng để huấn luyện, điều này có thể cải thiện độ chính xác huấn luyện nhưng khiến việc phát hiện overfitting khó khăn hơn.
Kích thước ROI (Region of Interest)
- Định nghĩa: Xác định kích thước (chiều rộng × chiều cao) của vùng ảnh được sử dụng trong quá trình huấn luyện.
- Không chọn: Theo mặc định, model sẽ tự động xác định ROI dựa trên dữ liệu của bạn.
- Khi được chọn: Bạn có thể đặt thủ công chiều rộng và chiều cao nếu cần kích thước đầu vào nhất quán (ví dụ: tất cả hình ảnh được cắt thành 256×256 pixel).
Sử dụng kích thước cố định (ví dụ: 256×256) khi tập dữ liệu của bạn có hình ảnh với kích thước khác nhau và bạn muốn đầu vào nhất quán để có độ ổn định, khả năng tái tạo tốt hơn hoặc để phù hợp với kiến trúc model đã biết.
Hãy để hệ thống tự động chọn khi dữ liệu của bạn đã có độ phân giải đồng nhất hoặc khi bạn muốn hệ thống tối ưu hóa vùng quan tâm tốt nhất dựa trên đặc điểm của tập dữ liệu.
Số Lần Lặp (Epochs)
- Định nghĩa: Một epoch = một lần đi qua toàn bộ tập dữ liệu huấn luyện.
- Giá trị (100): Model sẽ huấn luyện trong 100 lần đi qua hoàn chỉnh.
Tăng số này thường cải thiện độ chính xác đến một mức nào đó nhưng mất nhiều thời gian hơn.
Quy tắc kinh nghiệm: Theo dõi training loss và validation loss trong quá trình huấn luyện. Nếu validation loss ngừng giảm trong khi training loss vẫn tiếp tục giảm, đó là dấu hiệu model đang bị overfitting và bạn nên dừng huấn luyện sớm hơn.
Kiến Trúc
- Định nghĩa: Chọn kích thước và độ phức tạp của mạng nơ-ron.
- Small: Huấn luyện nhanh hơn và thường đủ dùng cho hầu hết các tập dữ liệu. Lý tưởng cho việc thử nghiệm nhanh hoặc các tập dữ liệu nhỏ hơn.
Bắt đầu với Small, nó thường đủ và giúp bạn lặp lại nhanh hơn trước khi mở rộng quy mô.
| Kiến Trúc và Camera | Mô Tả | Khuyến Nghị Sử Dụng |
|---|---|---|
| ConvNeXt-Pico | Model siêu nhẹ được tối ưu hóa cho tốc độ và sử dụng ít bộ nhớ. | Tuyệt vời cho các thử nghiệm nhanh hoặc phần cứng hạn chế. |
| ConvNeXt-Nano | Lớn hơn một chút so với Pico; độ chính xác tốt hơn với chi phí thêm tối thiểu. | Cân bằng tốt cho các tập dữ liệu nhỏ–trung bình. |
| ConvNeXt-Tiny | Cung cấp độ chính xác được cải thiện trong khi vẫn hiệu quả. | Phù hợp cho các tập dữ liệu vừa phải và quá trình huấn luyện dài hơn. |
| ConvNeXt-Small | Biến thể có khả năng nhất trong danh sách này. Dung lượng và độ chính xác cao hơn. | Sử dụng cho các tập dữ liệu lớn hoặc khi cần hiệu suất tối đa. |
GPU Ngoài
Liên hệ với bộ phận Hỗ Trợ để biết thêm về GPU ngoài.





