AI-POWERED DOCS
What do you want to know?
Tạo Recipe Đầu Tiên
Phần tìm hiểu chuyên sâu này giải thích Recipe là gì, nêu rõ sự khác biệt giữa Classification và Segmentation, và cung cấp hướng dẫn từng bước về cách tạo Recipe. Nó cũng bao gồm hướng dẫn chi tiết về cấu hình Imaging Setup, chụp Template Image và thiết lập Alignment, tối ưu hóa ROI, thu thập dữ liệu và huấn luyện AI, cũng như cấu hình tăng cường hình ảnh (image augmentation).
Xem chủ đề này trong thực tế: Cách tạo một segmentation recipe trong vài phút
Mục Tiêu Học Tập
Khi kết thúc phần tìm hiểu chuyên sâu này, bạn sẽ hiểu được:
- recipe là gì
- sự khác biệt giữa classification và segmentation – và khi nào nên sử dụng từng loại
- cách tạo một recipe
- cách cấu hình Imaging Setup
- cách chụp Template Image và cấu hình Aligner
- ROI (Regions of Interest) là gì và cách tối ưu hóa chúng
- thu thập dữ liệu để huấn luyện AI
- Kiểm Thử và Xác Thực recipe
Recipe Là Gì?
- Là một tập hợp các hướng dẫn được cấu hình cho camera biết cách kiểm tra một bộ phận hoặc sản phẩm cụ thể.
- Xác định cài đặt camera, bao gồm exposure, focus và các thông số ánh sáng để chụp ảnh nhất quán.
- Bao gồm logic xử lý như định nghĩa ROI, Aligner, các class classification hoặc segmentation.
- Lưu trữ cấu hình input/output để tích hợp với các hệ thống tự động hóa cho tín hiệu pass/fail hoặc các tín hiệu nâng cao.
- Có thể được lưu và tái sử dụng để đảm bảo kiểm tra nhất quán giữa các ca làm việc, dây chuyền hoặc cơ sở sản xuất.
Classification và Segmentation
Định Nghĩa
- Classification: Nhận diện loại đối tượng trong ROI
- Segmentation: Định vị và phân tích các vùng trong hình ảnh/ROI
Ví Dụ
| Image Classification | Image Segmentation | Image Classification | Image Segmentation |
|---|---|---|---|
| Đây có phải là cừu không? | Những pixel nào thuộc về đối tượng nào? | Chiếc pizza này đạt yêu cầu hay bị lỗi? | Mỗi miếng pepperoni ở đâu? |
![]() | ![]() | ![]() | ![]() |
So Sánh Chính
| Classification | Segmentation | |
|---|---|---|
| Tốc độ | Tốc độ phụ thuộc vào Image Setup và độ phức tạp. Nhìn chung hiệu quả và nhanh với các thiết lập đơn giản | Có thể nhanh bằng hoặc thậm chí nhanh hơn classification khi được tối ưu hóa, đặc biệt với các model được tinh gọn |
| Độ chính xác | Phù hợp cho pass/fail tổng thể hoặc nhận diện loại bộ phận | Độ chính xác cao hơn cho việc định vị lỗi chính xác |
| Độ phức tạp | Đơn giản để thiết lập và bảo trì; ít thông số hơn | Phức tạp – Cần nhiều dữ liệu, gán nhãn và điều chỉnh hơn |
| Yêu cầu dữ liệu | Thấp – Cần ít hình ảnh được gán nhãn hơn | Trung bình – Yêu cầu nhiều hình ảnh với chú thích chính xác đến từng pixel |
| Trường hợp sử dụng | Sự hiện diện của bộ phận, định hướng, kiểm tra chất lượng cơ bản, bộ phận được lắp/không được lắp, v.v. | Lỗi bề mặt, kiểm tra đặc điểm nhỏ, phát hiện đa lỗi, đếm, đo lường, v.v. |
Tạo và Xuất Recipe
Sử dụng nút Export Recipe bên cạnh một Recipe để xuất một Recipe riêng lẻ.
Sử dụng nút Export ở đầu màn hình để xuất nhiều Recipe cùng lúc.

Sử dụng nút Import ở đầu màn hình để nhập Recipe.

Lưu ý: Mỗi recipe chỉ hỗ trợ một loại kiểm tra tại một thời điểm, hoặc là segmentation hoặc là classification. Hãy chọn đúng loại trước khi bắt đầu thiết lập.
Thiết Lập Hình Ảnh
Focus
- Là gì: Điều chỉnh độ sắc nét của hình ảnh được chụp.
- Cách sử dụng: Trượt cho đến khi các cạnh và chi tiết trong hình ảnh trông rõ ràng và sắc nét.
Sử dụng một vật thể mẫu có cạnh rõ ràng (như thước kẻ hoặc thẻ hiệu chuẩn) khi lấy nét.
Image Rotation
- Là gì: Xoay hình ảnh (0° hoặc 180°).
- Khi nào sử dụng: Nếu camera được lắp ở một góc nhưng bạn muốn hình ảnh hiển thị theo hướng khác trong giao diện.
Nếu bạn cần xoay hình ảnh 90°, hãy xoay camera.
Exposure (ms)
- Là gì: Thời gian cảm biến tiếp xúc với ánh sáng trong quá trình chụp ảnh.
- Hiệu ứng:
- Exposure cao hơn → hình ảnh sáng hơn, nhưng có nguy cơ bị nhòe chuyển động.
- Exposure thấp hơn → ít ánh sáng hơn, nhưng hình ảnh sắc nét hơn trong các ứng dụng chuyển động nhanh.
| Thiếu sáng | Phơi sáng đúng | Dư sáng |
|---|---|---|
Exposure là logarit, và exposure cao hơn đồng nghĩa với độ trễ cao hơn (vì cần nhiều thời gian hơn để chụp ảnh).
Gain
- Là gì: Làm sáng hình ảnh một cách nhân tạo bằng kỹ thuật số (giống như ISO trên máy ảnh).
- Hiệu ứng:
- Gain cao hơn → hình ảnh sáng hơn, nhưng thêm nhiễu (hình ảnh bị hạt).
- Gain thấp hơn → hình ảnh sạch hơn, nhưng cần ánh sáng tốt.
| Gain Cao | Gain Thấp |
|---|---|
![]() | ![]() |
| Sáng hơn và nhiễu hơn | Tối hơn và ít nhiễu hơn |
Chỉ tăng gain nếu không thể điều chỉnh exposure hoặc ánh sáng.
Auto White Balance
- Là gì: Tự động điều chỉnh cân bằng màu sắc sao cho màu trắng hiển thị đúng là màu trắng.
- Khi nào sử dụng:
- Lý tưởng cho môi trường có điều kiện ánh sáng thay đổi hoặc biến động.
- Đối với thiết lập ổn định, cân bằng trắng thủ công cung cấp kết quả nhất quán và có thể lặp lại hơn.
Để điều chỉnh cân bằng trắng thủ công:
- Bật ON nút Auto White Balance.
- Đặt một tờ giấy trắng dưới camera hoặc trước ống kính.
- Tắt nút OFF để khóa cài đặt cân bằng trắng.
Gamma
- Là gì: Điều chỉnh độ sáng của các tông màu trung gian mà không ảnh hưởng quá nhiều đến các vùng tối hoặc sáng.
- Tác dụng: Hữu ích để làm rõ chi tiết trong vùng tối hoặc giảm các vùng sáng quá chói.
Lens Correction
- Là gì: Hiệu chỉnh méo hình từ ống kính góc rộng.
- Khi nào bật: Nếu các cạnh của hình ảnh bị cong hoặc méo, hãy bật tính năng này để đảm bảo độ chính xác trong các tác vụ căn chỉnh.
LED Strobe Mode
- Là gì: Điều khiển thời điểm đèn LED tích hợp của camera được kích hoạt.
- Tùy chọn:
- Off: Đèn LED sáng liên tục.
- On: Đèn LED chỉ nhấp nháy trong khi chụp, giúp giảm phản xạ.
LED Light Pattern
- Là gì: Chọn cách các đèn LED phát sáng (ví dụ: Tất cả bật, tất cả tắt, Trái và phải, trên và dưới, v.v.).
- Trường hợp sử dụng: Điều chỉnh dựa trên cấu hình ánh sáng của bạn để chiếu sáng bộ phận một cách tối ưu.
Sử dụng các mẫu chiếu sáng theo hướng để giảm lóa hoặc phản xạ bằng cách tắt các đèn LED chiếu trực tiếp vào bề mặt phản xạ, đồng thời giữ các nguồn sáng nghiêng để quan sát tốt hơn.
LED Light Intensity
- Là gì: Điều chỉnh độ sáng của đèn LED.
- Thực hành tốt nhất: Bắt đầu với cường độ thấp và tăng dần để tránh lóa hoặc phản xạ.
Photometric Control
- Là gì: Chụp nhiều hình ảnh (thường là bốn) với các hướng chiếu sáng khác nhau (trái, phải, trên và dưới) rồi kết hợp chúng thành một hình ảnh nâng cao duy nhất.
- Mục đích: Kỹ thuật này giảm bóng đổ và làm nổi bật các chi tiết bề mặt tinh tế bằng cách cung cấp ánh sáng đồng đều, nhất quán trên toàn bộ bộ phận.
- Khi nào sử dụng: Lý tưởng cho các bộ phận phức tạp, bề mặt có độ phản xạ cao, hoặc các bộ phận có kết cấu không đồng đều, nơi hình ảnh chụp bằng một nguồn sáng đơn có thể bỏ sót các chi tiết quan trọng.
Trigger Settings
Manual Trigger
- Là gì: Chụp ảnh khi bạn nhấn nút trên màn hình HMI.
- Phù hợp nhất cho: Thử nghiệm, thiết lập hoặc kiểm tra thủ công.
Hardware Trigger
- Là gì: Sử dụng tín hiệu điện (ví dụ: từ cảm biến) để kích hoạt camera.
- Phù hợp nhất cho: Các dây chuyền tự động, nơi cảm biến phát hiện sự hiện diện của bộ phận.
PLC Trigger
- Là gì: Tín hiệu kích hoạt được gửi qua các bộ điều khiển công nghiệp (PLC) để đồng bộ hóa hoạt động với các máy khác.
- Phù hợp nhất cho: Các hệ thống hoàn toàn tự động yêu cầu định thời chính xác.
Aligner Trigger
- Là gì: Tự động kích hoạt khi hệ thống phát hiện bộ phận đã được căn chỉnh trong tầm nhìn.
- Phù hợp nhất cho: Các ứng dụng mà bộ phận cần được định vị nhất quán trước khi chụp hoặc khi không có các trigger đáng tin cậy khác.
Interval Trigger
- Là gì: Kích hoạt camera theo khoảng thời gian đã định.
- Phù hợp nhất cho: Các quy trình liên tục hoặc giám sát dây chuyền chuyển động mà không có cảm biến phát hiện bộ phận.
Template Image and Alignment
Skip Aligner
- Là gì: Tắt bước căn chỉnh trong quá trình kiểm tra.
- Khi nào sử dụng: Khi bộ phận luôn ở cùng một vị trí và hướng trong hình ảnh.
Template Regions
- Là gì: Xác định (các) vùng của hình ảnh template được sử dụng để căn chỉnh.
- Rectangle: Vẽ vùng quan tâm hình chữ nhật.
- Circle: Vẽ vùng quan tâm hình tròn.
- Ignore Template Region: Loại trừ một số khu vực khỏi việc căn chỉnh để tránh các họa tiết gây nhiễu hoặc các đặc điểm không liên quan.
- Sử dụng tốt nhất: Giúp hệ thống chỉ tập trung vào các đặc điểm bộ phận đặc trưng nhất để căn chỉnh chính xác.
Rotation Range
- Là gì: Thiết lập mức độ xoay (tính bằng độ) mà hệ thống sẽ dung sai khi khớp bộ phận với template.
- Ví dụ: Thiết lập ±20° cho phép bộ phận xoay nhẹ nhưng vẫn được phát hiện.
- Khi nào điều chỉnh: Tăng nếu các bộ phận có xu hướng xoay trong quá trình sản xuất; giảm cho các hướng rất nhất quán.
Sensitivity
- Là gì: Kiểm soát mức độ chi tiết mà hệ thống tìm kiếm sự trùng khớp giữa hình ảnh trực tiếp và template.
- Hiệu ứng:
- Độ nhạy cao → phát hiện các chi tiết tinh tế hơn, hữu ích cho các bộ phận phức tạp.
- Độ nhạy thấp hơn → giảm các kết quả khớp sai nhưng có thể bỏ lỡ các đặc điểm nhỏ.
Confidence Threshold
- Là gì: Thiết lập điểm tin cậy tối thiểu cần thiết để hệ thống chấp nhận một phát hiện.
- Hiệu ứng:
- Ngưỡng cao hơn → ít kết quả dương tính giả hơn nhưng có thể bỏ lỡ các kết quả khớp biên.
- Ngưỡng thấp hơn → nhiều phát hiện hơn, nhưng tăng nguy cơ dương tính giả.
Bắt đầu ở mức trung bình và điều chỉnh dựa trên kết quả thử nghiệm.
Scale Invariant
- Là gì: Cho phép hệ thống phát hiện các bộ phận lớn hơn hoặc nhỏ hơn một chút so với hình ảnh template ban đầu.
- Khi nào kích hoạt: Nếu kích thước bộ phận có thể thay đổi nhẹ do vị trí, thay đổi khoảng cách hoặc dung sai sản xuất.
Live Preview Legend

1. Một hộp giới hạn có thể cấu hình xác định vùng cụ thể của trường nhìn FOV của camera để giám sát trong quá trình kích hoạt.
- Mục đích: Đảm bảo camera chỉ tập trung vào khu vực liên quan, bỏ qua các vùng nền không cần thiết.
- Sử dụng tốt nhất:
- Đối với vật thể chuyển động, để đảm bảo bộ phận nằm hoàn toàn trong khu vực phát hiện.
- Để tối ưu hóa tốc độ xử lý bằng cách giảm lượng dữ liệu hình ảnh được phân tích.
2. Một dấu chấm đỏ trực quan hiển thị điểm trung tâm của tất cả các ROI (Regions of Interest) đã xác định trong hình ảnh.
- Mục đích: Giúp bạn căn chỉnh và định vị vùng tìm kiếm tương đối với bộ phận hoặc góc nhìn camera.
3. Đường màu xanh lá cho biết cạnh của đối tượng đã được phát hiện.
Nếu bạn thấy đường chuyển sang màu đỏ, hãy thử tăng kích thước ROI, điều chỉnh ROI, hoặc tăng Sensitivity.

Định Nghĩa và Tối Ưu Hóa ROI (Region of Interest)
Loại Kiểm Tra
- Khái niệm: Xác định loại kiểm tra đang được thực hiện và nhóm các ROI (Regions of Interest) tương tự lại với nhau.
- Ví dụ: "Holes" để kiểm tra sự hiện diện, kích thước hoặc chất lượng của các lỗ trên một bộ phận.
- Tính năng chính:
- Add Inspection Type: Tạo các danh mục mới cho các yêu cầu kiểm tra khác nhau.
- # of ROIs: Hiển thị số lượng ROI hiện được gán cho loại kiểm tra đó.
Transformation

- Khái niệm: Điều chỉnh vị trí và hình học của các ROI được chọn để căn chỉnh và định vị chính xác.
- Các trường và mục đích:
- Height/Width: Thay đổi kích thước của ROI.
- X / Y: Di chuyển vị trí ROI theo trục ngang (X) và trục dọc (Y).
- Angle: Xoay ROI quanh tâm của nó.
- Sử dụng tốt nhất: Tăng tốc thiết lập khi bạn có các mẫu lặp lại, như nhiều lỗ giống nhau.
Inspection Regions

- Khái niệm: Danh sách tất cả các ROI được xác định trong hình ảnh template.
- Tính năng:
- Add Inspection Region: Tạo một ROI mới theo cách thủ công.
- Ignore Regions: Loại trừ các vùng cụ thể khỏi quá trình xử lý.
- Edit: Lưu, xóa hoặc hủy.
- Lock Icon: Biểu thị các ROI đã khóa không thể di chuyển nếu không mở khóa.
Chế Độ Live Preview
- Khái niệm: Hiển thị phản hồi theo thời gian thực sau khi điều chỉnh hoặc thêm ROI.
- Trường hợp sử dụng: Rất phù hợp để tinh chỉnh vị trí và kích thước ROI trong quá trình thiết lập.
Nút Test
- Khái niệm: Chạy backtesting dựa trên các hình ảnh cũ để xác minh các thay đổi.
- Trường hợp sử dụng: So sánh kết quả hiện tại với các cài đặt trước đó để đảm bảo độ chính xác và tính nhất quán.
Thu Thập Dữ Liệu và Huấn Luyện AI
Xác định các class kiểm tra khác nhau và gán nhãn cho từng ROI dựa trên loại kiểm tra được chỉ định (xem ví dụ bên dưới).

Sử dụng Annotation Tools để gán nhãn/chú thích hình ảnh. Sử dụng menu thả xuống Brush Class để chọn class cần chú thích. Giới hạn hiện tại là tối đa 10 class cho mỗi recipe đối với segmentation.

Tầm quan trọng của dữ liệu tốt

-
Garbage In, Garbage Out: Các mô hình AI chỉ tốt bằng dữ liệu mà bạn cung cấp cho chúng. Dữ liệu kém chất lượng hoặc không nhất quán dẫn đến kết quả không chính xác.
-
Sự đa dạng rất quan trọng: Thu thập dữ liệu đại diện cho tất cả các biến thể trong thực tế: các ca làm việc khác nhau, điều kiện ánh sáng, vị trí bộ phận và điều kiện bề mặt.
-
Chất lượng hơn số lượng: Một tập dữ liệu nhỏ hơn, sạch và được gán nhãn tốt thường sẽ hoạt động tốt hơn một tập dữ liệu lớn nhưng nhiễu hoặc không nhất quán.
Kiến Thức Cơ Bản Về Annotation:
- Classification: Gán nhãn toàn bộ hình ảnh hoặc ROI là một class cụ thể (ví dụ: "Good", "Damaged").
- Segmentation: Tô, khoanh vùng hoặc làm nổi bật các khu vực quan tâm cụ thể với độ chính xác ở cấp độ pixel (ví dụ: vị trí vết xước trên bề mặt).
- Tính nhất quán: Sử dụng các quy tắc và định nghĩa nhất quán khi gán nhãn để tránh nhầm lẫn trong quá trình huấn luyện.

Các Lỗi Thường Gặp
- Dữ liệu không đủ: Quá ít mẫu sẽ dẫn đến underfitting, gây hiệu suất kém trong thực tế.
- Class mất cân bằng: Việc một class chiếm đa số (ví dụ: nhiều bộ phận "good" nhưng ít bộ phận lỗi) làm sai lệch mô hình.
- Gán nhãn kém: Gán nhãn không chính xác, không nhất quán hoặc vội vàng dẫn đến sụt giảm đáng kể về độ chính xác.
- Bỏ qua thay đổi môi trường: Không cập nhật tập dữ liệu khi ánh sáng, hướng bộ phận hoặc điều kiện bề mặt thay đổi sẽ dẫn đến sự trôi (drift) về độ chính xác.
- Không xác thực dữ liệu: Bỏ qua các bước kiểm tra chất lượng trước khi huấn luyện thường dẫn đến lãng phí thời gian và phải làm lại.
Data Augmentation
Augmentation hình ảnh sửa đổi hình ảnh huấn luyện một cách nhân tạo để cải thiện độ bền vững của mô hình. Chúng mô phỏng các biến đổi trong thực tế như thay đổi độ sáng, xoay, hoặc nhiễu để mô hình hoạt động tốt trong các điều kiện khác nhau.
Color Augmentations

Brightness
- Là gì: Điều chỉnh độ sáng hoặc tối của hình ảnh.
- Trường hợp sử dụng: Để xử lý những thay đổi nhỏ về ánh sáng trong quá trình sản xuất.
Sử dụng ±0.1 cho các thiết lập ổn định; tăng lên nếu ánh sáng thay đổi nhiều hơn.
Contrast
- Là gì: Thay đổi sự khác biệt giữa vùng sáng và vùng tối.
- Trường hợp sử dụng: Hữu ích cho các bộ phận có kết cấu hoặc bề mặt đa dạng để giúp mô hình thích ứng với các khác biệt về mặt hình ảnh.
Hue
- Là gì: Dịch chuyển nhẹ tông màu.
- Trường hợp sử dụng: Phù hợp cho các thiết lập mà màu sắc ánh sáng (ví dụ: nhiệt độ LED) có thể thay đổi theo thời gian.
Saturation
- Là gì: Điều chỉnh cường độ màu sắc.
- Trường hợp sử dụng: Giúp xử lý các biến đổi về độ chiếu sáng khiến hình ảnh trông mờ nhạt hoặc rực rỡ hơn.
Geometric Augmentations

Rotation Range
- Là gì: Xoay hình ảnh ngẫu nhiên trong phạm vi đã đặt (ví dụ: ±20°).
- Trường hợp sử dụng: Cho các bộ phận có thể đến ở vị trí hơi xoay.
Tránh xoay quá mức đối với các bộ phận thường được cố định về hướng.
Flip
- Là gì: Lật hình ảnh theo chiều ngang, chiều dọc, hoặc cả hai.
- Trường hợp sử dụng: Hữu ích cho các bộ phận đối xứng hoặc khi hướng có thể bị lật trong quá trình xử lý.
Lighting & Color Simulation
Planckian
- Là gì: Mô phỏng các biến đổi về nhiệt độ màu (ví dụ: ánh sáng ấm hoặc lạnh).
- Trường hợp sử dụng: Xử lý các ca làm việc hoặc work cell khác nhau với các nguồn sáng thay đổi.
Gaussian Noise
- Là gì: Thêm nhiễu nhẹ vào hình ảnh.
- Trường hợp sử dụng: Cải thiện độ bền vững nếu môi trường sản xuất của bạn có nhiễu hình ảnh nhỏ hoặc các artifact từ cảm biến camera.
Motion Simulation

Motion Blur
- Là gì: Mô phỏng nhòe nhẹ như thể bộ phận di chuyển trong lúc chụp.
- Trường hợp sử dụng: Quan trọng đối với các dây chuyền tốc độ cao nơi có thể xảy ra motion blur.
Probability (prob)
- Là gì: Đặt xác suất áp dụng mỗi augmentation trong quá trình huấn luyện.
- Ví dụ: 0.50 = 50% khả năng áp dụng thay đổi đó cho bất kỳ hình ảnh huấn luyện nào.
Bắt đầu ở mức 0.5 cho hầu hết các augmentation và điều chỉnh dựa trên biến đổi thực tế.
Training Parameters (Segmentation)
Các tham số huấn luyện (còn gọi là hyperparameters) là các cài đặt kiểm soát cách mô hình machine learning học từ dữ liệu.
Learning Rate
- Định nghĩa: Kiểm soát tốc độ mô hình cập nhật các trọng số nội bộ trong quá trình huấn luyện.
- Giá trị (0.003): Learning rate càng cao, mô hình học càng nhanh, nhưng quá cao có thể gây ra sự bất ổn định hoặc độ chính xác kém.
- Phạm vi thanh trượt: Từ 10^-4 (rất chậm) đến 10^-1 (rất nhanh).
Thông thường, giá trị từ 0.001–0.01 là điểm khởi đầu tốt cho các tác vụ segmentation.
Kích thước ROI (Region of Interest)
- Định nghĩa: Xác định kích thước (chiều rộng × chiều cao) của vùng ảnh được sử dụng trong quá trình huấn luyện.
- Khi không chọn: Theo mặc định, model sẽ tự động xác định ROI dựa trên dữ liệu của bạn.
- Khi được chọn: Bạn có thể thiết lập chiều rộng và chiều cao thủ công nếu cần kích thước đầu vào nhất quán (ví dụ: tất cả hình ảnh được cắt về 256×256 pixel).
Sử dụng kích thước cố định (ví dụ: 256×256) khi tập dữ liệu của bạn có các hình ảnh với kích thước khác nhau và bạn muốn đầu vào nhất quán để có độ ổn định tốt hơn, khả năng tái lập, hoặc để phù hợp với kiến trúc model đã biết.
Để hệ thống tự động chọn khi dữ liệu của bạn đã có độ phân giải đồng nhất hoặc khi bạn muốn hệ thống tối ưu hóa vùng quan tâm tốt nhất dựa trên đặc điểm của tập dữ liệu.
Số Lần Lặp (Epochs)
- Định nghĩa: Một epoch = một lần duyệt qua toàn bộ tập dữ liệu huấn luyện.
- Giá trị (100): Model sẽ huấn luyện qua 100 lần duyệt hoàn chỉnh.
Tăng số này thường cải thiện độ chính xác đến một mức nào đó nhưng sẽ mất nhiều thời gian hơn.
Nguyên tắc chung: Theo dõi training loss và validation loss trong quá trình huấn luyện. Nếu validation loss ngừng giảm trong khi training loss vẫn tiếp tục giảm, đó là dấu hiệu model đang bị overfitting và bạn nên dừng huấn luyện sớm hơn.
Architecture
- Định nghĩa: Chọn kích thước và độ phức tạp của mạng neural.
- Small: Huấn luyện nhanh hơn và thường đủ cho hầu hết tập dữ liệu. Lý tưởng cho việc thử nghiệm nhanh hoặc tập dữ liệu nhỏ.
- Các model lớn hơn có thể nắm bắt nhiều chi tiết hơn nhưng có thể bị overfitting trên tập dữ liệu nhỏ, trong khi các model nhỏ hơn hiệu quả hơn và tổng quát hóa tốt hơn khi dữ liệu bị hạn chế.
Bắt đầu với Small, nó thường đủ và giúp bạn lặp lại nhanh hơn trước khi mở rộng quy mô.
External GPU
Liên hệ bộ phận Hỗ Trợ để biết thêm về External GPU.
Thông Số Huấn Luyện (Classification)
Các thông số huấn luyện (còn gọi là hyperparameters) là các cài đặt kiểm soát cách một machine learning model học từ dữ liệu.
Learning Rate
- Định nghĩa: Kiểm soát tốc độ model cập nhật các trọng số nội bộ trong quá trình huấn luyện.
- Giá trị (0.003): Learning rate càng cao, model học càng nhanh, nhưng quá cao có thể gây ra sự không ổn định hoặc độ chính xác kém.
- Phạm Vi Thanh Trượt: Từ 10^-4 (rất chậm) đến 10^-1 (rất nhanh).
Thông thường, giá trị từ 0.001–0.01 là điểm khởi đầu tốt cho các tác vụ segmentation.
Validation Percent
- Định nghĩa: Xác định phần nào của tập dữ liệu sẽ được dành riêng để validation (kiểm thử trong quá trình huấn luyện).
- Mục Đích: Dữ liệu validation giúp theo dõi hiệu suất của model trên các ví dụ chưa thấy, ngăn ngừa overfitting.
- Phạm Vi: 0–50%.
Các lựa chọn phổ biến là 10–20%.
Nếu đặt là 0%, tất cả dữ liệu được sử dụng để huấn luyện, điều này có thể cải thiện độ chính xác huấn luyện nhưng khiến việc phát hiện overfitting trở nên khó khăn hơn.
Kích thước ROI (Region of Interest)
- Định nghĩa: Xác định kích thước (chiều rộng × chiều cao) của vùng hình ảnh được sử dụng trong quá trình huấn luyện.
- Không chọn: Theo mặc định, model tự động xác định ROI dựa trên dữ liệu của bạn.
- Khi được chọn: Bạn có thể đặt thủ công chiều rộng và chiều cao nếu cần kích thước đầu vào nhất quán (ví dụ: tất cả hình ảnh được cắt thành 256×256 pixel).
Sử dụng kích thước cố định (ví dụ: 256×256) khi tập dữ liệu của bạn có các hình ảnh với kích thước khác nhau và bạn muốn đầu vào nhất quán để có độ ổn định tốt hơn, khả năng tái tạo, hoặc để phù hợp với kiến trúc model đã biết.
Để hệ thống tự động chọn khi dữ liệu của bạn đã có độ phân giải đồng nhất hoặc khi bạn muốn hệ thống tối ưu hóa cho vùng quan tâm tốt nhất dựa trên đặc điểm của tập dữ liệu.
Số Lần Lặp (Epochs)
- Định nghĩa: Một epoch = một lần đi qua toàn bộ tập dữ liệu huấn luyện.
- Giá trị (100): Model sẽ được huấn luyện trong 100 lần đi qua hoàn chỉnh.
Việc tăng số này thường cải thiện độ chính xác đến một mức nào đó nhưng mất nhiều thời gian hơn.
Quy tắc chung: Theo dõi training loss và validation loss trong quá trình huấn luyện. Nếu validation loss ngừng giảm trong khi training loss vẫn tiếp tục giảm, đó là dấu hiệu model đang bị overfitting và bạn nên dừng huấn luyện sớm hơn.
Kiến Trúc (Architecture)
- Định nghĩa: Chọn kích thước và độ phức tạp của mạng neural.
- Small: Huấn luyện nhanh hơn và thường đủ cho hầu hết các tập dữ liệu. Lý tưởng cho việc thử nghiệm nhanh hoặc các tập dữ liệu nhỏ hơn.
Bắt đầu với Small, nó thường đủ và giúp bạn lặp lại nhanh hơn trước khi mở rộng quy mô.
| Kiến Trúc và Camera | Mô tả | Khuyến nghị sử dụng |
|---|---|---|
| ConvNeXt-Pico | Model siêu nhẹ được tối ưu hóa cho tốc độ và sử dụng ít bộ nhớ. | Tuyệt vời cho thử nghiệm nhanh hoặc phần cứng hạn chế. |
| ConvNeXt-Nano | Lớn hơn Pico một chút; độ chính xác tốt hơn với chi phí tăng thêm tối thiểu. | Cân bằng tốt cho tập dữ liệu nhỏ–trung bình. |
| ConvNeXt-Tiny | Cung cấp độ chính xác được cải thiện trong khi vẫn hiệu quả. | Phù hợp cho các tập dữ liệu vừa phải và quá trình huấn luyện dài hơn. |
| ConvNeXt-Small | Phiên bản mạnh nhất trong danh sách này. Dung lượng và độ chính xác cao hơn. | Sử dụng cho các tập dữ liệu lớn hoặc khi cần hiệu suất tối đa. |
External GPU
Liên hệ Support để biết thêm về External GPU.





