KI-GESTÜTZTE DOKUMENTATION
Was möchten Sie wissen?
Klassifizierung: ein Label pro Region
Ein Klassifikator betrachtet einen zugeschnittenen Bereich und beantwortet eine einzige Frage: Zu welcher Kategorie gehört dieser? Bestanden oder nicht bestanden. Leer oder voll. Rot, grün oder blau. Es ist die einfachste und schnellste Inspektionsart und die richtige Standardwahl, sofern Sie nicht wissen müssen, wo sich ein Fehler befindet.
Die Einrichtung eines Klassifikators basiert auf einer einfachen Hierarchie: Types enthalten Classes, und Types werden als ROIs auf Bilder gestempelt.
Stellen Sie sich das wie ein Stempelsystem vor. Der Inspection Type ist der Stempel selbst (das Design). Die ROIs sind die Abdrücke, die Sie auf die Seite machen (das Bild). Jeder Abdruck erbt dasselbe Design, dieselbe Klassenliste und dasselbe trainierte Modell.
Die drei Konzepte
Bevor Sie ein AI-Modell trainieren können, muss die Kamera wissen, wo sie suchen soll, welche möglichen Ergebnisse es gibt und wie jeder Ausschnitt bewertet werden soll. Diese drei Fragen entsprechen drei Konzepten, und sie sind auf eine ganz bestimmte Weise verschachtelt.
Inspection Type
A named bucket. Holds one shared dataset, one shared list of classes, and one trained AI model.
Classes
The vocabulary of possible outcomes for this inspection. Defined once on the type.
Region of Interest (ROI)
A rectangle drawn on the image. Many ROIs can share one type and, therefore, one dataset and one model.
Das mentale Modell: Ein Type besitzt die Classes und die ROIs
Ein Inspection Type ist ein Container. Er enthält einen gemeinsamen Datensatz, eine gemeinsame Liste von Classes und ein trainiertes AI-Modell. Diesen Container stempeln Sie an mehreren Stellen auf das Bild – diese Stempel sind die ROIs. Jede ROI desselben Typs erbt dieselben Classes und wird vom selben Modell bewertet.
- Inspection Type ist der Container.
- Classes sind das Vokabular der möglichen Ergebnisse.
- ROI ist eine Position im Bild.
Bei einem Klassifikator: ein Label pro ROI, ausgewählt aus der Klassenliste
Ein Klassifikator nimmt jeden ROI-Ausschnitt und stellt eine einzige Frage: Welcher Klasse entspricht dies? Vorhanden oder nicht vorhanden. Bestanden oder nicht bestanden. Gut, zerkratzt oder gerissen. Die Ausgabe pro ROI ist ein Klassenname plus ein Konfidenzwert – eine eindeutige kategoriale Antwort, mit der der Rest Ihrer Pipeline arbeiten kann.
Beispiel aus der Praxis: Prüfung des Schraubenvorhandenseins auf einer Leiterplatte
Betrachten Sie eine Leiterplatte mit sechs Schraubenpositionen. Vier Schrauben sind vorhanden, eine fehlt, eine ist beschädigt. Die Konfiguration sähe so aus:
- Type:
Screws(6 ROIs, Klassifikator) - Classes:
present,absent,damaged - ROIs:
Screw_1bisScrew_6, jeweils mit einer der drei Classes gelabelt
Die Ausgabe pro ROI ist ein Label plus Konfidenzwert:
| ROI | Label | Konfidenz |
|---|---|---|
| Screw_1 | present | 0.98 |
| Screw_2 | absent | 0.94 |
| Screw_3 | present | 0.97 |
| Screw_4 | present | 0.96 |
| Screw_5 | present | 0.95 |
| Screw_6 | damaged | 0.82 |
Drei Dinge, die Sie sich aus diesem Beispiel einprägen sollten:
- Ein Label pro ROI. Der Klassifikator weist jedem Ausschnitt genau eine Klasse zu – eine Dropdown-Auswahl, keine Malaufgabe. Die Ausgabe ist
class_nameplus einconfidence-Wert. - Der Type ist der Besitzer. Alle sechs ROIs teilen sich den Datensatz Screws. Eine einzige Bildaufnahme liefert sechs neue Trainingsbeispiele, und ein trainiertes Modell entscheidet über alle sechs.
- ROIs sind nur Positionen. Zeichnen Sie eng (unter 512 × 512 px). Verwenden Sie Duplicate, um
Screw_1 → Screw_2 → Screw_3zu stempeln – jede erbt die Klassenliste automatisch.
Auf dem OV80i kann ein einzelnes Rezept mehrere Modelltypen kombinieren. Verwenden Sie einen Klassifikator für Verdikte und bekannte Kategorien und fügen Sie darauf einen Segmenter für pixelgenaue Messungen hinzu. Siehe Understanding Segmenter für die andere Hälfte der Geschichte.
Detailbetrachtung: Wie sich Classes verhalten
Classes gehören zum Type, nicht zur ROI
Dies ist das Wichtigste, das Sie sich einprägen sollten. Classes sind eine Eigenschaft des Inspection Type. Das bedeutet, dass das Hinzufügen oder Entfernen einer Class die Label-Optionen für jede ROI, die diesen Type verwendet, automatisch ändert.
- Einmal definieren. Klicken Sie auf + Add class im Panel Classes. Vergeben Sie einen Namen (z. B.
stripped_head) und eine Farbe. - Sofortige Übernahme. Die neue Class erscheint im Dropdown jeder ROI dieses Types. Keine Konfiguration pro ROI erforderlich.
- Bei Bedarf neu labeln. Bestehende Trainingsbilder behalten ihre Labels; Sie können jedes Bild erneut aufrufen und der neuen Class zuordnen.
- Halten Sie es schlank. Beginnen Sie mit der kleinsten Menge an Classes, die Ihre Entscheidungen abbildet. Zwei Classes (
pass/fail) übertreffen oft fünf unklare.
Detailbetrachtung: Wie sich ROIs verhalten
Kleinere Regionen gewinnen. Machen Sie jede ROI gerade groß genug, um das Merkmal aufzunehmen. Kleinere ROIs bedeuten weniger Trainingsdaten, schnellere Iteration und genauere AI-Entscheidungen – das Merkmal dominiert den Ausschnitt, statt im Hintergrund unterzugehen, und nichts wird herunterskaliert.
Klein, spezifisch und zahlreich
Eine ROI teilt der Kamera mit, wo sie zuschneiden soll. Je enger der Ausschnitt, desto klarer das Signal, das das Modell erhält. Da ROIs einen Type teilen, vervielfachen Sie durch das Hinzufügen weiterer ROIs Ihre Trainingsdaten, ohne den Aufwand zu vervielfachen.
- Halten Sie Ausschnitte unter 512 × 512 px. Alles Größere wird auf die Modelleingabe heruntergerechnet, und Details gehen unwiederbringlich verloren.
- Eng ist besser. Eine kleine ROI um ein einzelnes Merkmal liefert dem Modell ein klares Signal und benötigt weniger Trainingsdaten zur Konvergenz.
- Viele ROIs, ein Type. 10 Schrauben → 10 ROIs auf demselben Screws-Type. Eine Aufnahme wird zu zehn Trainingsbeispielen, und ein Modell verarbeitet alle zehn zur Inferenzzeit.
- Verwenden Sie Duplicate. Benennen Sie die erste ROI aussagekräftig (
Screw_Top_Left). Duplicate erhöht die Namen automatisch, sodass Sie sie nicht erneut eintippen müssen. - Vollständige Abdeckung erforderlich? Zeichnen Sie nicht eine riesige ROI, sondern legen Sie ein Raster aus kleinen ROIs an. Jede behält die volle Auflösung.
Datenfluss: Jede ROI durchläuft das Modell separat
Zur Laufzeit schneidet die Kamera jede ROI aus dem Gesamtbild aus, übergibt sie einzeln an das trainierte Modell und protokolliert, welche Class gewonnen hat, zusammen mit einem Konfidenzwert. Das Ergebnis ist ein Label pro ROI, bei jeder Aufnahme.
- Erfassen Sie das gesamte Bild mit allen markierten ROIs.
- Einzeln zuschneiden, sodass jede ROI zu einem eigenen kleinen Bild wird.
- Das Klassifikator-Modell wählt für jeden Ausschnitt eine Class plus einen Konfidenzwert.
- Die Ausgabe ist eine Tabelle aus ROI → Label → Konfidenz. Die Pass/Fail-Logik darauf wird durch die Regeln Ihres IO Blocks bestimmt.
Einrichtungs-Zusammenfassung
Eine schnelle Checkliste vor dem Training. Wenn alle Punkte erfüllt sind, hat Ihr Klassifikator eine solide Grundlage.
- Ein Inspection Type pro Entscheidung. Mischen Sie nicht "Schrauben" und "Etiketten" im selben Type – geben Sie jedem einen eigenen, damit jeder seine eigenen Classes, seinen eigenen Datensatz und sein eigenes Modell erhält.
- Classes auf Type-Ebene definiert. Jede ROI erhält dasselbe Dropdown. Wenn eine Option nicht auf jede ROI zutrifft, gehört sie wahrscheinlich zu einem anderen Type.
- ROIs eng gezeichnet und aussagekräftig benannt.
Screw_Top_Leftist besser alsNew ROI. Halten Sie jede ROI gerade groß genug für ihr Merkmal und unter 512 × 512 px. - Alignment funktioniert zuerst. Wenn das Teil sich verschiebt oder dreht, bewegt der Aligner Ihre ROIs mit. Enge ROIs funktionieren nur, wenn das Alignment stabil ist.
- 3 bis 5 Trainingsbilder pro Class zu Beginn. Trainieren, Fehler finden, gezielte Daten hinzufügen, neu trainieren. Zwei bis vier Iterationen sind typisch.
- Jedes Label doppelt geprüft. Ein Fehlerlabel in fünf Trainingsbildern bedeutet 20 % Verfälschung. Klicken Sie vor jedem Training auf View All ROIs.
Wie geht es weiter
- Understanding Segmenter, die Schwesterseite zu pixelbasierten Modellen.
- Regions of Interest (ROIs), der praktische Leitfaden zum Zeichnen von ROIs.
- Training Your AI, der Workflow für Labeling und Training.