KI-GESTÜTZTE DOKUMENTATION
Was möchten Sie wissen?
Erstellung des ersten Rezepts
Dieser Deep Dive erklärt, was ein Rezept ist, beschreibt die Unterschiede zwischen Klassifikation und Segmentierung und bietet eine schrittweise Anleitung zur Erstellung eines Rezepts. Darüber hinaus enthält er eine detaillierte Anleitung zur Konfiguration des Imaging Setups, zur Aufnahme des Template Image und zur Einrichtung des Aligners, zur ROI-Optimierung, zur Datenerfassung und zum KI-Training sowie zur Konfiguration der Bildaugmentierung.
Sehen Sie sich dieses Thema in Aktion an: How to create a segmentation recipe in minutes
Lernziele
Am Ende dieses Deep Dives werden Sie verstehen:
- was ein Rezept ist
- den Unterschied zwischen Klassifikation und Segmentierung – und wann welche zu verwenden ist
- wie man ein Rezept erstellt
- wie man das Imaging Setup konfiguriert
- wie man ein Template Image aufnimmt und den Aligner konfiguriert
- was ROIs (Regions of Interest) sind und wie man sie optimiert
- die Datenerfassung für das KI-Training
- das Testen und Validieren von Rezepten
Was ist ein Rezept?
- Ein konfigurierter Satz von Anweisungen, der der Kamera mitteilt, wie ein bestimmtes Teil oder Produkt zu prüfen ist.
- Definiert Kameraeinstellungen, einschließlich Belichtung, Fokus und Beleuchtungsparametern für eine konsistente Bildaufnahme.
- Beinhaltet Verarbeitungslogik wie ROI-Definitionen, Aligner, Klassifikations- oder Segmentierungsklassen.
- Speichert Ein-/Ausgabekonfigurationen zur Integration mit Automatisierungssystemen für Pass/Fail- oder erweiterte Signale.
- Kann gespeichert und wiederverwendet werden, um konsistente Prüfungen über Schichten, Linien oder Standorte hinweg sicherzustellen.
Klassifikation vs. Segmentierung
Definitionen
- Klassifikation: Identifizierung des Objekttyps im ROI
- Segmentierung: Lokalisierung und Analyse von Regionen im Bild/ROI
Beispiele
| Bildklassifikation | Bildsegmentierung | Bildklassifikation | Bildsegmentierung |
|---|---|---|---|
| Was ist ein Schaf? | Welche Pixel gehören zu welchem Objekt? | Ist diese Pizza akzeptabel oder fehlerhaft? | Wo befindet sich jede Peperoni? |
![]() | ![]() | ![]() | ![]() |
Wichtige Gegenüberstellung
| Klassifikation | Segmentierung | |
|---|---|---|
| Geschwindigkeit | Die Geschwindigkeit hängt vom Image Setup und der Komplexität ab. Bei einfachen Setups in der Regel effizient und schnell | Kann ebenso schnell oder sogar schneller als die Klassifikation sein, wenn optimiert, insbesondere mit schlanken Modellen |
| Genauigkeit | Gut für allgemeines Pass/Fail oder die Identifizierung des Teiletyps | Höhere Genauigkeit für die präzise Lokalisierung von Defekten |
| Komplexität | Einfach einzurichten und zu warten; weniger Parameter | Komplex – Benötigt mehr Daten, Labeling und Feintuning |
| Datenbedarf | Gering – Benötigt weniger gelabelte Bilder | Moderat – Erfordert viele Bilder mit detaillierten pixelgenauen Annotationen |
| Anwendungsfälle | Teilevorhandensein, Orientierung, grundlegende Qualitätsprüfungen, Teil eingesetzt/nicht eingesetzt usw. | Oberflächendefekte, Feinmerkmalsprüfung, Mehrfachdefekterkennung, Zählung, Vermessung usw. |
Erstellen und Exportieren eines Rezepts
Verwenden Sie die Schaltfläche Export Recipe neben einem Rezept, um ein einzelnes Rezept zu exportieren.
Verwenden Sie die Schaltfläche Export oben auf dem Bildschirm, um mehrere Rezepte gleichzeitig zu exportieren.

Verwenden Sie die Schaltfläche Import oben auf dem Bildschirm, um Rezepte zu importieren.

Hinweis: Jedes Rezept unterstützt jeweils nur einen Inspektionstyp – entweder Segmentierung oder Klassifizierung. Wählen Sie den richtigen Typ, bevor Sie mit der Einrichtung beginnen.
Imaging Setup
Focus
- Was es ist: Stellt die Schärfe des aufgenommenen Bildes ein.
- Verwendung: Schieben Sie den Regler, bis Kanten und Details im Bild scharf und klar erscheinen.
Verwenden Sie beim Fokussieren ein Zielobjekt mit klaren Kanten (z. B. ein Lineal oder eine Kalibrierkarte).
Image Rotation
- Was es ist: Dreht das Bild (0° oder 180°).
- Wann verwenden: Wenn die Kamera in einem Winkel montiert ist, das Bild aber in der Oberfläche anders herum angezeigt werden soll.
Wenn Sie das Bild um 90° drehen müssen, drehen Sie die Kamera.
Exposure (ms)
- Was es ist: Die Zeit, in der der Sensor während der Bildaufnahme dem Licht ausgesetzt ist.
- Auswirkung:
- Höhere Belichtung → hellere Bilder, aber Risiko von Bewegungsunschärfe.
- Geringere Belichtung → weniger Licht, aber schärfere Bilder bei schnell bewegten Anwendungen.
| Unterbelichtet | Korrekt belichtet | Überbelichtet |
|---|---|---|
Die Belichtung ist logarithmisch, und eine höhere Belichtung bedeutet mehr Latenz (da mehr Zeit für die Bildaufnahme erforderlich ist).
Gain
- Was es ist: Hellt das Bild digital künstlich auf (vergleichbar mit ISO bei einer Kamera).
- Auswirkung:
- Höhere Verstärkung → helleres Bild, aber mit Rauschen (körniges Aussehen).
- Geringere Verstärkung → saubereres Bild, erfordert aber gute Beleuchtung.
| Hohe Verstärkung | Geringe Verstärkung |
|---|---|
![]() | ![]() |
| Heller und rauschiger | Dunkler und weniger Rauschen |
Erhöhen Sie die Verstärkung nur, wenn eine Anpassung von Belichtung oder Beleuchtung nicht möglich ist.
Auto White Balance
- Was es ist: Passt den Farbabgleich automatisch an, sodass Weißtöne weiß erscheinen.
- Wann verwenden:
- Ideal für Umgebungen mit variablen oder wechselnden Lichtverhältnissen.
- Bei stabilen Setups liefert ein manueller Weißabgleich konsistentere und reproduzierbarere Ergebnisse.
So passen Sie den Weißabgleich manuell an:
- Schalten Sie den Auto White Balance-Schalter auf ON.
- Legen Sie ein weißes Blatt Papier unter die Kamera oder vor das Objektiv.
- Schalten Sie den Schalter auf OFF, um die Weißabgleich-Einstellung zu fixieren.
Gamma
- Was es ist: Passt die Helligkeit der Mitteltöne an, ohne dunkle oder helle Bereiche zu stark zu beeinflussen.
- Effekt: Hilfreich, um Details in Schatten sichtbar zu machen oder zu helle Lichter abzuschwächen.
Lens Correction
- Was es ist: Korrigiert Verzerrungen, die durch Weitwinkelobjektive verursacht werden.
- Wann aktivieren: Wenn die Bildränder gekrümmt oder verzerrt erscheinen, schalten Sie diese Option EIN, um die Genauigkeit bei Ausrichtungsaufgaben zu verbessern.
LED Strobe Mode
- Was es ist: Steuert, wann die integrierte LED-Beleuchtung der Kamera auslöst.
- Optionen:
- Off: LED ist dauerhaft eingeschaltet.
- On: LED blitzt nur während der Bildaufnahme, wodurch Reflexionen reduziert werden.
LED Light Pattern
- Was es ist: Legt fest, wie die LEDs leuchten (z. B. alle an, alle aus, links und rechts, oben und unten usw.).
- Anwendungsfall: Passen Sie die Einstellung an Ihre Beleuchtungssituation an, um eine optimale Ausleuchtung des Bauteils zu erreichen.
Nutzen Sie Richtungsmuster, um Blendungen oder Reflexionen zu reduzieren, indem Sie die LEDs ausschalten, die direkt auf reflektierende Oberflächen strahlen, während Sie schräg einfallende Lichtquellen aktiv lassen, um eine bessere Sichtbarkeit zu gewährleisten.
LED Light Intensity
- Was es ist: Passt die Helligkeit der LED-Beleuchtung an.
- Best Practice: Beginnen Sie mit einer niedrigen Einstellung und erhöhen Sie diese schrittweise, um Blendung oder Reflexionen zu vermeiden.
Photometric Control
- Was es ist: Nimmt mehrere Bilder (in der Regel vier) mit unterschiedlicher gerichteter Beleuchtung (links, rechts, oben und unten) auf und kombiniert sie anschließend zu einem einzigen verbesserten Bild.
- Zweck: Diese Technik reduziert Schatten und hebt feine Oberflächenmerkmale hervor, indem sie eine gleichmäßige, konsistente Ausleuchtung des Bauteils ermöglicht.
- Wann verwenden: Ideal für komplexe Bauteile, stark reflektierende Oberflächen oder Teile mit ungleichmäßigen Texturen, bei denen Standardaufnahmen mit nur einer Lichtquelle kritische Details übersehen können.
Trigger Settings
Manual Trigger
- Was es ist: Nimmt Bilder auf, wenn Sie die Schaltfläche auf dem HMI-Bildschirm drücken.
- Am besten geeignet für: Tests, Einrichtung oder manuelle Inspektionen.
Hardware Trigger
- Was es ist: Verwendet ein elektrisches Signal (z. B. von einem Sensor), um die Kamera auszulösen.
- Am besten geeignet für: Automatisierte Linien, bei denen ein Sensor die Anwesenheit eines Bauteils erkennt.
PLC Trigger
- Was es ist: Triggersignale werden über industrielle Steuerungen (PLCs) gesendet, um eine synchronisierte Bedienung mit anderen Maschinen zu ermöglichen.
- Am besten geeignet für: Vollautomatisierte Systeme, die ein präzises Timing erfordern.
Aligner Trigger
- Was es ist: Löst automatisch aus, wenn das System eine Bauteilausrichtung im Sichtfeld erkennt.
- Am besten geeignet für: Anwendungen, bei denen Bauteile vor der Aufnahme konsistent positioniert werden müssen oder bei denen keine anderen zuverlässigen Trigger verfügbar sind.
Interval Trigger
- Was es ist: Löst die Kamera in festgelegten Zeitintervallen aus.
- Am besten geeignet für: Kontinuierliche Prozesse oder die Überwachung bewegter Linien ohne Bauteilerkennungssensoren.
Vorlagenbild und Ausrichtung
Skip Aligner
- Was es ist: Deaktiviert den Ausrichtungsschritt während der Inspektion.
- Wann verwenden: Wenn sich das Teil immer in derselben Position und Ausrichtung im Bild befindet.
Template Regions
- Was es ist: Definiert den Bereich/die Bereiche des Vorlagenbildes, die für die Ausrichtung verwendet werden.
- Rectangle: Zeichnen Sie eine rechteckige ROI.
- Circle: Zeichnen Sie eine kreisförmige ROI.
- Ignore Template Region: Schließen Sie bestimmte Bereiche von der Ausrichtung aus, um störende Muster oder irrelevante Merkmale zu vermeiden.
- Beste Verwendung: Hilft dem System, sich nur auf die markantesten Merkmale des Teils zu konzentrieren, um eine präzise Ausrichtung zu erreichen.
Rotation Range
- Was es ist: Legt fest, wie viel Rotation (in Grad) das System bei der Übereinstimmung des Teils mit der Vorlage toleriert.
- Beispiel: Eine Einstellung von ±20° erlaubt, dass das Teil leicht gedreht ist und trotzdem erkannt wird.
- Wann anpassen: Erhöhen Sie den Wert, wenn Teile während der Produktion zur Rotation neigen; verringern Sie ihn bei sehr konsistenten Ausrichtungen.
Sensitivity
- Was es ist: Steuert, wie fein das System nach einer Übereinstimmung zwischen Live-Bild und Vorlage sucht.
- Auswirkung:
- Hohe Sensitivity → erkennt subtilere Details, nützlich für komplexe Teile.
- Niedrigere Sensitivity → reduziert Fehlübereinstimmungen, kann jedoch feine Merkmale übersehen.
Confidence Threshold
- Was es ist: Legt den Mindest-Konfidenzwert fest, der erforderlich ist, damit das System eine Erkennung akzeptiert.
- Auswirkung:
- Höherer Threshold → weniger False Positives, aber möglicherweise werden Grenzfall-Übereinstimmungen übersehen.
- Niedrigerer Threshold → mehr Erkennungen, jedoch mit erhöhtem Risiko von False Positives.
Beginnen Sie mit einem moderaten Wert und passen Sie ihn basierend auf den Testergebnissen an.
Scale Invariant
- Was es ist: Ermöglicht es dem System, Teile zu erkennen, die etwas größer oder kleiner als das ursprüngliche Vorlagenbild sind.
- Wann aktivieren: Wenn die Teilegröße aufgrund von Positionierung, Abstandsänderungen oder Fertigungstoleranzen leicht variieren kann.
Live-Vorschau-Legende

1. Eine konfigurierbare Bounding Box, die den spezifischen Bereich des Kamera-FOV (Field of View) definiert, der während der Triggerung überwacht werden soll.
- Zweck: Stellt sicher, dass sich die Kamera nur auf den relevanten Bereich konzentriert und unnötige Hintergrundbereiche ignoriert.
- Beste Verwendung:
- Bei bewegten Objekten, um zu gewährleisten, dass das Teil vollständig innerhalb des Erkennungsbereichs bleibt.
- Zur Optimierung der Verarbeitungsgeschwindigkeit, indem die Menge der analysierten Bilddaten reduziert wird.
2. Ein roter Punkt zeigt den Mittelpunkt aller definierten ROIs (Regions of Interest) im Bild an.
- Zweck: Hilft Ihnen, den Suchbereich relativ zum Teil oder zur Kameraansicht auszurichten und zu positionieren.
3. Die grüne Linie zeigt an, dass die Kante des Objekts erkannt wurde.
Wenn die Linie rot wird, versuchen Sie, die ROI-Größe zu erhöhen, die ROI anzupassen oder die Sensitivity zu erhöhen.

ROI (Region of Interest) Definition und Optimierung
Inspektionstypen
- Was es ist: Definiert den Typ der Inspektion, der durchgeführt wird, und gruppiert ähnliche ROIs (Regions of Interest).
- Beispiel: „Holes" zur Überprüfung des Vorhandenseins, der Größe oder der Qualität von Löchern in einem Bauteil.
- Hauptmerkmale:
- Add Inspection Type: Erstellen Sie neue Kategorien für unterschiedliche Inspektionsanforderungen.
- # of ROIs: Zeigt an, wie viele ROIs derzeit diesem Inspektionstyp zugewiesen sind.
Transformation

- Was es ist: Passt die Position und Geometrie ausgewählter ROIs für eine präzise Ausrichtung und Platzierung an.
- Felder und ihre Funktion:
- Height/Width: Ändert die Größe des ROI.
- X / Y: Verschiebt die Position des ROI entlang der horizontalen (X) und vertikalen (Y) Achse.
- Angle: Dreht den ROI um seinen Mittelpunkt.
- Beste Anwendung: Beschleunigt die Einrichtung bei sich wiederholenden Mustern, z. B. bei mehreren identischen Löchern.
Regions of Interest (ROIs)

- Was es ist: Eine Liste aller im Vorlagenbild definierten ROIs.
- Funktionen:
- Add Region of Interest (ROI): Erstellen Sie manuell einen neuen ROI.
- Ignore Regions: Schließen Sie bestimmte Bereiche von der Verarbeitung aus.
- Edit: Speichern, löschen oder abbrechen.
- Lock Icon: Kennzeichnet gesperrte ROIs, die ohne Entsperrung nicht verschoben werden können.
Live Preview Modus
- Was es ist: Zeigt Echtzeit-Feedback nach dem Anpassen oder Hinzufügen von ROIs.
- Anwendungsfall: Ideal zum Feinabstimmen von ROI-Positionen und -Größen während der Einrichtung.
Test-Schaltfläche
- Was es ist: Führen Sie Backtesting auf Basis älterer Bilder aus, um Änderungen zu verifizieren.
- Anwendungsfall: Vergleich der aktuellen Ergebnisse mit vorherigen Einstellungen hinsichtlich Genauigkeit und Konsistenz.
Datenerfassung und KI-Training
Definieren Sie verschiedene Inspektionsklassen und beschriften Sie jeden ROI entsprechend seines vorgesehenen Inspektionstyps (siehe das folgende Beispiel).

Verwenden Sie die Annotation Tools, um das Bild zu beschriften/annotieren. Verwenden Sie das Dropdown-Menü Brush Class, um die zu annotierende Klasse auszuwählen. Das aktuelle Limit beträgt bis zu 10 Klassen pro Rezept für die Segmentierung.

Bedeutung guter Daten

-
Garbage In, Garbage Out: KI-Modelle sind nur so gut wie die Daten, mit denen sie trainiert werden. Daten von schlechter Qualität oder inkonsistente Daten führen zu ungenauen Ergebnissen.
-
Vielfalt ist entscheidend: Erfassen Sie Daten, die alle realen Variationen abbilden: verschiedene Schichten, Lichtverhältnisse, Bauteilpositionen und Oberflächenzustände.
-
Qualität vor Quantität: Ein kleinerer, sauberer und gut beschrifteter Datensatz erzielt oft bessere Ergebnisse als ein großer, aber verrauschter oder inkonsistenter Datensatz.
Grundlagen der Annotation:
- Classification: Markieren Sie ganze Bilder oder ROIs als eine bestimmte Klasse (z. B. „Good", „Damaged").
- Segmentation: Übermalen, umranden oder markieren Sie bestimmte interessante Bereiche mit pixelgenauer Präzision (z. B. die Position eines Kratzers auf einer Oberfläche).
- Konsistenz: Verwenden Sie einheitliche Regeln und Definitionen für die Beschriftung, um Verwirrung während des Trainings zu vermeiden.

Häufige Fallstricke
- Unzureichende Daten: Zu wenige Stichproben führen zu Underfitting und damit zu schlechter Leistung in der Praxis.
- Unausgewogene Klassen: Eine Überrepräsentation einer Klasse (z. B. viele „gute" Teile, aber wenige fehlerhafte) verzerrt das Modell.
- Schlechte Beschriftung: Fehlerhafte, inkonsistente oder hastige Beschriftung führt zu erheblichen Genauigkeitseinbußen.
- Ignorieren von Umgebungsänderungen: Wird der Datensatz nicht aktualisiert, wenn sich Beleuchtung, Bauteilorientierung oder Oberflächenzustände ändern, kommt es zu einer Drift in der Genauigkeit.
- Keine Validierung der Daten: Das Überspringen von Qualitätsprüfungen vor dem Training führt häufig zu Zeitverlust und Nacharbeit.
Datenaugmentation
Bildaugmentierungen modifizieren Ihre Trainingsbilder künstlich, um die Robustheit des Modells zu verbessern. Sie simulieren reale Variationen wie Helligkeitsverschiebungen, Drehungen oder Rauschen, damit das Modell unter verschiedenen Bedingungen zuverlässig funktioniert.
Farbaugmentierungen

Brightness
- Was es ist: Passt an, wie hell oder dunkel das Bild erscheint.
- Anwendungsfall: Zur Handhabung geringfügiger Beleuchtungsänderungen während der Produktion.
Verwenden Sie ±0,1 für stabile Aufbauten; erhöhen Sie den Wert, wenn die Beleuchtung stärker variiert.
Contrast
- Was es ist: Verändert den Unterschied zwischen hellen und dunklen Bereichen.
- Anwendungsfall: Nützlich für Teile mit Textur oder variierenden Oberflächen, um dem Modell zu helfen, sich an visuelle Unterschiede anzupassen.
Hue
- Was es ist: Verschiebt die Farbtöne leicht.
- Anwendungsfall: Geeignet für Aufbauten, bei denen sich die Beleuchtungsfarbe (z. B. LED-Temperatur) im Laufe der Zeit verändern kann.
Saturation
- Was es ist: Passt die Intensität der Farben an.
- Anwendungsfall: Hilft bei Beleuchtungsvariationen, die Bilder matter oder lebendiger erscheinen lassen.
Geometrische Augmentierungen

Rotation Range
- Was es ist: Dreht das Bild zufällig innerhalb des festgelegten Bereichs (z. B. ±20°).
- Anwendungsfall: Für Teile, die in leicht gedrehten Positionen ankommen können.
Vermeiden Sie übermäßige Drehung bei Teilen, die normalerweise in einer festen Ausrichtung sind.
Flip
- Was es ist: Spiegelt das Bild horizontal, vertikal oder beides.
- Anwendungsfall: Hilfreich für symmetrische Teile oder wenn die Ausrichtung beim Handling wechseln kann.
Beleuchtungs- und Farbsimulation
Planckian
- Was es ist: Simuliert Variationen der Farbtemperatur (z. B. warme oder kühle Beleuchtung).
- Anwendungsfall: Bewältigt verschiedene Verschiebungen oder Arbeitszellen mit unterschiedlichen Lichtquellen.
Gaussian Noise
- Was es ist: Fügt dem Bild dezentes Rauschen hinzu.
- Anwendungsfall: Verbessert die Robustheit, wenn Ihre Produktionsumgebung leichtes visuelles Rauschen oder Kamerasensor-Artefakte aufweist.
Bewegungssimulation

Motion Blur
- Was es ist: Simuliert leichte Unschärfe, als ob sich das Teil während der Aufnahme bewegt hätte.
- Anwendungsfall: Entscheidend für Hochgeschwindigkeitslinien, bei denen Bewegungsunschärfe auftreten kann.
Wahrscheinlichkeit (prob)
- Was es ist: Legt die Wahrscheinlichkeit fest, mit der jede Augmentierung während des Trainings angewendet wird.
- Beispiel: 0,50 = 50 % Wahrscheinlichkeit, dass diese Änderung auf ein beliebiges Trainingsbild angewendet wird.
Beginnen Sie bei den meisten Augmentierungen mit 0,5 und passen Sie den Wert je nach realer Variabilität an.
Trainingsparameter (Segmentation)
Trainingsparameter (auch Hyperparameter genannt) sind die Einstellungen, die steuern, wie ein Machine-Learning-Modell aus Daten lernt.
Learning Rate
- Definition: Steuert, wie schnell das Modell seine internen Gewichte während des Trainings aktualisiert.
- Wert (0,003): Je höher die Learning Rate, desto schneller lernt das Modell, aber ein zu hoher Wert kann zu Instabilität oder geringer Genauigkeit führen.
- Schieberegler-Bereich: Von 10^-4 (sehr langsam) bis 10^-1 (sehr schnell).
Üblicherweise ist ein Wert zwischen 0,001 und 0,01 ein guter Ausgangspunkt für Segmentation-Aufgaben.
ROI (Region of Interest)-Größe
- Definition: Legt die Größe (Breite × Höhe) des Bildbereichs fest, der während des Trainings verwendet wird.
- Nicht aktiviert: Standardmäßig bestimmt das Modell die ROI automatisch anhand Ihrer Daten.
- Wenn aktiviert: Sie können Breite und Höhe manuell festlegen, wenn Sie einheitliche Eingabedimensionen benötigen (z. B. alle Bilder auf 256×256 Pixel zugeschnitten).
Verwenden Sie eine feste Größe (z. B. 256×256), wenn Ihr Datensatz Bilder unterschiedlicher Größe enthält und Sie eine einheitliche Eingabe für bessere Stabilität, Reproduzierbarkeit oder zur Übereinstimmung mit einer bekannten Modellarchitektur wünschen.
Lassen Sie die automatische Auswahl zu, wenn Ihre Daten bereits eine einheitliche Auflösung haben oder wenn das System auf den besten Region of Interest basierend auf den Eigenschaften Ihres Datensatzes optimieren soll.
Anzahl der Iterationen (Epochs)
- Definition: Eine Epoch = ein vollständiger Durchlauf durch den gesamten Trainingsdatensatz.
- Wert (100): Das Modell wird für 100 vollständige Durchläufe trainiert.
Eine Erhöhung dieser Zahl verbessert in der Regel die Genauigkeit bis zu einem gewissen Punkt, dauert aber länger.
Faustregel: Überwachen Sie während des Trainings den Training- und Validation-Loss. Wenn der Validation-Loss aufhört zu sinken, während der Training-Loss weiter abnimmt, ist dies ein Zeichen dafür, dass das Modell überangepasst (Overfitting) ist und Sie das Training früher beenden sollten.
Architektur
- Definition: Wählt die Größe und Komplexität des neuronalen Netzes aus.
- Small: Trainiert schneller und ist oft für die meisten Datensätze ausreichend. Ideal für schnelle Experimente oder kleinere Datensätze.
- Größere Modelle können mehr Details erfassen, können aber bei kleinen Datensätzen überangepasst werden, während kleinere Modelle effizienter sind und besser generalisieren, wenn die Daten begrenzt sind.
Beginnen Sie mit Small – dies ist oft ausreichend und ermöglicht schnellere Iterationen, bevor Sie hochskalieren.
External GPU
Kontaktieren Sie den Support, um mehr über External GPU zu erfahren.
Trainingsparameter (Classification)
Trainingsparameter (auch Hyperparameter genannt) sind die Einstellungen, die steuern, wie ein Machine-Learning-Modell aus Daten lernt.
Learning Rate
- Definition: Steuert, wie schnell das Modell während des Trainings seine internen Gewichte aktualisiert.
- Wert (0,003): Je höher die Learning Rate, desto schneller lernt das Modell, aber ein zu hoher Wert kann zu Instabilität oder schlechter Genauigkeit führen.
- Schieberegler-Bereich: Von 10^-4 (sehr langsam) bis 10^-1 (sehr schnell).
Üblicherweise ist ein Wert zwischen 0,001–0,01 ein guter Ausgangspunkt für Segmentierungsaufgaben.
Validation Percent
- Definition: Legt fest, welcher Anteil Ihres Datensatzes für die Validierung (Tests während des Trainings) reserviert wird.
- Zweck: Validierungsdaten helfen dabei zu überwachen, wie gut das Modell bei unbekannten Beispielen funktioniert, und verhindern Overfitting.
- Bereich: 0–50 %.
Übliche Werte sind 10–20 %.
Wird der Wert auf 0 % gesetzt, werden alle Daten für das Training verwendet, was die Trainingsgenauigkeit verbessern kann, aber die Erkennung von Overfitting erschwert.
ROI (Region of Interest) Größe
- Definition: Legt die Größe (Breite × Höhe) des Bildbereichs fest, der während des Trainings verwendet wird.
- Nicht aktiviert: Standardmäßig bestimmt das Modell die ROI automatisch anhand Ihrer Daten.
- Wenn aktiviert: Sie können Breite und Höhe manuell festlegen, wenn Sie konsistente Eingabeabmessungen benötigen (zum Beispiel alle Bilder auf 256×256 Pixel zugeschnitten).
Verwenden Sie eine feste Größe (z. B. 256×256), wenn Ihr Datensatz Bilder unterschiedlicher Größe enthält und Sie konsistente Eingaben für bessere Stabilität, Reproduzierbarkeit oder zur Anpassung an eine bekannte Modellarchitektur wünschen.
Lassen Sie die automatische Auswahl zu, wenn Ihre Daten bereits eine einheitliche Auflösung haben oder wenn Sie möchten, dass das System die beste Region of Interest basierend auf den Eigenschaften Ihres Datensatzes optimiert.
Anzahl der Iterationen (Epochs)
- Definition: Eine Epoch = ein vollständiger Durchlauf durch den gesamten Trainingsdatensatz.
- Wert (100): Das Modell wird 100 vollständige Durchläufe trainieren.
Eine Erhöhung dieser Zahl verbessert in der Regel die Genauigkeit bis zu einem gewissen Punkt, dauert aber länger.
Faustregel: Überwachen Sie den Training- und Validation-Loss während des Trainings. Wenn der Validation-Loss nicht mehr sinkt, während der Training-Loss weiter abnimmt, ist dies ein Zeichen dafür, dass das Modell überanpasst (Overfitting) und Sie das Training früher beenden sollten.
Architektur
- Definition: Wählt die Größe und Komplexität des neuronalen Netzwerks aus.
- Small: Trainiert schneller und ist für die meisten Datensätze oft ausreichend. Ideal für schnelle Experimente oder kleinere Datensätze.
Beginnen Sie mit Small – es ist oft ausreichend und hilft Ihnen, schneller zu iterieren, bevor Sie hochskalieren.
| Architektur und Kamera | Beschreibung | Empfohlene Verwendung |
|---|---|---|
| ConvNeXt-Pico | Ultraleichtes Modell, optimiert für Geschwindigkeit und geringen Speicherverbrauch. | Ideal für schnelle Experimente oder eingeschränkte Hardware. |
| ConvNeXt-Nano | Etwas größer als Pico; bessere Genauigkeit bei minimalem Mehraufwand. | Gute Balance für kleine bis mittlere Datensätze. |
| ConvNeXt-Tiny | Bietet verbesserte Genauigkeit bei weiterhin effizientem Betrieb. | Geeignet für mittelgroße Datensätze und längere Trainingsläufe. |
| ConvNeXt-Small | Leistungsfähigste Variante in dieser Liste. Höhere Kapazität und Genauigkeit. | Für große Datensätze oder wenn maximale Leistung erforderlich ist. |
External GPU
Wenden Sie sich an den Support, um mehr über External GPU zu erfahren.





