KI-GESTÜTZTE DOKUMENTATION
Was möchten Sie wissen?
Erste Recipe-Erstellung
Dieser Deep Dive erklärt, was ein Recipe ist, beschreibt die Unterschiede zwischen Classification und Segmentation und bietet eine Schritt-für-Schritt-Anleitung zur Erstellung eines Recipes. Er enthält außerdem eine detaillierte Anleitung zur Konfiguration des Imaging Setups, zur Aufnahme eines Template Images und Einrichtung des Aligners, zur ROI-Optimierung, zur Datenerfassung und zum AI-Training sowie zur Konfiguration der Bildaugmentierung.
Sehen Sie sich dieses Thema in Aktion an: How to create a segmentation recipe in minutes
Lernziele
Am Ende dieses Deep Dives werden Sie verstehen:
- was ein Recipe ist
- den Unterschied zwischen Classification und Segmentation – und wann welche Methode zu verwenden ist
- wie Sie ein Recipe erstellen
- wie Sie das Imaging Setup konfigurieren
- wie Sie ein Template Image aufnehmen und den Aligner konfigurieren
- was ROIs (Regions of Interest) sind und wie Sie sie optimieren
- Datenerfassung für das AI-Training
- Recipe-Tests und Validierung
Was ist ein Recipe?
- Ein konfigurierter Satz von Anweisungen, der der Kamera vorgibt, wie ein bestimmtes Teil oder Produkt inspiziert werden soll.
- Definiert Kameraeinstellungen, einschließlich Belichtung, Fokus und Beleuchtungsparameter für eine gleichbleibende Bildaufnahme.
- Beinhaltet Verarbeitungslogik wie ROI-Definitionen, Aligner, Classification- oder Segmentation-Klassen.
- Speichert Input/Output-Konfigurationen zur Integration in Automatisierungssysteme für Pass/Fail- oder erweiterte Signale.
- Kann gespeichert und wiederverwendet werden, um konsistente Inspektionen über Schichten, Linien oder Standorte hinweg sicherzustellen.
Classification vs. Segmentation
Definitionen
- Classification: Identifizierung des Objekttyps in der ROI
- Segmentation: Lokalisierung und Analyse von Bereichen im Bild/in der ROI
Beispiele
| Image Classification | Image Segmentation | Image Classification | Image Segmentation |
|---|---|---|---|
| Was ist ein Schaf? | Welche Pixel gehören zu welchem Objekt? | Ist diese Pizza akzeptabel oder fehlerhaft? | Wo befindet sich jede Pepperoni? |
![]() | ![]() | ![]() | ![]() |
Wichtiger Vergleich
| Classification | Segmentation | |
|---|---|---|
| Geschwindigkeit | Die Geschwindigkeit hängt vom Image Setup und der Komplexität ab. Im Allgemeinen effizient und schnell bei einfachen Setups | Kann genauso schnell oder sogar schneller als Classification sein, wenn sie optimiert ist, besonders mit schlanken Modellen |
| Genauigkeit | Gut für allgemeine Pass/Fail- oder Teiletyp-Identifikation | Höhere Genauigkeit für präzise Fehler-Lokalisierung |
| Komplexität | Einfach einzurichten und zu warten; weniger Parameter | Komplex – Benötigt mehr Daten, Labeling und Tuning |
| Datenbedarf | Gering – Benötigt weniger gelabelte Bilder | Moderat – Erfordert viele Bilder mit detaillierten, pixelgenauen Annotationen |
| Anwendungsfälle | Teileanwesenheit, Orientierung, grundlegende Qualitätsprüfungen, Teil eingesetzt/nicht eingesetzt usw. | Oberflächenfehler, Feinmerkmalsprüfung, Erkennung mehrerer Defekte, Zählung, Messung usw. |
Erstellen und Exportieren eines Recipes
Verwenden Sie die Schaltfläche Export Recipe neben einem Recipe, um ein einzelnes Recipe zu exportieren.
Verwenden Sie die Schaltfläche Export oben auf dem Bildschirm, um mehrere Recipes gleichzeitig zu exportieren.

Verwenden Sie die Schaltfläche Import oben auf dem Bildschirm, um Recipes zu importieren.

Hinweis: Jedes Recipe unterstützt jeweils nur einen Inspektionstyp – entweder Segmentation oder Classification. Wählen Sie den richtigen Typ aus, bevor Sie mit der Einrichtung beginnen.
Imaging Setup
Focus
- Was es ist: Stellt die Schärfe des aufgenommenen Bildes ein.
- Verwendung: Schieben Sie den Regler, bis Kanten und Details im Bild scharf und klar erscheinen.
Verwenden Sie beim Fokussieren ein Zielobjekt mit klaren Kanten (z. B. ein Lineal oder eine Kalibrierkarte).
Image Rotation
- Was es ist: Dreht das Bild (0° oder 180°).
- Wann zu verwenden: Wenn die Kamera in einem bestimmten Winkel montiert ist, das Bild in der Benutzeroberfläche aber anders herum dargestellt werden soll.
Wenn Sie das Bild um 90° drehen müssen, drehen Sie die Kamera.
Exposure (ms)
- Was es ist: Wie lange der Sensor während der Bildaufnahme dem Licht ausgesetzt wird.
- Auswirkung:
- Höhere Belichtung → hellere Bilder, jedoch Risiko von Bewegungsunschärfe.
- Geringere Belichtung → weniger Licht, aber schärfere Bilder bei schnell bewegten Anwendungen.
| Underexposed | Correctly Exposed | Overexposed |
|---|---|---|
Die Belichtung ist logarithmisch, und eine höhere Belichtung bedeutet mehr Latenz (da mehr Zeit für die Bildaufnahme benötigt wird).
Gain
- Was es ist: Hellt das Bild digital künstlich auf (vergleichbar mit ISO bei einer Kamera).
- Auswirkung:
- Höherer Gain → helleres Bild, fügt jedoch Rauschen hinzu (körniges Aussehen).
- Niedrigerer Gain → saubereres Bild, erfordert jedoch gute Beleuchtung.
| High Gain | Low Gain |
|---|---|
![]() | ![]() |
| Heller und stärker verrauscht | Dunkler und weniger Rauschen |
Erhöhen Sie den Gain nur, wenn eine Anpassung von Exposure oder Beleuchtung nicht möglich ist.
Auto White Balance
- Was es ist: Passt den Weißabgleich automatisch so an, dass Weißtöne weiß erscheinen.
- Wann zu verwenden:
- Ideal für Umgebungen mit variablen oder wechselnden Lichtverhältnissen.
- Bei stabilen Setups liefert ein manueller Weißabgleich konsistentere und reproduzierbarere Ergebnisse.
So passen Sie den Weißabgleich manuell an:
- Schalten Sie den Auto White Balance-Schalter ON.
- Legen Sie ein weißes Blatt Papier unter die Kamera oder vor das Objektiv.
- Schalten Sie den Schalter OFF, um die Weißabgleich-Einstellung zu fixieren.
Gamma
- Was es ist: Passt die Helligkeit der Mitteltöne an, ohne dunkle oder helle Bereiche zu stark zu beeinflussen.
- Effekt: Hilfreich, um Details in Schatten sichtbar zu machen oder zu helle Lichter abzumildern.
Lens Correction
- Was es ist: Korrigiert Verzerrungen durch Weitwinkelobjektive.
- Wann aktivieren: Wenn die Bildränder gekrümmt oder verzerrt erscheinen, schalten Sie diese Option ON, um die Genauigkeit bei Ausrichtungsaufgaben zu verbessern.
LED Strobe Mode
- Was es ist: Steuert, wann die integrierte LED-Beleuchtung der Kamera ausgelöst wird.
- Optionen:
- Off: LED ist dauerhaft eingeschaltet.
- On: LED blitzt nur während der Bildaufnahme, wodurch Reflexionen reduziert werden.
LED Light Pattern
- Was es ist: Legt fest, wie die LEDs leuchten (z. B. alle an, alle aus, links und rechts, oben und unten usw.).
- Anwendungsfall: Passen Sie die Einstellung an Ihren Beleuchtungsaufbau an, um eine optimale Ausleuchtung des Teils zu erreichen.
Verwenden Sie gerichtete Muster, um Blendung oder Reflexionen zu reduzieren, indem Sie die LEDs ausschalten, die direkt auf reflektierende Oberflächen strahlen, während Sie angewinkelte Lichtquellen für bessere Sichtbarkeit aktiv lassen.
LED Light Intensity
- Was es ist: Passt die Helligkeit der LED-Beleuchtung an.
- Best Practice: Beginnen Sie mit einem niedrigen Wert und erhöhen Sie ihn schrittweise, um Blendung oder Reflexionen zu vermeiden.
Photometric Control
- Was es ist: Nimmt mehrere Bilder auf (typischerweise vier) mit unterschiedlicher gerichteter Beleuchtung (links, rechts, oben und unten) und kombiniert sie anschließend zu einem einzigen verbesserten Bild.
- Zweck: Diese Technik reduziert Schatten und hebt feine Oberflächenmerkmale hervor, indem sie eine gleichmäßige, konsistente Ausleuchtung des Teils gewährleistet.
- Wann verwenden: Ideal für komplexe Teile, stark reflektierende Oberflächen oder Teile mit ungleichmäßigen Texturen, bei denen Standard-Einzellichtbilder kritische Details übersehen könnten.
Trigger Settings
Manual Trigger
- Was es ist: Erfasst Bilder, wenn Sie die Taste auf dem HMI-Bildschirm drücken.
- Am besten geeignet für: Tests, Einrichtung oder manuelle Inspektionen.
Hardware Trigger
- Was es ist: Verwendet ein elektrisches Signal (z. B. von einem Sensor), um die Kamera auszulösen.
- Am besten geeignet für: Automatisierte Linien, bei denen ein Sensor die Anwesenheit eines Teils erkennt.
PLC Trigger
- Was es ist: Auslösesignale werden über industrielle Steuerungen (PLCs) gesendet, um eine synchronisierte Operation mit anderen Maschinen zu ermöglichen.
- Am besten geeignet für: Vollautomatisierte Systeme, die eine präzise Zeitsteuerung erfordern.
Aligner Trigger
- Was es ist: Löst automatisch aus, wenn das System eine Teileausrichtung im Sichtfeld erkennt.
- Am besten geeignet für: Anwendungen, bei denen Teile vor der Aufnahme konsistent positioniert werden müssen oder wenn keine anderen zuverlässigen Trigger verfügbar sind.
Interval Trigger
- Was es ist: Löst die Kamera in festgelegten Zeitintervallen aus.
- Am besten geeignet für: Kontinuierliche Prozesse oder die Überwachung sich bewegender Linien ohne Teileerkennungssensoren.
Vorlagenbild und Ausrichtung
Skip Aligner
- Was es ist: Deaktiviert den Ausrichtungsschritt während der Inspektion.
- Wann verwenden: Wenn sich das Teil immer in derselben Position und Ausrichtung im Bild befindet.
Template Regions
- Was es ist: Definiert den/die Bereich(e) des Vorlagenbildes, der/die zur Ausrichtung verwendet wird/werden.
- Rectangle: Zeichnen Sie eine rechteckige ROI.
- Circle: Zeichnen Sie eine kreisförmige ROI.
- Ignore Template Region: Schließen Sie bestimmte Bereiche von der Ausrichtung aus, um störende Muster oder irrelevante Merkmale zu vermeiden.
- Beste Verwendung: Hilft dem System, sich nur auf die markantesten Merkmale des Teils zu konzentrieren, um eine genaue Ausrichtung zu erzielen.
Rotation Range
- Was es ist: Legt fest, wie viel Rotation (in Grad) das System beim Abgleich des Teils mit der Vorlage toleriert.
- Beispiel: Eine Einstellung von ±20° erlaubt eine leichte Rotation des Teils, ohne dass es nicht mehr erkannt wird.
- Wann anpassen: Erhöhen, wenn Teile während der Produktion zur Rotation neigen; verringern bei sehr gleichbleibender Ausrichtung.
Sensitivity
- Was es ist: Steuert, wie fein das System nach einer Übereinstimmung zwischen dem Live-Bild und der Vorlage sucht.
- Auswirkung:
- Hohe Empfindlichkeit → erkennt subtilere Details, nützlich für komplexe Teile.
- Niedrigere Empfindlichkeit → reduziert Fehlübereinstimmungen, kann aber feine Merkmale übersehen.
Confidence Threshold
- Was es ist: Legt den minimalen Konfidenzwert fest, der erforderlich ist, damit das System eine Erkennung akzeptiert.
- Auswirkung:
- Höherer Schwellenwert → weniger Falschmeldungen, aber Grenzfälle könnten übersehen werden.
- Niedrigerer Schwellenwert → mehr Erkennungen, aber mit erhöhtem Risiko von Falschmeldungen.
Beginnen Sie mit einem moderaten Wert und passen Sie ihn basierend auf den Testergebnissen an.
Scale Invariant
- Was es ist: Ermöglicht dem System die Erkennung von Teilen, die etwas größer oder kleiner als das ursprüngliche Vorlagenbild sind.
- Wann aktivieren: Wenn die Teilegröße aufgrund von Positionierung, Abstandsänderungen oder Fertigungstoleranzen leicht variieren kann.
Live Preview Legend

1. Ein konfigurierbarer Bounding Box, der den spezifischen Bereich des Kamera-FOV definiert, der während der Triggerung überwacht werden soll.
- Zweck: Stellt sicher, dass sich die Kamera nur auf den relevanten Bereich konzentriert und unnötige Hintergrundbereiche ignoriert.
- Beste Verwendung:
- Bei bewegten Objekten, um sicherzustellen, dass das Teil vollständig im Erkennungsbereich bleibt.
- Zur Optimierung der Verarbeitungsgeschwindigkeit, indem die Menge der analysierten Bilddaten reduziert wird.
2. Ein visueller roter Punkt, der den Mittelpunkt aller definierten ROIs (Regions of Interest) im Bild anzeigt.
- Zweck: Hilft Ihnen, den Suchbereich relativ zum Teil oder zur Kameraansicht auszurichten und zu positionieren.
3. Die grüne Linie zeigt an, dass die Kante des Objekts erkannt wurde.
Wenn sich die Linie rot färbt, versuchen Sie, die ROI-Größe zu erhöhen, die ROI anzupassen oder die Sensitivity zu erhöhen.

ROI (Region of Interest) Definition und Optimierung
Inspektionstypen
- Was es ist: Definiert den Typ der durchgeführten Inspektion und gruppiert ähnliche ROIs (Regions of Interest).
- Beispiel: „Holes" zur Prüfung von Vorhandensein, Größe oder Qualität von Bohrungen in einem Teil.
- Hauptmerkmale:
- Add Inspection Type: Erstellen Sie neue Kategorien für unterschiedliche Inspektionsanforderungen.
- # of ROIs: Zeigt an, wie viele ROIs aktuell diesem Inspektionstyp zugeordnet sind.
Transformation

- Was es ist: Passt Position und Geometrie ausgewählter ROIs für präzise Ausrichtung und Platzierung an.
- Felder und ihr Zweck:
- Height/Width: Ändert die Größe der ROI.
- X / Y: Verschiebt die Position der ROI entlang der horizontalen (X) und vertikalen (Y) Achse.
- Angle: Rotiert die ROI um ihren Mittelpunkt.
- Beste Anwendung: Beschleunigt die Einrichtung bei sich wiederholenden Mustern, wie z. B. mehreren identischen Bohrungen.
Regions of Interest (ROIs)

- Was es ist: Eine Liste aller im Vorlagenbild definierten ROIs.
- Funktionen:
- Add Region of Interest (ROI): Erstellen Sie eine neue ROI manuell.
- Ignore Regions: Schließen Sie bestimmte Bereiche von der Verarbeitung aus.
- Edit: Speichern, löschen oder abbrechen.
- Lock Icon: Zeigt gesperrte ROIs an, die ohne Entsperren nicht verschoben werden können.
Live Preview Mode
- Was es ist: Zeigt Echtzeit-Feedback nach dem Anpassen oder Hinzufügen von ROIs.
- Anwendungsfall: Hervorragend geeignet zur Feinabstimmung von ROI-Positionen und -Größen während der Einrichtung.
Test-Schaltfläche
- Was es ist: Führt Backtesting auf Basis alter Bilder aus, um Änderungen zu verifizieren.
- Anwendungsfall: Vergleich aktueller Ergebnisse mit vorherigen Einstellungen hinsichtlich Genauigkeit und Konsistenz.
Datenerfassung und KI-Training
Definieren Sie verschiedene Inspektionsklassen und beschriften Sie jede ROI basierend auf ihrem zugewiesenen Inspektionstyp (siehe Beispiel unten).

Verwenden Sie die Annotation Tools, um das Bild zu beschriften/annotieren. Verwenden Sie das Dropdown-Menü Brush Class, um die zu annotierende Klasse auszuwählen. Das aktuelle Limit liegt bei bis zu 10 Klassen pro Rezept für die Segmentierung.

Bedeutung guter Daten

-
Garbage In, Garbage Out: KI-Modelle können nur so gut sein wie die Daten, mit denen sie gefüttert werden. Daten von schlechter Qualität oder inkonsistente Daten führen zu ungenauen Ergebnissen.
-
Vielfalt zählt: Erfassen Sie Daten, die alle realen Variationen abbilden: unterschiedliche Schichten, Lichtverhältnisse, Teilepositionen und Oberflächenzustände.
-
Qualität vor Quantität: Ein kleinerer, sauberer und gut beschrifteter Datensatz erzielt oft bessere Ergebnisse als ein großer, aber verrauschter oder inkonsistenter Datensatz.
Annotations-Grundlagen:
- Classification: Markieren Sie ganze Bilder oder ROIs als bestimmte Klasse (z. B. „Good", „Damaged").
- Segmentation: Übermalen, umreißen oder markieren Sie bestimmte interessante Bereiche mit pixelgenauer Präzision (z. B. die Position eines Kratzers auf einer Oberfläche).
- Konsistenz: Verwenden Sie einheitliche Regeln und Definitionen für die Beschriftung, um Verwirrung während des Trainings zu vermeiden.

Häufige Fallstricke
- Unzureichende Daten: Zu wenige Stichproben führen zu Underfitting und damit zu schlechter Leistung im realen Einsatz.
- Unausgewogene Klassen: Eine Überrepräsentation einer Klasse (z. B. viele „gute" Teile, aber wenige fehlerhafte) verzerrt das Modell.
- Schlechte Beschriftung: Falsche, inkonsistente oder hastige Beschriftung führt zu erheblichen Genauigkeitseinbußen.
- Ignorieren von Umgebungsänderungen: Wird der Datensatz bei Änderungen der Beleuchtung, Teileausrichtung oder Oberflächenbeschaffenheit nicht aktualisiert, kommt es zu einer Drift der Genauigkeit.
- Keine Datenvalidierung: Das Überspringen von Qualitätsprüfungen vor dem Training führt häufig zu Zeitverlust und Nacharbeit.
Datenaugmentierung
Bildaugmentierungen modifizieren Ihre Trainingsbilder künstlich, um die Robustheit des Modells zu verbessern. Sie simulieren reale Variationen wie Helligkeitsschwankungen, Rotationen oder Rauschen, damit das Modell unter verschiedenen Bedingungen gut funktioniert.
Farbaugmentierungen

Brightness
- Was es ist: Passt an, wie hell oder dunkel das Bild erscheint.
- Anwendungsfall: Zur Bewältigung leichter Beleuchtungsänderungen während der Produktion.
Verwenden Sie ±0,1 für stabile Setups; erhöhen Sie den Wert, wenn die Beleuchtung stärker variiert.
Contrast
- Was es ist: Verändert den Unterschied zwischen hellen und dunklen Bereichen.
- Anwendungsfall: Nützlich für Teile mit Textur oder unterschiedlichen Oberflächen, um dem Modell zu helfen, sich an visuelle Unterschiede anzupassen.
Hue
- Was es ist: Verschiebt die Farbtöne leicht.
- Anwendungsfall: Geeignet für Setups, bei denen sich die Lichtfarbe (z. B. LED-Temperatur) im Laufe der Zeit ändern kann.
Saturation
- Was es ist: Passt die Intensität der Farben an.
- Anwendungsfall: Hilft bei der Bewältigung von Beleuchtungsschwankungen, die Bilder matter oder lebendiger erscheinen lassen.
Geometrische Augmentierungen

Rotation Range
- Was es ist: Dreht das Bild zufällig innerhalb des festgelegten Bereichs (z. B. ±20°).
- Anwendungsfall: Für Teile, die in leicht gedrehten Positionen ankommen können.
Vermeiden Sie übermäßige Rotation bei Teilen, deren Ausrichtung normalerweise fixiert ist.
Flip
- Was es ist: Spiegelt das Bild horizontal, vertikal oder beides.
- Anwendungsfall: Hilfreich für symmetrische Teile oder wenn sich die Ausrichtung während der Handhabung ändern kann.
Beleuchtungs- und Farbsimulation
Planckian
- Was es ist: Simuliert Variationen der Farbtemperatur (z. B. warmes oder kaltes Licht).
- Anwendungsfall: Bewältigt verschiedene Schichten oder Arbeitszellen mit unterschiedlichen Lichtquellen.
Gaussian Noise
- Was es ist: Fügt dem Bild dezentes Rauschen hinzu.
- Anwendungsfall: Verbessert die Robustheit, wenn Ihre Produktionsumgebung geringes visuelles Rauschen oder Artefakte des Kamerasensors aufweist.
Bewegungssimulation

Motion Blur
- Was es ist: Simuliert leichte Unschärfe, als ob sich das Teil während der Aufnahme bewegt hätte.
- Anwendungsfall: Entscheidend für Hochgeschwindigkeitslinien, bei denen Bewegungsunschärfe auftreten kann.
Probability (prob)
- Was es ist: Legt die Wahrscheinlichkeit fest, mit der jede Augmentierung während des Trainings angewendet wird.
- Beispiel: 0,50 = 50 % Wahrscheinlichkeit, diese Änderung auf ein beliebiges Trainingsbild anzuwenden.
Beginnen Sie für die meisten Augmentierungen bei 0,5 und passen Sie den Wert basierend auf der realen Variabilität an.
Trainingsparameter (Segmentation)
Trainingsparameter (auch Hyperparameter genannt) sind die Einstellungen, die steuern, wie ein Machine-Learning-Modell aus Daten lernt.
Learning Rate
- Definition: Steuert, wie schnell das Modell seine internen Gewichte während des Trainings aktualisiert.
- Wert (0,003): Je höher die Learning Rate, desto schneller lernt das Modell, aber ein zu hoher Wert kann zu Instabilität oder schlechter Genauigkeit führen.
- Schieberegler-Bereich: Von 10^-4 (sehr langsam) bis 10^-1 (sehr schnell).
Üblicherweise ist ein Wert zwischen 0,001 und 0,01 ein guter Ausgangspunkt für Segmentierungsaufgaben.
ROI (Region of Interest) Größe
- Definition: Legt die Größe (Breite × Höhe) des Bildbereichs fest, der während des Trainings verwendet wird.
- Deaktiviert: Standardmäßig bestimmt das Modell die ROI automatisch anhand Ihrer Daten.
- Aktiviert: Sie können Breite und Höhe manuell festlegen, wenn Sie einheitliche Eingabedimensionen benötigen (zum Beispiel alle Bilder auf 256×256 Pixel zugeschnitten).
Verwenden Sie eine feste Größe (z. B. 256×256), wenn Ihr Datensatz Bilder unterschiedlicher Größen enthält und Sie eine einheitliche Eingabe für bessere Stabilität, Reproduzierbarkeit oder zur Anpassung an eine bekannte Modellarchitektur wünschen.
Lassen Sie die automatische Auswahl zu, wenn Ihre Daten bereits eine einheitliche Auflösung haben oder wenn Sie möchten, dass das System die beste Region of Interest basierend auf den Eigenschaften Ihres Datensatzes optimiert.
Anzahl der Iterationen (Epochs)
- Definition: Eine Epoch = ein vollständiger Durchlauf des gesamten Trainingsdatensatzes.
- Wert (100): Das Modell wird für 100 vollständige Durchläufe trainiert.
Eine Erhöhung dieser Zahl verbessert die Genauigkeit in der Regel bis zu einem bestimmten Punkt, dauert aber länger.
Faustregel: Überwachen Sie den Trainings- und Validierungsverlust während des Trainings. Wenn der Validierungsverlust nicht mehr abnimmt, während der Trainingsverlust weiter sinkt, ist dies ein Zeichen dafür, dass das Modell überangepasst (overfitting) ist und Sie das Training früher beenden sollten.
Architektur
- Definition: Wählt die Größe und Komplexität des neuronalen Netzwerks aus.
- Small: Trainiert schneller und ist für die meisten Datensätze oft ausreichend. Ideal für schnelle Experimente oder kleinere Datensätze.
- Größere Modelle können mehr Details erfassen, neigen jedoch bei kleinen Datensätzen zu Overfitting, während kleinere Modelle effizienter sind und bei begrenzten Daten besser generalisieren.
Beginnen Sie mit Small – das ist oft ausreichend und hilft Ihnen, schneller zu iterieren, bevor Sie skalieren.
Externe GPU
Wenden Sie sich an den Support, um mehr über die External GPU zu erfahren.
Trainingsparameter (Classification)
Trainingsparameter (auch Hyperparameter genannt) sind die Einstellungen, die steuern, wie ein Machine-Learning-Modell aus Daten lernt.
Learning Rate
- Definition: Steuert, wie schnell das Modell seine internen Gewichte während des Trainings aktualisiert.
- Wert (0.003): Je höher die Learning Rate, desto schneller lernt das Modell, aber ein zu hoher Wert kann zu Instabilität oder geringer Genauigkeit führen.
- Slider-Bereich: Von 10^-4 (sehr langsam) bis 10^-1 (sehr schnell).
Ein Wert zwischen 0.001–0.01 ist in der Regel ein guter Ausgangspunkt für Segmentierungsaufgaben.
Validation Percent
- Definition: Legt fest, welcher Anteil Ihres Datensatzes für die Validierung (Test während des Trainings) reserviert wird.
- Zweck: Validierungsdaten helfen dabei, zu überwachen, wie gut das Modell bei unbekannten Beispielen abschneidet, und verhindern Overfitting.
- Bereich: 0–50 %.
Übliche Werte liegen bei 10–20 %.
Wenn auf 0 % gesetzt, werden alle Daten für das Training verwendet, was die Trainingsgenauigkeit verbessern kann, aber die Erkennung von Overfitting erschwert.
ROI (Region of Interest) Größe
- Definition: Legt die Größe (Breite × Höhe) des Bildbereichs fest, der während des Trainings verwendet wird.
- Nicht aktiviert: Standardmäßig bestimmt das Modell die ROI automatisch anhand Ihrer Daten.
- Wenn aktiviert: Sie können Breite und Höhe manuell festlegen, wenn Sie konsistente Eingabedimensionen benötigen (z. B. alle Bilder auf 256×256 Pixel zugeschnitten).
Verwenden Sie eine feste Größe (z. B. 256×256), wenn Ihr Datensatz Bilder unterschiedlicher Größe enthält und Sie eine konsistente Eingabe für bessere Stabilität, Reproduzierbarkeit oder zur Übereinstimmung mit einer bekannten Modellarchitektur wünschen.
Lassen Sie die Größe automatisch wählen, wenn Ihre Daten bereits eine einheitliche Auflösung haben oder wenn Sie möchten, dass das System die beste Region of Interest basierend auf den Eigenschaften Ihres Datensatzes optimiert.
Anzahl der Iterationen (Epochs)
- Definition: Eine Epoch = ein vollständiger Durchlauf des gesamten Trainingsdatensatzes.
- Wert (100): Das Modell wird für 100 vollständige Durchläufe trainiert.
Eine Erhöhung dieses Werts verbessert in der Regel die Genauigkeit bis zu einem gewissen Punkt, dauert aber länger.
Faustregel: Überwachen Sie den Training- und Validation Loss während des Trainings. Wenn der Validation Loss aufhört zu sinken, während der Training Loss weiter fällt, ist dies ein Zeichen dafür, dass das Modell überangepasst (overfitting) ist und Sie das Training früher beenden sollten.
Architektur
- Definition: Wählt die Größe und Komplexität des neuronalen Netzwerks aus.
- Small: Trainiert schneller und ist für die meisten Datensätze oft ausreichend. Ideal für schnelle Experimente oder kleinere Datensätze.
Beginnen Sie mit Small – das ist oft ausreichend und ermöglicht schnellere Iterationen, bevor Sie hochskalieren.
| Architektur und Kamera | Beschreibung | Empfohlene Verwendung |
|---|---|---|
| ConvNeXt-Pico | Ultraleichtes Modell, optimiert für Geschwindigkeit und geringen Speicherbedarf. | Hervorragend für schnelle Experimente oder begrenzte Hardware. |
| ConvNeXt-Nano | Etwas größer als Pico; bessere Genauigkeit bei minimalem Mehraufwand. | Gute Balance für kleine bis mittlere Datensätze. |
| ConvNeXt-Tiny | Bietet verbesserte Genauigkeit bei weiterhin hoher Effizienz. | Geeignet für mittlere Datensätze und längere Trainingsläufe. |
| ConvNeXt-Small | Leistungsstärkste Variante in dieser Liste. Höhere Kapazität und Genauigkeit. | Verwenden Sie diese für große Datensätze oder wenn maximale Leistung erforderlich ist. |
Externe GPU
Kontaktieren Sie den Support, um mehr über die externe GPU zu erfahren.





