KI-GESTÜTZTE DOKUMENTATION
Was möchten Sie wissen?
Erste Rezepterstellung
Diese vertiefte Betrachtung erklärt, was ein Rezept ist, beschreibt die Unterschiede zwischen Klassifikation und Segmentierung und bietet eine schrittweise Anleitung zur Erstellung eines Rezepts. Sie enthält außerdem eine detaillierte Anleitung zur Konfiguration des Imaging Setup, zur Aufnahme eines Template Image und zur Einrichtung des Aligners, zur ROI-Optimierung, zur Datenerfassung und zum AI-Training sowie zur Konfiguration der Bildaugmentierung.
Sehen Sie sich dieses Thema in Aktion an: How to create a segmentation recipe in minutes
Lernziele
Am Ende dieser vertieften Betrachtung verstehen Sie:
- was ein Rezept ist
- den Unterschied zwischen Klassifikation und Segmentierung – und wann welche zu verwenden ist
- wie man ein Rezept erstellt
- wie man das Imaging Setup konfiguriert
- wie man ein Template Image aufnimmt und den Aligner konfiguriert
- was ROIs (Regions of Interest) sind und wie man sie optimiert
- Datenerfassung für AI-Training
- Rezept-Test und Validierung
Was ist ein Rezept?
- Ein konfigurierter Satz von Anweisungen, der der Kamera vorgibt, wie ein bestimmtes Teil oder Produkt inspiziert werden soll.
- Definiert Kameraeinstellungen, einschließlich Belichtung, Fokus und Beleuchtungsparameter für eine konsistente Bildaufnahme.
- Enthält Verarbeitungslogik wie ROI-Definitionen, Aligner, Klassifikations- oder Segmentierungsklassen.
- Speichert Ein-/Ausgangskonfigurationen zur Integration mit Automatisierungssystemen für Pass/Fail- oder erweiterte Signale.
- Kann gespeichert und wiederverwendet werden, um konsistente Inspektionen über Schichten, Linien oder Standorte hinweg zu gewährleisten.
Klassifikation vs. Segmentierung
Definitionen
- Klassifikation: Identifizieren des Objekttyps im ROI
- Segmentierung: Lokalisieren und Analysieren von Regionen im Bild/ROI
Beispiele
| Bildklassifikation | Bildsegmentierung | Bildklassifikation | Bildsegmentierung |
|---|---|---|---|
| Was ist ein Schaf? | Welche Pixel gehören zu welchem Objekt? | Ist diese Pizza akzeptabel oder fehlerhaft? | Wo befindet sich jede Pepperoni? |
![]() | ![]() | ![]() | ![]() |
Wesentlicher Vergleich
| Klassifikation | Segmentierung | |
|---|---|---|
| Geschwindigkeit | Die Geschwindigkeit hängt vom Imaging Setup und der Komplexität ab. Bei einfachen Setups generell effizient und schnell | Bei Optimierung genauso schnell oder sogar schneller als Klassifikation, insbesondere mit schlanken Modellen |
| Genauigkeit | Gut für allgemeine Pass/Fail- oder Teiletyp-Identifizierung | Höhere Genauigkeit für präzise Fehlerlokalisierung |
| Komplexität | Einfach einzurichten und zu warten; weniger Parameter | Komplex – Erfordert mehr Daten, Labeling und Tuning |
| Datenanforderung | Gering – Erfordert weniger gelabelte Bilder | Moderat – Erfordert viele Bilder mit detaillierten pixelgenauen Annotationen |
| Anwendungsfälle | Teileanwesenheit, Ausrichtung, grundlegende Qualitätsprüfungen, Teil eingesetzt/nicht eingesetzt usw. | Oberflächenfehler, Feinmerkmal-Inspektion, Mehrfachfehlererkennung, Zählung, Vermessung usw. |
Erstellen und Exportieren eines Rezepts
Verwenden Sie die Schaltfläche Export Recipe neben einem Rezept, um ein einzelnes Rezept zu exportieren.
Verwenden Sie die Schaltfläche Export oben auf dem Bildschirm, um mehrere Rezepte gleichzeitig zu exportieren.

Verwenden Sie die Schaltfläche Import oben auf dem Bildschirm, um Rezepte zu importieren.

Hinweis: Jedes Rezept unterstützt jeweils nur einen Inspektionstyp – entweder Segmentierung oder Klassifizierung. Wählen Sie vor Beginn der Einrichtung den richtigen Typ aus.
Imaging Setup
Focus
- Was es ist: Stellt die Schärfe des aufgenommenen Bildes ein.
- Verwendung: Schieben Sie den Regler, bis Kanten und Details im Bild klar und scharf erscheinen.
Verwenden Sie zum Fokussieren ein Zielobjekt mit klaren Kanten (wie ein Lineal oder eine Kalibrierkarte).
Image Rotation
- Was es ist: Dreht das Bild (0° oder 180°).
- Wann verwenden: Wenn die Kamera in einem bestimmten Winkel montiert ist, das Bild in der Benutzeroberfläche jedoch anders ausgerichtet angezeigt werden soll.
Wenn Sie das Bild um 90° drehen müssen, drehen Sie die Kamera.
Exposure (ms)
- Was es ist: Wie lange der Sensor während der Bildaufnahme dem Licht ausgesetzt ist.
- Auswirkung:
- Höhere Belichtung → hellere Bilder, aber Risiko von Bewegungsunschärfe.
- Geringere Belichtung → weniger Licht, aber schärfere Bilder bei schnellen Bewegungen.
| Unterbelichtet | Korrekt belichtet | Überbelichtet |
|---|---|---|
Die Belichtung ist logarithmisch, und eine höhere Belichtung bedeutet eine höhere Latenz (da die Bildaufnahme mehr Zeit erfordert).
Gain
- Was es ist: Hellt das Bild digital künstlich auf (ähnlich wie ISO bei einer Kamera).
- Auswirkung:
- Höherer Gain → helleres Bild, fügt aber Rauschen hinzu (körniges Aussehen).
- Niedrigerer Gain → saubereres Bild, benötigt aber gute Beleuchtung.
| Hoher Gain | Niedriger Gain |
|---|---|
![]() | ![]() |
| Heller und stärker verrauscht | Dunkler und weniger Rauschen |
Erhöhen Sie den Gain nur dann, wenn eine Anpassung der Belichtung oder Beleuchtung nicht möglich ist.
Auto White Balance
- Was es ist: Passt den Farbabgleich automatisch an, sodass Weiß als Weiß erscheint.
- Wann verwenden:
- Ideal für Umgebungen mit variablen oder wechselnden Lichtverhältnissen.
- Bei stabilen Setups liefert ein manueller Weißabgleich konsistentere und reproduzierbarere Ergebnisse.
So passen Sie den Weißabgleich manuell an:
- Schalten Sie den Auto White Balance-Schalter auf ON.
- Legen Sie ein weißes Blatt Papier unter die Kamera oder vor das Objektiv.
- Schalten Sie den Schalter auf OFF, um die Weißabgleich-Einstellung zu fixieren.
Gamma
- Was es ist: Passt die Helligkeit der Mitteltöne an, ohne dunkle oder helle Bereiche zu stark zu beeinflussen.
- Wirkung: Hilfreich, um Details in Schatten sichtbar zu machen oder zu helle Glanzlichter zu reduzieren.
Lens Correction
- Was es ist: Korrigiert Verzerrungen von Weitwinkelobjektiven.
- Wann aktivieren: Wenn die Bildränder gekrümmt oder verzerrt erscheinen, aktivieren Sie diese Option für eine präzise Ausrichtung.
LED Strobe Mode
- Was es ist: Steuert, wann die integrierte LED-Beleuchtung der Kamera ausgelöst wird.
- Optionen:
- Off: LED leuchtet dauerhaft.
- On: LED blitzt nur während der Aufnahme, was Reflexionen reduziert.
LED Light Pattern
- Was es ist: Wählt aus, wie die LEDs leuchten (z. B. Alle an, alle aus, Links und rechts, Oben und unten usw.).
- Anwendungsfall: Passen Sie die Einstellung an Ihren Beleuchtungsaufbau an, um eine optimale Ausleuchtung des Teils zu erreichen.
Verwenden Sie gerichtete Muster, um Blendung oder Reflexionen zu reduzieren, indem Sie die LEDs ausschalten, die direkt auf reflektierende Oberflächen scheinen, während Sie schräge Lichtquellen für bessere Sichtbarkeit aktiv lassen.
LED Light Intensity
- Was es ist: Passt die Helligkeit der LED-Beleuchtung an.
- Best Practice: Beginnen Sie mit niedriger Intensität und erhöhen Sie diese schrittweise, um Blendung oder Reflexionen zu vermeiden.
Photometric Control
- Was es ist: Nimmt mehrere Bilder (typischerweise vier) mit unterschiedlicher gerichteter Beleuchtung (links, rechts, oben und unten) auf und kombiniert diese dann zu einem einzigen verbesserten Bild.
- Zweck: Diese Technik reduziert Schatten und hebt feine Oberflächenmerkmale hervor, indem sie eine gleichmäßige, konsistente Ausleuchtung des Teils gewährleistet.
- Wann verwenden: Ideal für komplexe Teile, stark reflektierende Oberflächen oder Teile mit ungleichmäßiger Textur, bei denen Standard-Einzelbildaufnahmen kritische Details übersehen könnten.
Trigger Settings
Manual Trigger
- Was es ist: Erfasst Bilder, wenn Sie die Schaltfläche auf dem HMI-Bildschirm drücken.
- Am besten geeignet für: Tests, Einrichtung oder manuelle Inspektionen.
Hardware Trigger
- Was es ist: Verwendet ein elektrisches Signal (z. B. von einem Sensor), um die Kamera auszulösen.
- Am besten geeignet für: Automatisierte Linien, bei denen ein Sensor die Anwesenheit eines Teils erkennt.
PLC Trigger
- Was es ist: Trigger-Signale werden über industrielle Steuerungen (PLCs) für einen synchronisierten Betrieb mit anderen Maschinen gesendet.
- Am besten geeignet für: Vollautomatisierte Systeme, die ein präzises Timing erfordern.
Aligner Trigger
- Was es ist: Löst automatisch aus, wenn das System die Ausrichtung eines Teils im Sichtfeld erkennt.
- Am besten geeignet für: Anwendungen, bei denen Teile vor der Aufnahme konsistent positioniert sein müssen oder wenn keine anderen zuverlässigen Trigger verfügbar sind.
Interval Trigger
- Was es ist: Löst die Kamera in festgelegten Zeitabständen aus.
- Am besten geeignet für: Kontinuierliche Prozesse oder die Überwachung bewegter Linien ohne Teileerkennungssensoren.
Vorlagenbild und Ausrichtung
Skip Aligner
- Was es ist: Deaktiviert den Ausrichtungsschritt während der Inspektion.
- Wann verwenden: Wenn sich das Teil immer in derselben Position und Ausrichtung im Bild befindet.
Template Regions
- Was es ist: Definiert den/die Bereich(e) des Vorlagenbildes, der/die für die Ausrichtung verwendet wird/werden.
- Rectangle: Zeichnen Sie eine rechteckige ROI.
- Circle: Zeichnen Sie eine kreisförmige ROI.
- Ignore Template Region: Schließen Sie bestimmte Bereiche von der Ausrichtung aus, um störende Muster oder irrelevante Merkmale zu vermeiden.
- Beste Verwendung: Hilft dem System, sich nur auf die markantesten Merkmale des Teils zu konzentrieren, um eine präzise Ausrichtung zu erreichen.
Rotation Range
- Was es ist: Legt fest, wie viel Rotation (in Grad) das System beim Abgleich des Teils mit der Vorlage toleriert.
- Beispiel: Eine Einstellung von ±20° erlaubt eine leichte Rotation des Teils, sodass es dennoch erkannt wird.
- Wann anpassen: Erhöhen, wenn sich Teile in der Produktion drehen können; verringern bei sehr gleichbleibender Ausrichtung.
Sensitivity
- Was es ist: Steuert, wie fein das System nach einer Übereinstimmung zwischen dem Live-Bild und der Vorlage sucht.
- Wirkung:
- Hohe Empfindlichkeit → erkennt subtilere Details, nützlich für komplexe Teile.
- Geringere Empfindlichkeit → reduziert Fehlübereinstimmungen, kann aber feine Merkmale übersehen.
Confidence Threshold
- Was es ist: Legt den minimalen Konfidenzwert fest, der erforderlich ist, damit das System eine Erkennung akzeptiert.
- Wirkung:
- Höherer Schwellenwert → weniger False Positives, jedoch werden grenzwertige Übereinstimmungen möglicherweise übersehen.
- Niedrigerer Schwellenwert → mehr Erkennungen, jedoch mit erhöhtem Risiko von False Positives.
Beginnen Sie mit einem moderaten Wert und passen Sie ihn basierend auf den Testergebnissen an.
Scale Invariant
- Was es ist: Erlaubt dem System, Teile zu erkennen, die etwas größer oder kleiner als das ursprüngliche Vorlagenbild sind.
- Wann aktivieren: Wenn die Teilegröße aufgrund von Positionierung, Abstandsänderungen oder Fertigungstoleranzen leicht variieren kann.
Live Preview Legend

1. Eine konfigurierbare Bounding Box, die den spezifischen Bereich des Kamera-FOV definiert, der während der Triggerung überwacht werden soll.
- Zweck: Stellt sicher, dass sich die Kamera nur auf den relevanten Bereich konzentriert und unnötige Hintergrundbereiche ignoriert.
- Beste Verwendung:
- Bei bewegten Objekten, um zu gewährleisten, dass das Teil vollständig im Erkennungsbereich bleibt.
- Zur Optimierung der Verarbeitungsgeschwindigkeit, indem die Menge der analysierten Bilddaten reduziert wird.
2. Ein visueller roter Punkt, der den Mittelpunkt aller definierten ROIs (Regions of Interest) im Bild anzeigt.
- Zweck: Hilft Ihnen, den Suchbereich relativ zum Teil oder zur Kameraansicht auszurichten und zu positionieren.
3. Die grüne Linie zeigt an, dass die Kante des Objekts erkannt wurde.
Wenn die Linie rot wird, versuchen Sie, die ROI-Größe zu erhöhen, die ROI anzupassen oder die Sensitivity zu erhöhen.

ROI (Region of Interest) Definition und Optimierung
Inspektionstypen
- Was es ist: Definiert den Typ der durchgeführten Inspektion und gruppiert ähnliche ROIs (Regions of Interest).
- Beispiel: „Holes" zur Prüfung des Vorhandenseins, der Größe oder Qualität von Löchern in einem Bauteil.
- Hauptfunktionen:
- Add Inspection Type: Erstellen Sie neue Kategorien für unterschiedliche Inspektionsanforderungen.
- # of ROIs: Zeigt an, wie viele ROIs diesem Inspektionstyp aktuell zugewiesen sind.
Transformation

- Was es ist: Passt die Position und Geometrie ausgewählter ROIs für eine präzise Ausrichtung und Platzierung an.
- Felder und ihr Zweck:
- Height/Width: Ändert die Größe des ROI.
- X / Y: Verschiebt die Position des ROI entlang der horizontalen (X) und vertikalen (Y) Achse.
- Angle: Dreht den ROI um seinen Mittelpunkt.
- Optimaler Einsatz: Beschleunigt das Setup bei sich wiederholenden Mustern, wie z. B. mehreren identischen Löchern.
Regions of Interest (ROIs)

- Was es ist: Eine Liste aller im Vorlagenbild definierten ROIs.
- Funktionen:
- Add Region of Interest (ROI): Erstellen Sie manuell einen neuen ROI.
- Ignore Regions: Schließen Sie bestimmte Bereiche von der Verarbeitung aus.
- Edit: Speichern, löschen oder abbrechen.
- Lock Icon: Kennzeichnet gesperrte ROIs, die ohne Entsperren nicht verschoben werden können.
Live Preview-Modus
- Was es ist: Zeigt Echtzeit-Feedback nach dem Anpassen oder Hinzufügen von ROIs an.
- Anwendungsfall: Ideal zur Feinabstimmung von ROI-Positionen und -Größen während des Setups.
Test-Schaltfläche
- Was es ist: Führen Sie Backtesting auf Basis älterer Bilder durch, um Änderungen zu überprüfen.
- Anwendungsfall: Vergleich aktueller Ergebnisse mit vorherigen Einstellungen hinsichtlich Genauigkeit und Konsistenz.
Datenerfassung und KI-Training
Definieren Sie verschiedene Inspektionsklassen und labeln Sie jeden ROI entsprechend seinem zugewiesenen Inspektionstyp (siehe Beispiel unten).

Verwenden Sie die Annotation Tools, um das Bild zu labeln/annotieren. Nutzen Sie das Dropdown-Menü Brush Class, um die zu annotierende Klasse auszuwählen. Das aktuelle Limit liegt bei bis zu 10 Klassen pro Rezept für die Segmentierung.

Bedeutung guter Daten

-
Garbage In, Garbage Out: KI-Modelle können nur so gut sein wie die Daten, mit denen sie gefüttert werden. Schlechte oder inkonsistente Daten führen zu ungenauen Ergebnissen.
-
Vielfalt zählt: Erfassen Sie Daten, die alle realen Variationen abbilden: verschiedene Schichten, Lichtverhältnisse, Bauteilpositionen und Oberflächenzustände.
-
Qualität vor Quantität: Ein kleinerer, sauberer und gut gelabelter Datensatz liefert oft bessere Ergebnisse als ein großer, aber verrauschter oder inkonsistenter Datensatz.
Grundlagen der Annotation:
- Classification: Markieren Sie ganze Bilder oder ROIs als eine bestimmte Klasse (z. B. „Good", „Damaged").
- Segmentation: Übermalen, umranden oder markieren Sie bestimmte interessante Bereiche mit pixelgenauer Genauigkeit (z. B. Position eines Kratzers auf einer Oberfläche).
- Konsistenz: Verwenden Sie einheitliche Regeln und Definitionen für das Labeling, um Verwirrung während des Trainings zu vermeiden.

Häufige Fallstricke
- Unzureichende Daten: Zu wenige Beispiele führen zu Underfitting und damit zu schlechter Leistung in der Realität.
- Unausgeglichene Klassen: Eine Überrepräsentation einer Klasse (z. B. viele „gute" Teile, aber wenige fehlerhafte) verzerrt das Modell.
- Schlechtes Labeling: Falsches, inkonsistentes oder überstürztes Labeling führt zu erheblichen Genauigkeitsverlusten.
- Umgebungsänderungen ignorieren: Wird der Datensatz bei Änderungen von Beleuchtung, Bauteilausrichtung oder Oberflächenzuständen nicht aktualisiert, führt dies zu Drift in der Genauigkeit.
- Daten nicht validieren: Das Auslassen von Qualitätsprüfungen vor dem Training führt häufig zu Zeitverlust und Nacharbeit.
Datenaugmentation
Bildaugmentationen modifizieren Ihre Trainingsbilder künstlich, um die Robustheit des Modells zu verbessern. Sie simulieren reale Variationen wie Helligkeitsänderungen, Rotationen oder Rauschen, damit das Modell unter verschiedenen Bedingungen zuverlässig funktioniert.
Farb-Augmentationen

Brightness
- Was es ist: Passt an, wie hell oder dunkel das Bild erscheint.
- Anwendungsfall: Zur Handhabung leichter Beleuchtungsänderungen während der Produktion.
Verwenden Sie ±0,1 für stabile Setups; erhöhen Sie den Wert, wenn die Beleuchtung stärker variiert.
Contrast
- Was es ist: Verändert den Unterschied zwischen hellen und dunklen Bereichen.
- Anwendungsfall: Nützlich für Teile mit Textur oder unterschiedlichen Oberflächen, um dem Modell die Anpassung an visuelle Unterschiede zu erleichtern.
Hue
- Was es ist: Verschiebt die Farbtöne leicht.
- Anwendungsfall: Gut geeignet für Setups, bei denen sich die Lichtfarbe (z. B. LED-Temperatur) im Laufe der Zeit ändern kann.
Saturation
- Was es ist: Passt die Intensität der Farben an.
- Anwendungsfall: Hilft bei der Bewältigung von Beleuchtungsvariationen, die Bilder matter oder lebendiger erscheinen lassen.
Geometrische Augmentationen

Rotation Range
- Was es ist: Rotiert das Bild zufällig innerhalb des festgelegten Bereichs (z. B. ±20°).
- Anwendungsfall: Für Teile, die in leicht gedrehten Positionen ankommen können.
Vermeiden Sie übermäßige Rotation bei Teilen, die normalerweise in einer festen Ausrichtung vorliegen.
Flip
- Was es ist: Spiegelt das Bild horizontal, vertikal oder beides.
- Anwendungsfall: Hilfreich für symmetrische Teile oder wenn sich die Ausrichtung während der Handhabung umkehren kann.
Beleuchtungs- und Farbsimulation
Planckian
- Was es ist: Simuliert Variationen der Farbtemperatur (z. B. warme oder kalte Beleuchtung).
- Anwendungsfall: Behandelt unterschiedliche Verschiebungen oder Arbeitszellen mit variierenden Lichtquellen.
Gaussian Noise
- Was es ist: Fügt dem Bild subtiles Rauschen hinzu.
- Anwendungsfall: Verbessert die Robustheit, wenn in Ihrer Produktionsumgebung geringes visuelles Rauschen oder Kamerasensor-Artefakte auftreten.
Bewegungssimulation

Motion Blur
- Was es ist: Simuliert leichte Unschärfen, als hätte sich das Teil während der Aufnahme bewegt.
- Anwendungsfall: Entscheidend für Hochgeschwindigkeitslinien, bei denen Bewegungsunschärfe auftreten kann.
Wahrscheinlichkeit (prob)
- Was es ist: Legt die Wahrscheinlichkeit fest, mit der jede Augmentation während des Trainings angewendet wird.
- Beispiel: 0,50 = 50 % Wahrscheinlichkeit, dass diese Änderung auf ein beliebiges Trainingsbild angewendet wird.
Beginnen Sie bei den meisten Augmentationen mit 0,5 und passen Sie den Wert basierend auf der realen Variabilität an.
Trainingsparameter (Segmentation)
Trainingsparameter (auch Hyperparameter genannt) sind die Einstellungen, die steuern, wie ein Machine-Learning-Modell aus Daten lernt.
Learning Rate
- Definition: Steuert, wie schnell das Modell seine internen Gewichte während des Trainings aktualisiert.
- Wert (0,003): Je höher die Learning Rate, desto schneller lernt das Modell, aber zu hohe Werte können zu Instabilität oder schlechter Genauigkeit führen.
- Schieberegler-Bereich: Von 10^-4 (sehr langsam) bis 10^-1 (sehr schnell).
In der Regel ist ein Wert zwischen 0,001 und 0,01 ein guter Ausgangspunkt für Segmentation-Aufgaben.
ROI (Region of Interest) Größe
- Definition: Legt die Größe (Breite × Höhe) des Bildbereichs fest, der während des Trainings verwendet wird.
- Nicht aktiviert: Standardmäßig bestimmt das Modell die ROI automatisch anhand Ihrer Daten.
- Wenn aktiviert: Sie können Breite und Höhe manuell festlegen, wenn Sie konsistente Eingabedimensionen benötigen (z. B. alle Bilder auf 256×256 Pixel zugeschnitten).
Verwenden Sie eine feste Größe (z. B. 256×256), wenn Ihr Datensatz Bilder unterschiedlicher Größen enthält und Sie eine konsistente Eingabe für bessere Stabilität, Reproduzierbarkeit oder zur Übereinstimmung mit einer bekannten Modellarchitektur wünschen.
Lassen Sie es automatisch wählen, wenn Ihre Daten bereits eine einheitliche Auflösung haben oder wenn das System die beste Region of Interest basierend auf den Eigenschaften Ihres Datensatzes optimieren soll.
Anzahl der Iterationen (Epochs)
- Definition: Eine Epoch = ein vollständiger Durchlauf durch den gesamten Trainingsdatensatz.
- Wert (100): Das Modell trainiert für 100 vollständige Durchläufe.
Eine Erhöhung dieser Zahl verbessert in der Regel die Genauigkeit bis zu einem gewissen Punkt, dauert aber länger.
Faustregel: Überwachen Sie während des Trainings den Training- und Validation-Loss. Wenn der Validation-Loss nicht mehr sinkt, während der Training-Loss weiter abnimmt, ist dies ein Zeichen dafür, dass das Modell überangepasst (overfitting) ist und Sie das Training früher beenden sollten.
Architektur
- Definition: Wählt die Größe und Komplexität des neuronalen Netzwerks aus.
- Small: Trainiert schneller und ist für die meisten Datensätze oft ausreichend. Ideal für schnelles Experimentieren oder kleinere Datensätze.
- Größere Modelle können mehr Details erfassen, neigen aber bei kleinen Datensätzen zum Overfitting, während kleinere Modelle effizienter sind und bei begrenzten Daten besser generalisieren.
Beginnen Sie mit Small – das ist oft ausreichend und ermöglicht eine schnellere Iteration, bevor Sie hochskalieren.
External GPU
Kontaktieren Sie den Support, um mehr über External GPU zu erfahren.
Trainingsparameter (Classification)
Trainingsparameter (auch Hyperparameter genannt) sind die Einstellungen, die steuern, wie ein Machine-Learning-Modell aus Daten lernt.
Learning Rate
- Definition: Steuert, wie schnell das Modell während des Trainings seine internen Gewichte aktualisiert.
- Wert (0.003): Je höher die Learning Rate, desto schneller lernt das Modell, aber ein zu hoher Wert kann zu Instabilität oder geringer Genauigkeit führen.
- Slider-Bereich: Von 10^-4 (sehr langsam) bis 10^-1 (sehr schnell).
Üblicherweise ist ein Wert zwischen 0,001–0,01 ein guter Ausgangspunkt für Segmentierungsaufgaben.
Validation Percent
- Definition: Legt fest, welcher Teil Ihres Datensatzes für die Validierung (Tests während des Trainings) reserviert wird.
- Zweck: Validierungsdaten helfen dabei, zu überwachen, wie gut das Modell bei unbekannten Beispielen abschneidet, und verhindern Overfitting.
- Bereich: 0–50 %.
Übliche Werte sind 10–20 %.
Wenn auf 0 % gesetzt, werden alle Daten für das Training verwendet, was die Trainingsgenauigkeit verbessern kann, aber das Erkennen von Overfitting erschwert.
ROI (Region of Interest) Größe
- Definition: Legt die Größe (Breite × Höhe) des Bildbereichs fest, der während des Trainings verwendet wird.
- Nicht aktiviert: Standardmäßig bestimmt das Modell die ROI automatisch anhand Ihrer Daten.
- Bei Aktivierung: Sie können Breite und Höhe manuell festlegen, wenn Sie konsistente Eingabedimensionen benötigen (z. B. alle Bilder auf 256×256 Pixel zugeschnitten).
Verwenden Sie eine feste Größe (z. B. 256×256), wenn Ihr Datensatz Bilder unterschiedlicher Größen enthält und Sie eine konsistente Eingabe für bessere Stabilität, Reproduzierbarkeit oder zur Anpassung an eine bekannte Modellarchitektur wünschen.
Lassen Sie die Größe automatisch wählen, wenn Ihre Daten bereits eine einheitliche Auflösung haben oder wenn das System die beste Region of Interest basierend auf den Eigenschaften Ihres Datensatzes optimieren soll.
Anzahl der Iterationen (Epochs)
- Definition: Eine Epoch = ein vollständiger Durchlauf durch den gesamten Trainingsdatensatz.
- Wert (100): Das Modell wird für 100 vollständige Durchläufe trainiert.
Eine Erhöhung dieser Zahl verbessert in der Regel die Genauigkeit bis zu einem gewissen Punkt, dauert aber länger.
Faustregel: Überwachen Sie den Training- und Validation-Loss während des Trainings. Wenn der Validation-Loss nicht mehr sinkt, während der Training-Loss weiter abnimmt, ist dies ein Zeichen dafür, dass das Modell überangepasst (Overfitting) ist, und Sie sollten das Training früher beenden.
Architektur
- Definition: Wählt die Größe und Komplexität des neuronalen Netzes aus.
- Small: Trainiert schneller und ist für die meisten Datensätze oft ausreichend. Ideal für schnelles Experimentieren oder kleinere Datensätze.
Beginnen Sie mit Small – diese Variante ist oft ausreichend und hilft Ihnen, schneller zu iterieren, bevor Sie hochskalieren.
| Architektur und Kamera | Beschreibung | Empfohlene Verwendung |
|---|---|---|
| ConvNeXt-Pico | Ultraleichtes Modell, optimiert für Geschwindigkeit und geringen Speicherverbrauch. | Hervorragend für schnelle Experimente oder begrenzte Hardware. |
| ConvNeXt-Nano | Etwas größer als Pico; bessere Genauigkeit bei minimalem Mehraufwand. | Gute Balance für kleine bis mittlere Datensätze. |
| ConvNeXt-Tiny | Bietet verbesserte Genauigkeit bei weiterhin hoher Effizienz. | Geeignet für mittelgroße Datensätze und längere Trainingsläufe. |
| ConvNeXt-Small | Leistungsstärkste Variante in dieser Liste. Höhere Kapazität und Genauigkeit. | Verwendung bei großen Datensätzen oder wenn maximale Leistung erforderlich ist. |
Externe GPU
Kontaktieren Sie den Support, um mehr über die externe GPU zu erfahren.





