10x schnelleres teil-automatisiertes Labeln von AI-Trainingsbildern

10x schnelleres teil-automatisiertes Labeln von AI-Trainingsbildern
Deep-Learning-Verfahren zur Identifikation und Klassifizierung von Objekten erfordern im Regelfall eine große Anzahl von gelabelten Bildern als Trainingsdaten. Das Startup DataGym.ai bietet eine Online-Workbench, mit der das Labeln von Bildern teil-automatisiert bis zu 10x schneller durchgeführt werden kann.

AI-basierte Bildverarbeitung hat in den letzten Jahren rasant an Bedeutung gewonnen. Grundlage solcher Lösungen bilden CNNs, die initial oft mit tausenden oder zehntausenden von gelabelten Bildern (mit sowohl Gut- als auch Schlecht-Fällen) trainiert werden müssen. Das manuelle Labeln einer solchen Vielzahl von Bildern ist ein aufwändiger, stupider und teurer Prozess, der teilweise bis zu 50% des Zeitaufwands in Machine Learning-Projekten beansprucht. Entsprechend können mit beschleunigenden Label-Tools große Einsparungen hinsichtlich Kosten und Time-to-Market erzielt werden.

Beschleunigtes Labeln mit AI

Das Startup DataGym.ai bietet hierfür eine Online-Workbench für Data Scientists und Machine Learning-Teams an, um Bilder (und zukünftig auch Videos) semi-automatisiert bis zu 10x schneller zu labeln als bei manuellem Vorgehen. Die Grundlage bildet der Einsatz von AI und Machine Learning: Vortrainierte, AI-powered Label-Funktionen unterstützen den Anwender beim Labeln und Annotieren von Objekten in den Bildern. Beispielsweise werden die Umrisse von komplexen Objekten automatisiert mit einem Polygon umrandet, der Anwender hat anschließend – falls notwendig – noch die Möglichkeit einzelne Polygonpunkte manuell nach zu justieren. Die Online-Workbench bietet darüber hinaus noch einiges mehr: Sie ist eine End-to-End Plattform zum Erstellen, Verwalten, Labeln, Annotieren, Klassifizieren und Exportieren von Trainingsdaten für AI-Bildverarbeitungssoftware. Die einfach zu bedienende Plattform ist für den Einsatz von Teams jeder Größe, als auch für einzelne Benutzer konzipiert. Typische Anwender sind Data Scientists, Machine Learning-Experten, Ingenieure, Entwickler und Team-Verantwortliche.

Bild: DataGym.ai | eForce21 GmbH
Bild 2 | Truck aus der Vogelperspektive: Schritt 1 Auswahl des Trucks durch Einrahmen, 
Schritt 2: automatisches Labeln der Truck-Umrisse mit einem Polygon
Bild 2 | Truck aus der Vogelperspektive: Schritt 1 Auswahl des Trucks durch Einrahmen, Schritt 2: automatisches Labeln der Truck-Umrisse mit einem PolygonBild: DataGym.ai | eForce21 GmbH

Funktionen im Detail

Projekte und DataSets bilden die Grundlage der Datenverwaltung. Lädt ein Anwender Bilder in das Online-Tool hoch, so können diese in DataSets gruppiert werden. Ein DataSet umfasst eine Menge von Bildern und kann als Ausgangsmaterial in beliebig vielen Projekten verwendet werden. Somit können die Bilder beliebig oft gelabelt bzw. annotiert und für unterschiedliche Trainingsdatensätze verwendet werden. Die Grundlagen für das Labeln von Bildern und Objekten werden in einer sogenannten Label Configuration festgelegt. Diese umfasst sowohl Geometries, als auch Object Classes. Mit einer Geometry wird festgelegt, wie die zeichnerische Kennzeichnung bzw. Umrandung eines Objektes erfolgt. Beispiele hierfür sind: Polygon, Rectangle, Line, Point. Mit einer Object Class wird ein Objekt klassifiziert, d.h. einer Klasse zugeordnet. Damit erhält das Objekt eine Bedeutung bzw. einen Typ. Beispiele im Straßenverkehr könnten sein: Auto, Lkw, Motorrad, Fußgänger, etc. Die Klassifizierungen können bis zu mehreren Ebenen verschachtelt und damit mit Sub-Classes versehen werden. Beispielsweise könnten Autos durch ihre Bauweise subklassifiziert werden, also Sedan, SUV, Pickup, etc. Neben den Objekten können auch ganze Bilder annotiert und klassifiziert werden. Hierzu können in der Label Configuration Klassifizierungs-Fragen hinterlegt werden. Beispielsweise unter welchen Lichtverhältnissen oder zu welcher Tageszeit das Bild aufgenommen wurde.

Ist ein Projekt angelegt und sind diesem eine Label Configuration sowie ein oder mehrere DataSets zugeordnet, so kann mit dem Labeln begonnen werden. Zur einfachen Handhabung wird hierzu pro zu labelndem Bild jeweils eine Task angelegt. Eine Task entspricht also der Aufgabe, ein Bild und die darin enthaltenen Objekte zu labeln und zu klassifizieren. Eine Task ist mit einem Status (z.B. waiting, in progress, completed, skipped, reviewed) versehen und durchläuft je nach Bearbeitungszustand unterschiedliche Stati eines Life Cycles (State Machine). Die Tasks können unterschiedlichen Mitarbeitern eines Teams zugeordnet werden, sodass große Projekte parallelisiert und somit schnell und effizient abgearbeitet werden können.

Beim Labeln eines Bildes und der darin enthaltenen Objekte hat der Anwender in einem übersichtlichen Workspace die Möglichkeit, mit den AI-unterstützen Funktionen teil-automatisiert zu arbeiten oder Geometrien und Klassifizierungen händisch vorzunehmen. Die in einem Projekt erstellten Trainingsdaten können letztlich als JSON-Datei heruntergeladen und zum Training von Machine Learning-Modellen (CNN) verwendet werden. Darüber hinaus stellt die Online Workbench APIs bereit, über die die Funktionen der Plattform automatisiert genutzt und in z.B. Python Entwicklungs-Workflows von Anwendern integriert werden können. Die Online-Workbench wird in der Grundversion kostenfrei auf der Homepage angeboten. Über den aktuellen Funktionsumfang hinaus sind zukünftig weitere Ausbaustufen der Plattform mit interessanten Features geplant, z.B. die Funktionen Video-Labeling und 3D-Labeling.

Das könnte Sie auch Interessieren

Bild: Fraunhofer IEM
Bild: Fraunhofer IEM
Effiziente Produktionsplanung: KI reduziert Aufwand bei Schulte Kartonagen um 25%

Effiziente Produktionsplanung: KI reduziert Aufwand bei Schulte Kartonagen um 25%

Welcher Liefertermin steht wann an? Wie aufwändig muss die Maschine umgerüstet werden? Ist das benötigte Material bereits geliefert? Um die Reihenfolge verschiedener Kundenaufträge optimal zu planen, müssen Produktionsplaner:innen eine Vielzahl von Faktoren kennen und einschätzen. Bei Schulte Kartonagen hat ab sofort ein intelligenter KI-Assistent alle Faktoren im Blick – und macht Vorschläge für die effiziente Planung der Produktion. Gefördert wurde die Zusammenarbeit mit dem Fraunhofer IEM und den Universitäten Paderborn und Bielefeld im it’s OWL-Projekt ARISE.

Bild: schoesslers GmbH
Bild: schoesslers GmbH
appliedAI Institute for Europe launcht kostenlosen KI-Onlinekurs

appliedAI Institute for Europe launcht kostenlosen KI-Onlinekurs

Das gemeinnützige appliedAI Institute for Europe stellt den kostenfreien Online-Kurs ‚AI Essentials‘ zur Verfügung, der es Interessierten ermöglicht, in die Welt der Künstlichen Intelligenz einzusteigen. Konzepte wie maschinelles Lernen und Deep-Learning sowie deren Anwendungsmöglichkeiten und Auswirkungen auf unser Leben und unsere Wirtschaft sind Teile der umfassenden Einführung.

Bild: Trumpf SE + Co. KG
Bild: Trumpf SE + Co. KG
Künstliche Intelligenz macht Fabriken clever

Künstliche Intelligenz macht Fabriken clever

Seit dem Siegeszug des Chatbots ChatGPT ist künstliche Intelligenz in aller Munde. Auch in der industriellen Produktionstechnik kommt KI mit großen Schritten voran. Lernende Maschinen machen die Fertigung effizienter. Wie funktioniert das genau? Das können Interessierte auf der EMO Hannover 2023 vom 18. bis 23. September erfahren. Die Weltleitmesse für Produktionstechnologie wird ihr Fachpublikum unter dem Claim ‚Innovate Manufacturing‘. mit frischen Ideen inspirieren und künstliche Intelligenz spielt dabei ihre Stärken aus.

Bild: Mitsubishi Electric Corporation, Japan
Bild: Mitsubishi Electric Corporation, Japan
KI-gestütztes Analysetool für moderne Produktionslinien

KI-gestütztes Analysetool für moderne Produktionslinien

Das Data-Science-Tool Melsoft MaiLab von Mitsubishi soll Unternehmen bei der Digitalisierung ihrer Fertigung und unterstützen und so deren Produktivität steigern. Die neue Lösung ist eine intuitive, bedienerzentrierte Plattform, die KI nutzt, um Abläufe automatisch zu verbessern. Sei es Abfallvermeidung durch geringere Ausschussmengen, weniger Stillstandszeiten durch vorbeugende Wartung oder Senkung des Energieverbrauchs durch Prozessoptimierung.

Bild: Fraunhofer IGD
Bild: Fraunhofer IGD
Software Arrange beschleunigt Absortierprozesse

Software Arrange beschleunigt Absortierprozesse

In Kombination mit einer Augmented-Reality-Brille bietet eine neue Software des Fraunhofer IGD digitale Unterstützung von Absortiervorgängen. Zusammengehörige Bauteile werden direkt im Sichtfeld der Beschäftigten an der Produktionslinie farblich überlagert. Anwender im Automotive-Bereich können so etwa durch beschleunigte Prozesse und eine minimierte Fehleranfälligkeit Kosten reduzieren.