- Anzeige -
- Anzeige -
- Anzeige -
Lesedauer: 6min
10x schnelleres teil-automatisiertes Labeln von AI-Trainingsbildern

Apr 14, 2020 | Technologie

Deep-Learning-Verfahren zur Identifikation und Klassifizierung von Objekten erfordern im Regelfall eine große Anzahl von gelabelten Bildern als Trainingsdaten. Das Startup DataGym.ai bietet eine Online-Workbench, mit der das Labeln von Bildern teil-automatisiert bis zu 10x schneller durchgeführt werden kann.

AI-basierte Bildverarbeitung hat in den letzten Jahren rasant an Bedeutung gewonnen. Grundlage solcher Lösungen bilden CNNs, die initial oft mit tausenden oder zehntausenden von gelabelten Bildern (mit sowohl Gut- als auch Schlecht-Fällen) trainiert werden müssen. Das manuelle Labeln einer solchen Vielzahl von Bildern ist ein aufwändiger, stupider und teurer Prozess, der teilweise bis zu 50% des Zeitaufwands in Machine Learning-Projekten beansprucht. Entsprechend können mit beschleunigenden Label-Tools große Einsparungen hinsichtlich Kosten und Time-to-Market erzielt werden.

Beschleunigtes Labeln mit AI

Das Startup DataGym.ai bietet hierfür eine Online-Workbench für Data Scientists und Machine Learning-Teams an, um Bilder (und zukünftig auch Videos) semi-automatisiert bis zu 10x schneller zu labeln als bei manuellem Vorgehen. Die Grundlage bildet der Einsatz von AI und Machine Learning: Vortrainierte, AI-powered Label-Funktionen unterstützen den Anwender beim Labeln und Annotieren von Objekten in den Bildern. Beispielsweise werden die Umrisse von komplexen Objekten automatisiert mit einem Polygon umrandet, der Anwender hat anschließend – falls notwendig – noch die Möglichkeit einzelne Polygonpunkte manuell nach zu justieren. Die Online-Workbench bietet darüber hinaus noch einiges mehr: Sie ist eine End-to-End Plattform zum Erstellen, Verwalten, Labeln, Annotieren, Klassifizieren und Exportieren von Trainingsdaten für AI-Bildverarbeitungssoftware. Die einfach zu bedienende Plattform ist für den Einsatz von Teams jeder Größe, als auch für einzelne Benutzer konzipiert. Typische Anwender sind Data Scientists, Machine Learning-Experten, Ingenieure, Entwickler und Team-Verantwortliche.

Bild: DataGym.ai | eForce21 GmbH
Bild 2 | Truck aus der Vogelperspektive: Schritt 1 Auswahl des Trucks durch Einrahmen, 
Schritt 2: automatisches Labeln der Truck-Umrisse mit einem Polygon
Bild 2 | Truck aus der Vogelperspektive: Schritt 1 Auswahl des Trucks durch Einrahmen, Schritt 2: automatisches Labeln der Truck-Umrisse mit einem PolygonBild: DataGym.ai | eForce21 GmbH

Funktionen im Detail

Projekte und DataSets bilden die Grundlage der Datenverwaltung. Lädt ein Anwender Bilder in das Online-Tool hoch, so können diese in DataSets gruppiert werden. Ein DataSet umfasst eine Menge von Bildern und kann als Ausgangsmaterial in beliebig vielen Projekten verwendet werden. Somit können die Bilder beliebig oft gelabelt bzw. annotiert und für unterschiedliche Trainingsdatensätze verwendet werden. Die Grundlagen für das Labeln von Bildern und Objekten werden in einer sogenannten Label Configuration festgelegt. Diese umfasst sowohl Geometries, als auch Object Classes. Mit einer Geometry wird festgelegt, wie die zeichnerische Kennzeichnung bzw. Umrandung eines Objektes erfolgt. Beispiele hierfür sind: Polygon, Rectangle, Line, Point. Mit einer Object Class wird ein Objekt klassifiziert, d.h. einer Klasse zugeordnet. Damit erhält das Objekt eine Bedeutung bzw. einen Typ. Beispiele im Straßenverkehr könnten sein: Auto, Lkw, Motorrad, Fußgänger, etc. Die Klassifizierungen können bis zu mehreren Ebenen verschachtelt und damit mit Sub-Classes versehen werden. Beispielsweise könnten Autos durch ihre Bauweise subklassifiziert werden, also Sedan, SUV, Pickup, etc. Neben den Objekten können auch ganze Bilder annotiert und klassifiziert werden. Hierzu können in der Label Configuration Klassifizierungs-Fragen hinterlegt werden. Beispielsweise unter welchen Lichtverhältnissen oder zu welcher Tageszeit das Bild aufgenommen wurde.

Ist ein Projekt angelegt und sind diesem eine Label Configuration sowie ein oder mehrere DataSets zugeordnet, so kann mit dem Labeln begonnen werden. Zur einfachen Handhabung wird hierzu pro zu labelndem Bild jeweils eine Task angelegt. Eine Task entspricht also der Aufgabe, ein Bild und die darin enthaltenen Objekte zu labeln und zu klassifizieren. Eine Task ist mit einem Status (z.B. waiting, in progress, completed, skipped, reviewed) versehen und durchläuft je nach Bearbeitungszustand unterschiedliche Stati eines Life Cycles (State Machine). Die Tasks können unterschiedlichen Mitarbeitern eines Teams zugeordnet werden, sodass große Projekte parallelisiert und somit schnell und effizient abgearbeitet werden können.

Beim Labeln eines Bildes und der darin enthaltenen Objekte hat der Anwender in einem übersichtlichen Workspace die Möglichkeit, mit den AI-unterstützen Funktionen teil-automatisiert zu arbeiten oder Geometrien und Klassifizierungen händisch vorzunehmen. Die in einem Projekt erstellten Trainingsdaten können letztlich als JSON-Datei heruntergeladen und zum Training von Machine Learning-Modellen (CNN) verwendet werden. Darüber hinaus stellt die Online Workbench APIs bereit, über die die Funktionen der Plattform automatisiert genutzt und in z.B. Python Entwicklungs-Workflows von Anwendern integriert werden können. Die Online-Workbench wird in der Grundversion kostenfrei auf der Homepage angeboten. Über den aktuellen Funktionsumfang hinaus sind zukünftig weitere Ausbaustufen der Plattform mit interessanten Features geplant, z.B. die Funktionen Video-Labeling und 3D-Labeling.

Autor:
Firma: eForce21 GmbH
www.datagym.ai

News

Weitere Beiträge

Das könnte Sie auch interessieren

KI-Studie: Unternehmen gewichten Technologie und Qualifizierung gleich

Unternehmen mit KI-Projekten sind dann am erfolgreichsten, wenn die Qualifizierung der eigenen Mitarbeiter den gleichen Stellenwert wie Investitionen in intelligente Technologien hat. Dazu gehört auch das Schaffen einer Lernkultur, die diese Qualifizierungsmassnahmen trägt. Das ist das Kernergebnis einer im Auftrag von Microsoft durchgeführten internationalen Studie. In einer Datenanalyse wurden dafür rund eine halbe Million englischsprachiger Beiträge ausgewertet und zusätzlich im März 2020 Interviews mit rund 12.000 Fach- und Führungskräften aus 20 Ländern geführt.

mehr lesen

Startups für KI und das Internet der Dinge

Vinci Energies in Deutschland reagiert auf den digitalen Wandel mit einem Ausbau der eigenen Startup-Offensive: dem Digitalschmiede Startup-Radar. Ziel der Initiative ist es, DACH-weit Startups zu identifizieren, die durch innovative Technologien und Lösungen das Leistungsspektrum der Vinci Energies Marken ergänzen können. Als Systemintegrator setzt Vinci Energies auf enge Kooperationen mit jungen Firmen, um ihre Expertise in Kundenprojekte einzubinden und so ein innovatives Ökosystem zu schaffen, das Kundenunternehmen bei immer komplexer werdenden Anforderungen unterstützt. Unter anderem sind Hellsicht und S O NAH schon Teil dieser Kooperation, die insgesamt bereits mehr als 20 feste Startup-Partnerschaften umfasst.

mehr lesen

Künstliche Intelligenz direkt an die Maschine bringen

Bisher haben industrielle Anwendungen der künstlichen Intelligenz (KI) aufgrund von Latenzzeiten und hohen Datenmengen bei der Cloudanbindung nur bedingt überzeugt. Entscheidend ist darum, KI direkt an die Maschine zu bringen und dort – direkt an der Quelle – Daten in Echtzeit zu interpretieren. Mit der Plattform Scraitec tut der KI-Spezialist Resolto genau dies, beispielsweise bei einem Haushaltsgeräte- oder Automobilhersteller.

mehr lesen

Teil 3 – Wie effizient ist das autonome System?

Die Arbeitsgemeinschaft Autonome Systeme der VDI/VDE-Gesellschaft Mess- und Automatisierungstechnik hat zehn Grundsatzfragen zum Thema künstliche Intelligenz und autonome Systeme formuliert. Den Diskurs zu diesen Kernfragen im Umgang mit KI bildet die IT&Produktion einer Artikelserie ab. In diesem Interview erörtert Dr. Eckhard Roos, Leiter Industry Segment Management Process Automation bei Festo und Mitglied des Vorstands der VDI/VDE-GMA, wie effizient ein autonomes System ist.

mehr lesen

Schutz der Privatsphäre und KI in Kommunikationssystemen

Alle zwei Jahre vergeben der VDE, die Deutsche Telekom sowie die Städte Friedrichsdorf und Gelnhausen den mit 10.000 Euro dotierten Johann-Philipp-Reis-Preis an einen Nachwuchswissenschaftler. Dieses Jahr geht er an Prof. Dr.-Ing. Delphine Reinhardt von der Georg-August-Universität Göttingen und an Dr.-Ing. Jakob Hoydis von den Nokia Bell Labs in Nozay, Frankreich. Die beiden Preisträger teilen sich die Auszeichnung und damit das Preisgeld.

Infor bringt Infor Coleman AI auf den Markt

Infor, Anbieter von branchenspezifischer Business-Software für die Cloud, hat bekanntgegeben, dass die Plattform Infor Coleman AI für Embedded-Machine-Learning-Modelle ab sofort verfügbar ist. Sie bietet die Geschwindigkeit, Wiederholbarkeit und Personalisierung, die Unternehmen benötigen, um KI vollständig zu operationalisieren.