- Anzeige -
- Anzeige -
Lesedauer: 5min
Blick in die Black Box

Jun 2, 2020 | Technologie

Deep-Learning-Netze sind noch weitgehend eine Black Box. Anwender können die Entscheidung des Klassifikators während des Inspektionsprozesses oft nicht direkt nachvollziehen. Anhand einer Heatmap lässt sich jetzt erkennen, welche Bereiche eines Bildes starken Einfluss auf die Zuordnung des abgebildeten Objekts zu einer bestimmten Klasse haben.
Bild 1 | Ein fehlerhafter Trainingsprozess beim Deep Learning führt 
zu falschen Erkennungsergebnissen. 
So wurde ein Braunbär, der auf einer 
Eisfläche stand, von den Algorithmen als Eisbär klassifiziert.
Bild 1 | Ein fehlerhafter Trainingsprozess beim Deep Learning führt zu falschen Erkennungsergebnissen. So wurde ein Braunbär, der auf einer Eisfläche stand, von den Algorithmen als Eisbär klassifiziert.Bild: MVTec Software GmbH

Moderne Bildverarbeitungssysteme nutzen seit geraumer Zeit Verfahren, die auf künstlicher Intelligenz (KI) beruhen, wie etwa Deep Learning. Durch das Training mittels Bilddaten lernt die Technologie eigenständig Merkmale, die typisch für eine bestimmte Objektklasse sind. Dies erleichtert die automatische Zuweisung der Bildinformationen zur jeweiligen Klasse und sorgt für wesentlich robustere Erkennungsraten. Auf diese Weise lassen sich sowohl Objekte als auch Defekte präziser identifizieren und lokalisieren. Der Trainingsvorgang läuft jedoch weitgehend im Dunkeln ab. Nutzer können nicht nachvollziehen, was das Deep-Learning-Netzwerk aus den Daten lernt. Im Falle einer falschen Klassifikation lässt sich der Fehler daher nur sehr schwer aufdecken und debuggen. Ein Beispiel aus einem Praxistest: Ein Braunbär, der auf einer Eisfläche stand, wurde von den Deep-Learning-Algorithmen als Eisbär klassifiziert. Die Software konnte aufgrund eines fehlgeleiteten Trainingsprozesses nicht zwischen dem Hintergrund und dem zu erkennenden Objekt unterscheiden. Aufgrund des mangelnden Einblicks in die Deep-Learning-Black-Box lässt sich der Fehler nicht eindeutig eingrenzen, was die zweifelsfreie Erkennung behindert.

Aufzeigen relevanter Bildbereiche

Ein neues Bildverarbeitungs-Feature schafft hier Abhilfe: MVTec Halcon 19.11 beinhaltet eine Heatmap-Funktion, die auf der Grad-CAM-Methode (Gradient-Weighted Class Activation Mapping) basiert. Damit lässt sich präzise analysieren, welche Teile eines Bildes den größten Einfluss auf die Zuordnung eines Objekts zu einer bestimmten Klasse haben. Diese Bereiche werden im Bild mittels einer Falschfarbendarstellung hervorgehoben. Dies erleichtert die Detektion von Trainingsfehlern, was mehr Transparenz in den gesamten Prozess bringt und die Erkennung von Gegenständen und Defekten deutlich verbessert. Zurück Eisbärbeispiel: Die Heatmap führt hier zu der Erkenntnis, dass das Deep-Learning-Netz als wichtigstes Unterscheidungsmerkmal im Erkennungsprozess nicht den Bären selbst, sondern den Hintergrund, also die Eis- bzw. Schneefläche gewählt hat. Das Training beruhte also auf fehlerhaften oder unvollständigen Daten und führte deshalb zum falschen Ergebnis. Auf Basis der Heatmap-Auswertung kann nun ein zusätzliches Training stattfinden, in dem weitere Bilder ergänzt werden. Diese können beispielsweise Braunbären zeigen, die sich im Schnee aufhalten. Dieser Trainingsvorgang kann iterativ so lange wiederholt werden, bis ein optimales Erkennungsresultat erreicht ist.

Ergebnisse in Millisekunden

Die Heatmap auf Basis der Grad-CAM-Methode bringt nicht nur Licht in die Deep-Learning-Black-Box, sondern erhöht auch das Vertrauen in die KI-Technologie: Durch die Kenntnis der entscheidungsrelevanten Bildbereiche lässt sich besser nachvollziehen, warum und auf welche Weise das Netz bestimmte Kriterien für die Klassifizierung ausgewählt hat. Auf dieser Grundlage kann dann der Prozess angepasst und das gesamte Training effizienter gestaltet werden. Unternehmen werden somit eher bereit sein, in anspruchsvolle Deep-Learning-Technologien zu investieren. Eine derartige Visualisierungs-Methodik ist zwar schon seit längerer Zeit am Markt verfügbar. Die Ausführungszeit lag hierbei aber im Sekundenbereich. Im Vergleich dazu überzeugt die neue, Grad-CAM-basierte Heatmap von MVTec mit ihrer Schnelligkeit: Die Technologie arbeitet im einstelligen Millisekunden-Bereich und ist daher für Online-Visualisierungs-Anwendungen optimal geeignet. Zudem läuft das Feature im neuen Software-Release Halcon 20.05 nun auch auf einer CPU, benötigt also keine energiehungrige GPU mehr. So lässt sich die Heatmap auch auf Geräten nutzen, die über keine dedizierte GPU verfügen. Dazu zählen z.B. viele Industrie-PCs, welche die hohe Abwärme eines leistungsstarken Grafikprozessors nicht ableiten können oder deren Gehäuse nicht genug Platz dafür bietet.

Autor:
Firma: MVTec Software GmbH
www.mvtec.com

News

- Anzeige -

Weitere Beiträge

Das könnte Sie auch interessieren

Mit Machine Learning präzise Vorhersagen treffen

Viele Unternehmen haben das Potenzial selbstlernender Systeme, die Machine Learning benutzen, erkannt. Dieser Teilbereich der künstlichen Intelligenz basiert auf Algorithmen, die Muster und Gesetzmäßigkeiten in großen Datenmengen erkennen. Mithilfe neuronaler Netze lassen sich aus den Datenbeständen Rückschlüsse ziehen und Prognosen treffen. In vielen Branchen bereits etabliert, findet Machine Learning als Analyse- und Steuerungsinstrument nun auch zunehmend Anwendung in der Logistik. Ein Beispiel dafür ist die Verknüpfung des Microsoft Azure Machine Learning Studios mit Bestandsmanagement- oder ERP-Systemen. Mit diesen Lösungen lassen sich unter anderem Bestände und Bestellungen optimieren sowie Lagerprozesse erheblich verbessern.

mehr lesen

Studie von VDE und Bertelsmann Stiftung: KI-Ethik messbar machen

In einer neuen Studie zeigen die Technologieorganisation VDE und die Bertelsmann Stiftung, wie sich Ethikprinzipien für künstliche Intelligenz (KI) in die Praxis bringen lassen. Zwar gibt es eine Vielzahl an Initiativen, die ethische Richtlinien für die Gestaltung von KI veröffentlicht haben, allerdings bis dato kaum Lösungen für deren praktische Umsetzung. Genau hier setzt der VDE als Initiator und Leiter der ‚AI Ethics Impact Group‘ gemeinsam mit der Bertelsmann Stiftung an.

mehr lesen

KI in der medizinischen Diagnostik

Das Robotik Startup Robominds hat in Reaktion auf die aktuelle Corona-Pandemie eine Lösung entwickelt, die Roboterarme befähigt, Proben und Reagenzien für die medizinische Diagnostik vor zu sortieren. Auf Basis künstlicher Intelligenz erkennt das Soft-und Hardwaresystem Robobrain Position und Farbe der Probenröhrchen und kann diese ohne vorheriges Einlernen voll automatisiert vor- und einsortieren.

mehr lesen

Künstliche Intelligenz für ‚Beyond 5G‘

Während viele europäische Staaten gerade dabei sind, den Mobilfunk der 5. Generation aufzubauen, arbeitet die Forschung bereits an seiner Optimierung. Denn obwohl 5G seinen Vorgängern weit überlegen ist, hat auch der neueste Mobilfunkstandard noch Verbesserungspotenzial: Besonders in urbanen Gebieten, in denen ein direkter Sichtkontakt zwischen Sender und Empfänger erschwert ist, funktioniert die Funkverbindung oftmals noch nicht zuverlässig. In dem kürzlich gestarteten EU-Projekt Ariadne erforschen nun elf europäische Partner, wie sich durch die Nutzung von hohen Frequenzbändern und künstlicher Intelligenz eine fortschrittliche Systemarchitektur für »Beyond 5G« entwickeln lässt.

mehr lesen

Schutz der Privatsphäre und KI in Kommunikationssystemen

Alle zwei Jahre vergeben der VDE, die Deutsche Telekom sowie die Städte Friedrichsdorf und Gelnhausen den mit 10.000 Euro dotierten Johann-Philipp-Reis-Preis an einen Nachwuchswissenschaftler. Dieses Jahr geht er an Prof. Dr.-Ing. Delphine Reinhardt von der Georg-August-Universität Göttingen und an Dr.-Ing. Jakob Hoydis von den Nokia Bell Labs in Nozay, Frankreich. Die beiden Preisträger teilen sich die Auszeichnung und damit das Preisgeld.

Infor bringt Infor Coleman AI auf den Markt

Infor, Anbieter von branchenspezifischer Business-Software für die Cloud, hat bekanntgegeben, dass die Plattform Infor Coleman AI für Embedded-Machine-Learning-Modelle ab sofort verfügbar ist. Sie bietet die Geschwindigkeit, Wiederholbarkeit und Personalisierung, die Unternehmen benötigen, um KI vollständig zu operationalisieren.