OCR neu gedacht

OCR spielt eine wichtige Rolle bei der Identifikation von Objekten in industriellen Produktions- und Logistikprozessen. In der neuen Halcon-Version steht nun mit Deep OCR ein neues Feature zur Verfügung, das die Zeichenerkennung mit Hilfe von Deep Learning optimiert. Durch die automatische Gruppierung von Zeichen können auch ganze Wörter identifiziert werden.

OCR unabhängig von Schrifttyp & Rotation

Deep OCR liest Dot-Print und gruppiert zusammengehörende Zeichen automatisch. – Bild: MVTec Software GmbH

Mit dem Feature Deep OCR, das in die aktuelle Version 20.11 der Machine-Vision-Standardsoftware Halcon integriert ist, bedarf es keiner Segmentierung einzelner Zeichen mehr. Die Technologie nutzt zwei spezifisch vortrainierte Deep-Learning-Netze: Eines dient dazu, komplette Wörter anstatt einzelne Buchstaben im Bild zu finden. Als Ergebnis wird die genaue Position des jeweiligen Wortes mit einem umschließenden Rechteck (Bounding Box) gekennzeichnet. Das zweite Netz hingegen ist speziell auf das Lesen des Wortes trainiert. Der wesentliche Unterschied zu herkömmlichen Verfahren besteht darin, dass beide Schritte der Zeichenerkennung – also das Finden sowie das Lesen der Wörter – auf Deep-Learning-Algorithmen basieren und ganze Wörter anstatt einzelner Buchstaben gelesen werden. Der große Vorteil dieses dualen Ansatzes: Es müssen nur wenige Parameter an die jeweilige Applikation angepasst werden. So arbeitet die Technologie völlig unabhängig vom Schrifttyp, gleich ob Dot-Print-, Kursivschrift oder Schlagzahlen. Auch die Rotation und Ausrichtung des Textes im Bild sowie die Polarität – also ob schwarze Zeichen auf weißem Hintergrund oder umgekehrt – spielen keine Rolle. Denn hinsichtlich dieser Parameter wurde das Netz bereits trainiert, sodass keine entsprechenden Einstellungen mehr manuell vorzunehmen sind. Dabei lassen sich die beiden Netze auch unabhängig voneinander nutzen. Dies macht beispielsweise Sinn, wenn die genaue Position des jeweiligen Wortes im Bild bereits bekannt ist. Dann kann Deep Learning ausschließlich für das Lesen des Textes verwendet werden, womit sich massiv Rechenkapazität einsparen lässt. Dies ist insbesondere dann von Bedeutung, wenn Deep OCR auf einer weniger performanten Hardware läuft. Kann aufgrund von Vorinformation auf das Finden des Textes verzichtet werden, lässt sich auf einer Standard-CPU eine Ausführungszeit von etwa 10ms realisieren. Auf einer Midrange-GPU beträgt die Laufzeit sogar nur 5ms, was für eine Deep-Learning-Anwendung sehr schnell ist.

Bild: Fraunhofer IEM

Effiziente Produktionsplanung: KI reduziert Aufwand bei Schulte Kartonagen um 25%

Welcher Liefertermin steht wann an? Wie aufwändig muss die Maschine umgerüstet werden? Ist das benötigte Material bereits geliefert? Um die Reihenfolge verschiedener Kundenaufträge optimal zu planen, müssen Produktionsplaner:innen eine Vielzahl von Faktoren kennen und einschätzen. Bei Schulte Kartonagen hat ab sofort ein intelligenter KI-Assistent alle Faktoren im Blick – und macht Vorschläge für die effiziente Planung der Produktion. Gefördert wurde die Zusammenarbeit mit dem Fraunhofer IEM und den Universitäten Paderborn und Bielefeld im it’s OWL-Projekt ARISE.

Bild: schoesslers GmbH

appliedAI Institute for Europe launcht kostenlosen KI-Onlinekurs

Das gemeinnützige appliedAI Institute for Europe stellt den kostenfreien Online-Kurs ‚AI Essentials‘ zur Verfügung, der es Interessierten ermöglicht, in die Welt der Künstlichen Intelligenz einzusteigen. Konzepte wie maschinelles Lernen und Deep-Learning sowie deren Anwendungsmöglichkeiten und Auswirkungen auf unser Leben und unsere Wirtschaft sind Teile der umfassenden Einführung.

Bild: ©fotomek - stock.adobe.com

Exzellenznetzwerk für Edge-KI-Technologien

Das europäische Exzellenznetzwerk ‚dAIEDGE‘ fördert die Anwendung von Künstlicher Intelligenz auf Edge-Computing-Plattformen – das Fraunhofer IGD ist einer der Projektpartner.

Bild: Trumpf SE + Co. KG

Künstliche Intelligenz macht Fabriken clever

Seit dem Siegeszug des Chatbots ChatGPT ist künstliche Intelligenz in aller Munde. Auch in der industriellen Produktionstechnik kommt KI mit großen Schritten voran. Lernende Maschinen machen die Fertigung effizienter. Wie funktioniert das genau? Das können Interessierte auf der EMO Hannover 2023 vom 18. bis 23. September erfahren. Die Weltleitmesse für Produktionstechnologie wird ihr Fachpublikum unter dem Claim ‚Innovate Manufacturing‘. mit frischen Ideen inspirieren und künstliche Intelligenz spielt dabei ihre Stärken aus.

Bild: Mitsubishi Electric Corporation, Japan

KI-gestütztes Analysetool für moderne Produktionslinien

Das Data-Science-Tool Melsoft MaiLab von Mitsubishi soll Unternehmen bei der Digitalisierung ihrer Fertigung und unterstützen und so deren Produktivität steigern. Die neue Lösung ist eine intuitive, bedienerzentrierte Plattform, die KI nutzt, um Abläufe automatisch zu verbessern. Sei es Abfallvermeidung durch geringere Ausschussmengen, weniger Stillstandszeiten durch vorbeugende Wartung oder Senkung des Energieverbrauchs durch Prozessoptimierung.

Bild: Kuka AG

Technologiepaket für intelligentes Bin-Picking

Die neue Software Kuka.SmartBinPicking bietet eine Kombination aus KI-basierter Erkennung von Objekten sowie Bahnplanung des Roboters.

Bild: TeDo Verlag GmbH

Logistics Day 2023

Am 28. März werden auf der digitalen Konferenz ´TechTalk Day Logistik´ verschiedene Logistiklösungen aus den Bereichen fahrerlose Transportsysteme, digitale Lagersteuerung, Kommissionierlösungen und Bildverarbeitung vorgestellt.

Bild: Leogistics GmbH

Digitalisierung und KI entscheiden über Erfolg der Lagerlogistik

Die Anforderungen in der Lagerlogistik sind in den letzten Jahren beständig gewachsen, vor allem in puncto Flexibilität.

Bewertung der IT-Sicherheit unerlässlich?

Unternehmen müssen jederzeit auf einen Cyber-Angriff vorbereitet sein. Wie gut sie das allerdings in der Realität tatsächlich sind, können die wenigsten von ihnen einschätzen. Eine Antwort darauf liefert die Bestimmung des Reifegrads der IT-Sicherheit.

Bild: MiniTec GmbH & Co. KG

Automatisierte mobile Messstation

Das Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI) hat 2021 das Projekt AI-Test-Field gestartet.

Chatbots und ihr Einfluss auf die Cybersicherheit

Der Hype um Chatbots mit künstlicher Intelligenz ist groß. Allerdings bringt die Technologie auch Cyberkriminelle aufs Parkett, die sich die neuen Möglichkeiten zunutze machen. Chester Wisniewski, Cybersecurity-Experte bei Sophos, gibt dazu Statements und Beispiele.

Bild: Fraunhofer IGD

Software Arrange beschleunigt Absortierprozesse

In Kombination mit einer Augmented-Reality-Brille bietet eine neue Software des Fraunhofer IGD digitale Unterstützung von Absortiervorgängen. Zusammengehörige Bauteile werden direkt im Sichtfeld der Beschäftigten an der Produktionslinie farblich überlagert. Anwender im Automotive-Bereich können so etwa durch beschleunigte Prozesse und eine minimierte Fehleranfälligkeit Kosten reduzieren.