CVB Polimago: eine einfachere Lösung für komplexe Klassifizierungsaufgaben

2019-05-15
Das maschinelle Lernwerkzeug zur zuverlässigen Objekterkennung CVB Polimago von STEMMER IMAGING bietet einfache und kostengünstige Bildverarbeitungslösungen für anspruchsvolle Such- und Klassifizierungsaufgaben.

Eine geringere Anzahl an Trainingsbildern, kürzere Trainings- und Ausführungszeiten sowie der Einsatz einer Standard-CPU sind entscheidende Vorteile, verglichen mit den meisten anderen Werkzeugen, die auf dem Ansatz des “Convolutional Neural Network“ (CNN) aus dem Deep-Learning-Bereich basieren. In CVB2019 wird CVB Polimago auch für Embedded-Anwendungen verfügbar sein.

CVB Polimago gehört zu STEMMER IMAGINGs Bildverarbeitungs-Toolkit Common Vision Blox (CVB) und liefert eine ähnliche Genauigkeit wie Ansätze mit neuronale Netzwerken. Dabei wird die Ridge-Regression eingesetzt, eine „Supervised Learning“-Methode zur Suche und Klassifizierung in industriellen Bildverarbeitungsanwendungen.

“Überwachtes Lernen“ heißt in diesem Zusammenhang, dass der Anwender in den Trainingsbildern typische Klassifizierungsmerkmale mittels einer ROI markiert hat. Dadurch ist der Polimago-Algorithmus in der Lage, eine Funktion zu erzeugen, die das gewünschte Ergebnis liefert.

Ein entscheidender Faktor ist, dass CVB Polimago in der Regel nur 20 bis 100 Trainingsbilder benötigt, während neuronale Netzwerke 500 Bilder pro Klasse zum Antrainieren erfordern sowie 500 zulässige Referenzbilder („Gut“-Bilder). Beispielsweise würde ein CNN für eine OCR-Anwendung mit alphanumerischen Zeichen (A-Z und 0-9) 36 x 500 = 18.000 Trainingsbilder benötigen.

Kleinere Trainingssets bieten eine Reihe von Vorteilen. Erstens ist bei Polimago schnelleres Anlernen möglich als bei Werkzeugen, die auf neuronalen Netzwerken basieren. Polimago benötigt beispielsweise in der Regel 5 bis 20 Minuten Zeit zum Antrainieren, während ein CNN Stunden dafür braucht.

Zweitens brauchen neuronale Netzwerke wesentlich länger, die erforderlichen Klassifizierungsmerkmale in ihren großen Traningssets zu kennzeichnen. Muss ein Trainingsprozess wiederholt werden, um verschiedene Parameter auszuwerten, arbeiten neuronale Netzwerke noch umständlicher.

CVB Polimago läuft auf einer Standard-CPU und ist ähnlich schnell wie ein neuronales Netzwerk mit Unterstützung von GPU-Beschleunigung, oft sogar noch schneller. Da Polimago keine GPU benötigt, kann es auf einem kompakten PC anstelle eines 19-Zoll-Racks-Systems verwendet werden.

Typische Ausführungszeiten für die Polimago-Suche liegen in der Größenordnung von einigen Millisekunden, die mit den Geschwindigkeiten GPU-beschleunigter neuronaler Netzwerke vergleichbar sind. Jedoch laufen CVB-Klassifizierungsaufgaben mit viel höheren Geschwindigkeiten ab, die oft unter einer Millisekunde liegen.

CVB Polimago ist deutlich kostengünstiger als viele CNN-basierte Werkzeuge und bietet darüberhinaus den Vorteil, dass es in CVB 2019 (vorraussichtliche Release Q3/2019) erstmals auch für LINUX (auf Intel und ARM-Plattformen) verfügbar sein wird. Damit kann es auch in Embedded-Bildverarbeitungsapplikationen eingesetzt werden.

Zu den jüngsten Anwendungen für CVB Polimago gehören neben komplexen OCR-Aufgaben, die Erkennung von unvollständigen Keksen, Überprüfung von Schraubenmuttern auf vollständige Beschichtung und die Klassifizierung von Bolzen, die in Größe und Form ähnlich sind.

In jeder dieser Anwendungen wurden Trainingssätze von 20 bis 50 Trainingsbildern pro Klasse mit Durchlaufzeiten von etwa 7 ms benötigt. Für eine Anwendung zur Identifizierung von Hähnchenfleisch (Flügel, Ober- und Unterschenkel sowie Brüste) wurden in jedem Set 14 Trainingsbilder mit einer Klassifizierungszeit von 1 ms gebraucht.

www.stemmer-imaging.com