Siemens vereinfacht mit Catapult AI NN die Entwicklung von KI-Beschleunigern für fortschrittliche System-on-Chip-Designs
Siemens Digital Industries Software hat die Catapult™ AI NN-Software für die High-Level-Synthese (HLS) von neuronalen Netzwerkbeschleunigern auf anwendungsspezifischen integrierten Schaltkreisen (ASICs) und System-on-a-Chip (SoCs) vorgestellt.
- Catapult AI NN bietet Software-Ingenieuren eine umfassende Lösung zur Synthese von KI-basierten neuronalen Netzen
- Ermöglicht Software-Entwicklungsteams, in Python entwickelte KI-Modelle nahtlos in siliziumbasierte Implementierungen zu übersetzen, was eine schnellere und energieeffizientere Ausführung im Vergleich zu Standardprozessoren möglich macht
Catapult AI NN ist eine Komplettlösung, die mit einer Beschreibung eines neuronalen Netzwerks aus einem KI-Framework beginnt, diese in C++ umwandelt und in einen RTL-Beschleuniger in Verilog oder VHDL für die Implementierung in Silizium synthetisiert.
Catapult AI NN vereint hls4ml, ein Open-Source-Paket für Hardware-Beschleunigung durch maschinelles Lernen, und die Siemens Catapult™ HLS-Software für High-Level-Synthese. Catapult AI NN wurde in enger Zusammenarbeit mit Fermilab, einem vom US-amerikanischen Department of Energy betriebenen Forschungszentrum, und anderen führenden Anbietern von hls4ml entwickelt. Die Software erfüllt die spezifischen Anforderungen an das Design von Beschleunigern für maschinelles Lernen in Bezug auf Stromverbrauch, Leistung und Fläche auf kundenspezifischen Chips.
„Der Übergabeprozess und die manuelle Konvertierung eines neuronalen Netzwerkmodells in eine Hardware-Implementierung ist sehr ineffizient, zeitaufwendig und fehleranfällig. Dies gilt insbesondere für die Erstellung und Verifikation von Varianten eines Hardware-Beschleunigers, die auf eine bestimmte Leistung, Stromverbrauch und Fläche zugeschnitten sind“, sagte Mo Movahed, Vice President und General Manager for High-Level Design, Verification and Power, Siemens Digital Industries Software. „Indem wir Wissenschaftler und KI-Experten in die Lage versetzen, branchenübliche KI-Frameworks wie das Design neuronaler Netzwerkmodelle zu nutzen und diese Modelle nahtlos in Hardware-Designs zu synthetisieren, die hinsichtlich Stromverbrauch, Leistung und Fläche (PPA) optimiert sind, eröffnen wir KI- und Machine-Learning Software-Ingenieuren völlig neue Möglichkeiten. Unsere neue Catapult AI NN-Lösung erlaubt es Entwicklern, ihre neuronalen Netzwerkmodelle für optimale PPA parallel zum Softwareentwicklungsprozess zu automatisieren und zu implementieren, was eine neue Ära der Effizienz und Innovation in der KI-Entwicklung einläutet.”
Da Laufzeit-KI- und Machine-Learning-Aufgaben aus dem Rechenzentrum in alle Bereiche – von Verbrauchergeräten bis hin zu medizinischen Geräten – einfließen, besteht ein rasant wachsender Bedarf an „richtig dimensionierter“ KI-Hardware, um den Stromverbrauch zu minimieren, die Kosten zu senken und die Differenzierung des Endprodukts zu maximieren. Die meisten Experten für maschinelles Lernen arbeiten jedoch lieber mit Tools wie TensorFlow, PyTorch oder Keras als mit synthetisierbarem C++, Verilog oder VHDL. Bislang gab es für KI-Experten keinen einfachen Weg, ihre Machine-Learning-Anwendungen in einer richtig dimensionierten ASIC- oder SoC-Implementierung zu beschleunigen.
Die hls4ml-Initiative soll dazu beitragen, diese Lücke zu schließen, indem sie C++ aus einem neuronalen Netzwerk erzeugt, das in KI-Frameworks wie TensorFlow, PyTorch oder Keras beschrieben wird. C++ kann dann für eine FPGA-, ASIC- oder SoC-Implementierung eingesetzt werden.
Catapult AI NN erweitert die Möglichkeiten von hls4ml auf ASIC- und SoC-Design. Die Software enthält eine eigene Bibliothek mit speziellen C++ Machine-Learning-Funktionen, die auf das ASIC-Design zugeschnitten sind. Mit diesen Funktionen können Designer PPA optimieren, indem sie Latenz- und Ressourcenkompromisse zwischen alternativen Implementierungen des C++ Codes treffen. Darüber hinaus können sie jetzt die Auswirkungen verschiedener neuronaler Netzdesigns bewerten, um die beste neuronale Netzwerkstruktur für die Hardware zu bestimmen.
www.sw.siemens.com
Fordern Sie weitere Informationen an…