Tachyum spricht über die Architektur seines Allzweckprozessors, der sechsmal schneller sein soll als die NVIDIA H100-GPU

Tachyum spricht über die Architektur seines Allzweckprozessors, der sechsmal schneller sein soll als die NVIDIA H100-GPU

Tachyum strebt an, in den kommenden Jahren ein wichtiger Akteur auf dem Markt für KI, HPC und Cloud-Rechenzentren zu werden. Ihr einzigartiges Produkt, der Prodigy , ist ein All-in-One-Prozessor. Dieser Chip kombiniert die Leistung von GPU, CPU und TPU in einem Gerät für Kosteneffizienz und Leistung. Der Name Tachyum erschien bereits 2018 , als sie ihren Prodigy-Prozessor vorstellten. Heute ist ein vollständiges Whitepaper, das die Architektur umreißt, auf ihrer Website verfügbar.

Treffen Sie das Wunderkind

Tachyum hat das Chip-Layout und die Architektur seines Prodigy-Prozessors enthüllt. 128 CPU-Kerne, 16 DDR5-7200- Speichercontroller und 64 PCIe 5.0 – Lanes liefern erstklassige Rechenleistung. Die Haupteinheiten sind über ein Netz mit 10 Terabit pro Sekunde verbunden. Die Prozessoren laufen mit einer maximalen Leistung von 5,7 GHz , was den neuesten Angeboten von AMD und Intel entspricht .

Prodigy-CPU-Rezension | Tahyum

Prodigy wird im branchenführenden 5-nm-Verfahren von TSMC hergestellt . Dies ermöglicht die Verwendung eines Kristalls kleiner als 500 mm² . Das Gehäuse selbst basiert auf einem monolithischen Design. ISA (Instruction Set Architecture) ist eine spezielle Version, die sowohl RISC als auch CISC kombiniert . Diese ISA eliminiert effektiv alle ineffizienten Befehle, und alle Befehle sind nicht breiter als 32/64 Bit.

Prodigy-Mockup mit Funktionsblöcken | Tahyum

Die Prodigy-CPU verfügt über eine benutzerdefinierte Architektur, die in der Lage ist, bis zu 8 Anweisungen pro Takt zu decodieren und zu löschen . In ähnlicher Weise kann diese CPU 11 Befehle pro Takt mit einer Befehlswarteschlange, die bis zu 48 Befehle unterstützt, und einem Planer, der 12 Warteschlangen mit 15 Einträgen Tiefe unterstützt, ausgeben.

Die CPU enthält 4 ALUs , eine Ladeeinheit, eine Speichereinheit, eine Lade-/Speichereinheit, eine Maskeneinheit und zwei 1024 -Bit-Vektoreinheiten. Der Kern verfügt über ein Subsystem für künstliche Intelligenz, das von einem 4096 -Bit-Matrixblock angetrieben wird.

Architekturdiagramm von Prodigy | Tahyum

In Bezug auf die Leistung kann diese All-in-One-Lösung die 6 – fache Leistung des hochmodernen NVIDIA H100 -Prozessors in AI FP8-Leistung bieten . In ähnlicher Weise machte Tachyum mehr Schüsse und bot einen satten 9-fachen Effizienzvorteil gegenüber den grünen Teams. Es wird interessant sein zu sehen, wie gut diese Zahlen einem Eins-zu-eins-Vergleich standhalten.

Veröffentlichungsdatum

Alle Credits gehen an Tachyum für diese Zahlen und Figuren. Der Prodigy-Prozessor soll im nächsten Jahr auf den Markt kommen, die Massenproduktion ist für die zweite Hälfte des Jahres 2023 geplant .

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert