Lernen Sie Biren BR100 kennen, Chinas schnellste GPU, fast dreimal schneller als NVIDIA A100

Lernen Sie Biren BR100 kennen, Chinas schnellste GPU, fast dreimal schneller als NVIDIA A100

China strebt den Eintritt in den Halbleitermarkt an und hat in diesem Jahr bemerkenswerte Ergebnisse vorzuweisen. Hot Chips 34 scheint das Gesprächsthema des Tages zu sein, da NVIDIA seine kommenden Hopper-GPUs vorstellt . Hier können Sie mehr darüber lesen . Birentech aus China nutzte die Gelegenheit, um seine kommende BR100-GPU vorzustellen, die Berichten zufolge schneller als die Ampere-basierte A100 von NVIDIA ist.

Technische Daten BR100

Diese GPU basiert auf einem 7-nm-Prozessknoten mit 77 Milliarden Transistoren (nur 3 Milliarden weniger als die NVIDIA H100). Für diesen Prozessknoten wurde das TSMC 2.5D CoWoS-Design verwendet. In Bezug auf den Speicher wird dieser Gigant von 64 GB HBM2e mit einer Bandbreite von etwa 2,3 TB/s angetrieben. Die Chipgröße beträgt ca. 1074mm².

Trichter H100 Byren BR100
PCIe-Gen5.0 PCIe-Gen5.0
Speicher HBM3 Speicher HBM2e
Speicherbandbreite 2,3 TB/s Speicherbandbreite 3 TB/s
TSMS 4n 2.5D CoWoS von TSMC für 7nm
80 GB Speicher 64 GB Speicher
NVLink (Die-zu-Die) 900 GB/s  Schneller Speicher 896 GB/s
Monolithisches Design MCM-Design (Multi-Chip-Modul).
700 W 550 W
Technische Daten Biren BR100 | Birentech von Wccftech

architektonische Übersicht

Wie oben erwähnt, hat die GPU ein 2-Chiplet-MCM-Design, wobei jedes Chiplet von 16 SPCs (Stream Processing Clusters) mit Strom versorgt wird. Jeder SPC besteht aus 16 EUs (Execution Units) und 4 EUs bilden eine Compute Unit (CU).

  • Chips: 2
  • SPC: 2 x 16 = 32
  • EU = 32 × 16 = 512
  • KU = 512/4 = 128

Innerhalb der SPC finden wir 16 EUs. Ein genaueres Verständnis zeigt, dass jede EU aus 16 Stream-Verarbeitungskernen (V-Kern) und einem T-Kern oder Tensor-Kern besteht. Stream-Verarbeitungskerne x16 (oder 1 V-Core) bieten FP32-, FP16-, INT32-, INT16-Berechnungen. 

Ein Blick ins Innere des EU BR100 | Birentech von Wccftech

BR100 gegen A100

Im Vergleich zur neuesten Generation des Ampere-basierten A100 ist der BR100 in einigen Tests etwa 2,6-mal schneller. Dies zeigt, wie schnell China in der GPU-Abteilung beschleunigt. Tut mir leid, dass ich ärgerlich bin, aber der Hopper-basierte H100 ist in denselben Tests etwa 2-3 mal schneller. Diese Tensor-Kerne können diesen Vorsprung in verschiedenen Benchmarks um etwa das 30-fache steigern.

NVIDIA A100 vs. Birentech B100 | Birentech von Wccftech

Allgemeiner Gebrauch

Die GPU ist der chinesischen Abteilung für künstliche Intelligenz gewidmet und soll menschliches Verhalten nachahmen, indem sie die Leistung der künstlichen Intelligenz verbessert. Dies geschieht, damit China auf seine eigene Technologie zurückgreifen kann. 

Featured Image Credit: ferdibtk auf Freepik

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert