Rechenleistung sichtbar
Warum benötigen Sprachmodelle GPUs?
Moderne Sprachmodelle bestehen aus Milliarden Parametern, die für jedes einzelne Token berechnet werden müssen.
Die Animation macht sichtbar, warum klassische CPUs dafür schnell an Grenzen stoßen und weshalb GPUs mit ihren tausenden Recheneinheiten für neuronale Netze so entscheidend geworden sind.
Mit echten Benchmark-Daten lässt sich vergleichen, wie viel Text unterschiedliche Systeme in derselben Zeit erzeugen können.
Animation: Warum braucht KI GPUs - mit auswählbarer Hardware
Hinweis: Apple Silicon ist eigentlich ein integriertes System aus CPU und GPU. Hier in der GPU-Kategorie eingeordnet, weil die Metal-GPU die LLM-Berechnung übernimmt.
Phase 1 · 0%
Phase 1 — Die Aufgabe
cpu · wenige starke kerne
CPU
Eine CPU hat starke Kerne. Sie arbeiten parallel — aber sind viel zu wenige für die Datenmengen eines Sprachmodells.
gpu · tausende kleine kerne
GPU
Eine GPU hat tausende kleinere Kerne. Gleiches Prinzip wie die CPU — nur mit hunderten Mal mehr parallelen Recheneinheiten.
Multiplikationen
—
CPU pro Token
—
GPU pro Token
—
was schreiben cpu und gpu in 10 sekunden?
Antwort des Modells:
