Steven Broschart
DE·EN
Kontakt
Rechenleistung sichtbar

Warum benötigen Sprachmodelle GPUs?

Moderne Sprachmodelle bestehen aus Milliarden Parametern, die für jedes einzelne Token berechnet werden müssen.

Die Animation macht sichtbar, warum klassische CPUs dafür schnell an Grenzen stoßen und weshalb GPUs mit ihren tausenden Recheneinheiten für neuronale Netze so entscheidend geworden sind.

Mit echten Benchmark-Daten lässt sich vergleichen, wie viel Text unterschiedliche Systeme in derselben Zeit erzeugen können.

Animation: Warum braucht KI GPUs - mit auswählbarer Hardware

Wo die Rechenlast entsteht · Jede Verbindung im Netz ist eine Multiplikation. Sie sind voneinander unabhängig — also können sie parallel laufen. Die Frage ist nur: auf wie vielen Kernen?
Hinweis: Apple Silicon ist eigentlich ein integriertes System aus CPU und GPU. Hier in der GPU-Kategorie eingeordnet, weil die Metal-GPU die LLM-Berechnung übernimmt.
Phase 1 · 0%
Phase 1 — Die Aufgabe
cpu · wenige starke kerne
CPU
Eine CPU hat starke Kerne. Sie arbeiten parallel — aber sind viel zu wenige für die Datenmengen eines Sprachmodells.
gpu · tausende kleine kerne
GPU
Eine GPU hat tausende kleinere Kerne. Gleiches Prinzip wie die CPU — nur mit hunderten Mal mehr parallelen Recheneinheiten.
Multiplikationen
CPU pro Token
GPU pro Token
was schreiben cpu und gpu in 10 sekunden?
Antwort des Modells:
← Vorherige AnimationWie lernt ein neuronales Netz? ↑ Zur Übersicht Nächste Animation →Wie versteht KI Zusammenhänge?