Rechenleistung sichtbar

Warum benötigen Sprachmodelle GPUs?

Moderne Sprachmodelle bestehen aus Milliarden Parametern, die für jedes einzelne Token berechnet werden müssen.

Die Animation macht sichtbar, warum klassische CPUs dafür schnell an Grenzen stoßen und weshalb GPUs mit ihren tausenden Recheneinheiten für neuronale Netze so entscheidend geworden sind.

Mit echten Benchmark-Daten lässt sich vergleichen, wie viel Text unterschiedliche Systeme in derselben Zeit erzeugen können.

Modell

CPU

GPU

Hinweis: Apple Silicon ist eigentlich ein integriertes System aus CPU und GPU. Hier in der GPU-Kategorie eingeordnet, weil die Metal-GPU die LLM-Berechnung übernimmt.

Phase 1 · 0%

Phase 1 — Die Aufgabe

cpu · wenige starke kerne

CPU

Eine CPU hat starke Kerne. Sie arbeiten parallel — aber sind viel zu wenige für die Datenmengen eines Sprachmodells.

gpu · tausende kleine kerne

GPU

Eine GPU hat tausende kleinere Kerne. Gleiches Prinzip wie die CPU — nur mit hunderten Mal mehr parallelen Recheneinheiten.

Multiplikationen

—

CPU pro Token

—

GPU pro Token

—

was schreiben cpu und gpu in 10 sekunden?

Antwort des Modells:

← Vorherige AnimationWie lernt ein neuronales Netz? ↑ Zur Übersicht Nächste Animation →Wie versteht KI Zusammenhänge?

Warum benötigen Sprachmodelle GPUs?

Animation: Warum braucht KI GPUs - mit auswählbarer Hardware