e.V.
Thesen · geprüft 2026-05-27
Wie entwickeln sich die Kosten für KI über die letzten Jahre?

Gestrige Spitzenfähigkeit wird Jahr für Jahr ~10× billiger

Für ein einmal erreichtes Leistungsniveau fiel der KI-Preis historisch beispiellos schnell — rund 280-fach in zwei Jahren. Das jeweils beste Modell bleibt dabei teuer.

~280×
günstiger für GPT-3.5-Niveau in zwei Jahren
Stanford HAI AI Index 2025
Preis je Mio Tokens für GPT-3.5-Niveau (MMLU 64,8)
Nov 2022
20.00 $
Okt 2024
0.07 $

Quelle: Stanford HAI AI Index 2025 · Epoch AI.

Einordnung

Die ehrliche Kennzahl ist nicht „was kostet das beste Modell”, sondern „was kostet ein einmal erreichtes Leistungsniveau über die Zeit”. Für GPT-3.5-Niveau fiel dieser Preis laut Stanford HAI um das ~280-fache in zwei Jahren — von 20,00 $ auf 0,07 $ je Mio Tokens. Epoch AI misst über alle Benchmarks einen Verfall von rund 10× pro Jahr.

Der Verfall hat vier Treiber: bessere Hardware (~30 % Preis-Leistung pro Jahr), algorithmische Effizienz (~3× pro Jahr), Quantisierung (16-bit → 4-bit) und Wettbewerb zwischen den Anbietern. Hardware allein erklärt nur einen Teil — der größere Hebel ist, dass Modelle bei gleicher Fähigkeit kleiner werden.

Fähige Open-Weights-Modelle liegen self-hosted in der Größenordnung 0,05–0,40 $ je Mio Tokens. Was 2021 das beste Modell war, kostet heute einen Bruchteil davon. Gestrige Spitzenfähigkeit ist Commodity geworden.

Für mana heißt das: Bauen kostet kaum noch etwas. Genau das macht die Vereins-Form ökonomisch tragfähig — was früher Risikokapital und ein großes Team brauchte, übernimmt heute zu großen Teilen die KI. Die vollständige Datenlage mit allen Quellen steht in docs/KI_OEKONOMIE_LAGE.md.

Der ehrliche Gegenpunkt

Der Frontier-Preis fällt nicht. Das jeweils beste Modell bleibt teuer (Premium-Output ~15–30 $ je Mio Tokens). Billiger wird gestrige Spitzenfähigkeit, nicht heutige. Arbeit, die mit „gut genug"-Modellen auskommt, wird real fast gratis; Aufgaben, die nur das absolute Frontier lösen, nicht.

Belege

Quellen Dritter

Was wir hier behaupten, behaupten andere zuerst und mit eigenem Namen daneben. Datum dort, wo es belegbar ist.

Diese Thesen sind die eine Hälfte der Frage „warum jetzt?" — warum mana möglich ist. Die andere Hälfte, warum mana nötig ist, steht unter Souveränität.