KI-Energie-Rechenschaft: Der Umwelt-Toll 2026, über den niemand reden will

Wir reden viel darüber, was KI kann. Wir reden selten darüber, was sie kostet.

Der Stanford AI Index 2026 — die meistzitierte Vermessung dessen, wo das Feld tatsächlich steht — beziffert den Teil der Geschichte, mit dem niemand in der KI-Presse auftreten will: KIs ökologischer Fußabdruck ist im letzten Jahr stark gewachsen, und die Kurve biegt in die falsche Richtung. Frontier-Modelle zu trainieren verbraucht heute mehr Strom als kleine Städte. Inference, dort, wo der eigentliche Scale-Up passiert, verbraucht noch deutlich mehr. US-Rechenzentren haben 2025 schätzungsweise 4–5 % des nationalen Stroms verbraucht. Manche Prognosen setzen diesen Anteil bis 2030 auf 9–12 %.

Das ist keine Randnotiz. Das ist die Art von Infrastruktur-Geschichte, die am Ende bei Regulatoren, Versorgungskommissionen und Vorständen landet — ob die KI-Labs das wollen oder nicht.

Die Zahlen hinter der Schlagzeile

Ein paar Datenpunkte aus den letzten zwölf Monaten:

Trainingskosten. Der Trainingslauf von GPT-4 wurde auf rund 50 GWh geschätzt. Die Trainingsläufe der Frontier-Modelle 2026 — Claude 4, GPT-5.2, Gemini 2.5 — werden öffentlich auf ein Mehrfaches davon geschätzt. Der Stanford-Bericht stellt explizit fest, dass sich der Compute für das Training der größten Modelle ungefähr alle sechs Monate verdoppelt, während algorithmische Effizienz nur etwa halb so schnell wächst. Netto: mehr Energie, mehr Kühlung, mehr Emissionen pro Trainingszyklus.
Wasser zur Kühlung. Ein einzelner großskaliger Trainingslauf kann Millionen Liter Süßwasser verbrauchen. Microsoft wies 2024 einen Anstieg des Wasserverbrauchs um 34 % aus, weitgehend AI-Workloads zugeschrieben. Googles Wasserverbrauch stieg um 20 %. Das sind keine Rundungsfehler.
Inference im Maßstab. Das ist die größere Geschichte. Training ist ein Einmalkostenfaktor. Inference ist permanent. Jede ChatGPT-Anfrage, jede Claude-Konversation, jeder Midjourney-Prompt ist Strom, der irgendwo kontinuierlich gezogen wird, für die gesamte Lebensdauer des Produkts. Ende 2025 liefen die Inference-Workloads der großen Labs im Multi-Gigawatt-Maßstab, rund um die Uhr.
CO2-Intensität variiert enorm. Ein in Island mit Geothermie trainiertes Modell ist nicht dasselbe wie eines, das gegen ein texanisches Kohle-Peaker-Grid trainiert wird. Wo der Compute steht, ist genauso wichtig wie wie viel Compute genutzt wird. Das meiste Frontier-Training findet in Regionen mit saubereren Grids als dem US-Durchschnitt statt, aber Inference im großen Maßstab passiert zunehmend dort, wo die Latenz es verlangt — und das schließt kohlelastige Grids mit ein.

Das Ergebnis: Eine Branche, die lautstark versprochen hat, die Dekarbonisierung anderer Teile der Wirtschaft voranzutreiben, ist nach ihren eigenen Daten eine der am schnellsten wachsenden Quellen neuer Stromnachfrage auf dem Planeten.

Warum die Berichterstattung es verpasst hat

Aus demselben Grund, warum generative Medien den Großteil von 2025 unterberichtet waren: Es passt nicht auf eine Enterprise-Folie. Investoren wollen es nicht hören. Labs wollen nicht damit auftreten. Reporter, die über Modell-Releases schreiben, haben keinen Platz dafür.

Aber das Schweigen wird immer schwerer aufrechtzuerhalten. Drei Dinge haben sich im letzten Jahr geändert:

1. Versorger haben angefangen, Nein zu sagen. Ende 2025 und Anfang 2026 haben mehrere US-Versorger — Dominion, Georgia Power, Duke — große neue Rechenzentrum-Anschlussanträge pausiert oder abgelehnt, weil sie die Last nicht bedienen konnten. Northern Virginia, der größte Rechenzentrumsmarkt der Welt, hat seine Übertragungskapazitäten ausgereizt. PJM Interconnections Anschluss-Warteschlange wuchs auf einen Backlog von mehreren Jahren. Das ist keine Hypothese mehr. Das Netz ist der Engpass.

2. Offenlegung wurde ernst. Der EU AI Act, seit August 2025 in Kraft, verlangt Reporting zu Trainings-Compute, geschätztem Energieverbrauch und CO2-Fußabdruck für allgemeine KI-Modelle oberhalb einer definierten Schwelle. Die erste Offenlegungsrunde Anfang 2026 hat die detailliertesten öffentlichen Zahlen hervorgebracht, die die Branche je veröffentlicht hat. Sie waren nicht schmeichelhaft.

3. Wasser wurde ein lokales politisches Thema. Phoenix, Loudoun County (Virginia) und The Dalles (Oregon) hatten 2025 alle öffentliche Anhörungen, in denen der Wasserverbrauch von Rechenzentren das Hauptthema war. Das sind nicht tiefblaue Städte auf der Suche nach Anti-Tech-Theater. Das sind Gemeinden, in denen der Grundwasserleiter der limitierende Faktor für Wachstum ist. „Bau das Rechenzentrum" ist inzwischen ein echter Kampf an Orten, die sie früher mit offenen Armen empfangen haben.

Was das für Builder bedeutet

Hier wird es konkret für Produkt- und Engineering-Arbeit.

Die günstige-Inference-Ära ist nicht garantiert. Ein großer Teil der Produktplanung 2026 geht davon aus, dass Inference-Kosten weiterhin ungefähr auf der Kurve der letzten zwei Jahre sinken. Diese Annahme hängt von einer Kombination aus algorithmischer Effizienz, Hardware-Effizienz und niedrigen Energiepreisen ab. Energiepreise tendieren in den relevanten Märkten nicht mehr nach unten. Wenn deine Unit Economics darauf beruhen, dass Inference bis 2028 10x günstiger wird, solltest du das gegen eine Welt stressen, in der Energie eine reale Beschränkung ist.

Latenz und Geografie sind wichtiger als früher. Der CO2-Footprint deiner Inference hängt davon ab, wo sie läuft. Wenn du dein Produkt so architektieren kannst, dass es batcht, in die sauberste verfügbare Region routet oder sinnvolle Arbeit On-Device erledigt, bekommst du in den nächsten Jahren einen strukturellen Vorteil. Das ist nicht nur Ethik — es ist eine Absicherung gegen eine Zukunft, in der CO2-bewusstes Scheduling vertragliche Pflicht wird, nicht nur ein nettes Extra.

Modellauswahl wird eine Energiefrage. Für die meisten Business-Anwendungen brauchst du nicht das Frontier-Modell. Ein gut abgestimmtes 7B- oder 14B-Parameter-Modell auf einem ernsthaften Inference-Stack schlägt GPT-5.2 in den meisten Aufgaben und verbraucht einen Bruchteil der Energie. Die 2026-Effizienz-Story ist aus diesem Blickwinkel auch eine Umwelt-Story. Jedes Produktteam, das für eine Aufgabe, die ein kleineres Modell genauso gut erledigt, das größte verfügbare Modell wählt, trifft eine CO2-Entscheidung — ob es das merkt oder nicht. Wähle das kleinste Modell, das das Problem löst. Das ist der neue Default.

Plane für Offenlegung, weil sie kommt. Wenn du in der EU KI-Systeme in jedem sinnvollen Maßstab trainierst, feintunest oder betreibst, unterliegst du bereits dem AI-Act-Reporting. Wenn du in den USA bist, hat die SEC Kommentare zu KI-bezogenen Offenlegungsregeln eröffnet. Kalifornien, New York und Colorado haben Vorschläge auf Landesebene in der Pipeline. Behandle Energie- und CO2-Reporting wie Security-Reporting: Eine Compliance-Zeile, die jedes Jahr wächst, und ein Wettbewerbsvorteil, wenn du sie früher machst als die, mit denen du konkurrierst.

On-Device und Edge sind nicht mehr nur eine UX-Story. Dieselben Modelle, die Cloud-Inference verbilligen, reduzieren den Energie-Fußabdruck pro Query um eine Größenordnung. Die Hybrid-Licht-Materie-Arbeit aus Penn Anfang des Jahres, die Welle kleiner Open-Weight-Modelle, die durch den Frühjahr landeten, und die Diffusions-Beschleunigungsarbeit bei Echtzeit-Video zeigen alle in dieselbe Richtung: mehr Inference auf Consumer-Hardware, weniger in kohle-benachbarten Rechenzentren. Wenn du Features ausliefern kannst, die ohne Round-Trip zur Cloud funktionieren, ist das jetzt ein echter Architekturvorteil — nicht nur ein Offline-Modus.

Der unbequeme Teil

Die KI-Branche hat drei Jahre lang eine Geschichte verkauft, in der die Technologie ungefähr im selben Tempo besser und billiger wird. Die erste Hälfte dieser Geschichte stimmt noch weitgehend. Die zweite Hälfte stößt an eine Wand, und die Wand ist physisch.

Man kann nicht um Wasser herumrouten. Man kann nicht um einen Transformator herumoptimieren, der erst 2028 geliefert wird. Man kann kein 200-Megawatt-Rechenzentrum ohne 200-Megawatt-Netzanschluss ausliefern, und das Netz erweitert sich nicht im Tempo eines Modell-Releases.

Die Labs wissen das. Die ernsthaften unter ihnen zeichnen Power Purchase Agreements für Kernkraft, investieren in Geothermie, designen Inference-Chips gezielt für Energieeffizienz und verlagern Trainings-Workloads leise in Regionen mit saubereren Grids und mehr Kapazität. Ein Teil dieser Arbeit ist real. Ein Teil ist Pressemitteilung. Für Builder und Produktleute ist der Teil, den man beobachten sollte, die tatsächlich gelieferten Zahlen — nicht die Ankündigungen, nicht die 2030-Ziele, sondern die Zahlen in zwei Jahren.

Denn so, glaube ich, wird 2027 aussehen, und das will in der KI gerade noch niemand laut sagen: Die nächste Beschränkung für KI sind nicht Modelle, nicht Daten, nicht Compute-Silicon. Es sind Elektronen und Wasser. Und die Leute, die jetzt auf diese Beschränkung planen — indem sie effiziente Produkte bauen, das richtige Modell für den Job wählen, mit Energie als First-Class-Concern designen und Offenlegung als Feature behandeln — werden einen substanziellen strukturellen Vorteil gegenüber denen haben, die es nicht tun.

Die Rechenschaft kommt. Sie hat es nur noch nicht auf die Titelseite geschafft.

KI-Energie-Rechenschaft: Der Umwelt-Toll 2026, über den niemand reden will

Die Zahlen hinter der Schlagzeile

Warum die Berichterstattung es verpasst hat

Was das für Builder bedeutet

Der unbequeme Teil

Kommentare (0)

Verwandte Beiträge

Die nächste KI-Hardware-Revolution findet nicht auf Silizium statt

Die KI-Chip-Kriege sind zurück: Was Qualcomms 10-Mrd.-Tenstorrent-Deal für Builder bedeutet

Pilot-Ermüdung: Die versteckte Krise, die Enterprise-KI 2026 killt

Die Zahlen hinter der Schlagzeile

Warum die Berichterstattung es verpasst hat

Was das für Builder bedeutet

Der unbequeme Teil

Kommentare (0)

Verwandte Beiträge

Die nächste KI-Hardware-Revolution findet nicht auf Silizium statt

Die KI-Chip-Kriege sind zurück: Was Qualcomms 10-Mrd.-Tenstorrent-Deal für Builder bedeutet

Pilot-Ermüdung: Die versteckte Krise, die Enterprise-KI 2026 killt

Bleib auf dem Laufenden