thomas-wodny.de
Wochenrückblick · Künstliche Intelligenz

Modelle treten in den Hintergrund.
Strom wird zur Währung.

KW 19 / 2026 4. – 10. Mai 5 Hersteller · 9 Meldungen

Anthropic übernimmt 300 Megawatt SpaceX-Compute, doppelt seine Rate Limits und verzichtet auf ein neues Modell. OpenAI macht GPT-5.5 Instant zum ChatGPT-Default und reduziert Halluzinationen um 52,5 Prozent. Meta entlässt 8.000 Menschen, um sich um seinen neuen Chief AI Officer zu sortieren. Der Wettbewerb läuft nicht mehr über Modelle — er läuft über Compute, Verlässlichkeit und Reorganisation.

300+ MW
Compute-Kapazität, die Anthropic von SpaceX Colossus 1 übernimmt — 220.000 GPUs
−52,5%
weniger Halluzinationen in GPT-5.5 Instant bei Recht, Medizin, Finanzen
8.000
Stellen, die Meta zum 20. Mai streicht — rund 10 % der Belegschaft
Anthropic · Code w/ Claude SF · 6. Mai
Compute-Deal SpaceX Colossus 1 — 300+ Megawatt, 220.000 GPUs
Anthropic übernimmt die komplette Kapazität des Colossus 1 Data Centers von SpaceX. Über 300 Megawatt zusätzliche Kapazität (mehr als 220.000 NVIDIA GPUs) gehen noch im Mai online. Die Reaktion auf chronische Engpässe für Heavy User von Opus 4.7 ist gleichzeitig das größte Compute-Commitment in der Geschichte des Unternehmens.
Capacity Doppelte Rate Limits, Peak-Hour-Drossel weg
Pro, Max, Team und seat-based Enterprise erhalten verdoppelte 5-Stunden-Rate-Limits in Claude Code. Die Peak-Hour-Reduzierung für Pro und Max wird komplett gestrichen. Opus-API-Limits steigen schrittweise mit Inbetriebnahme der SpaceX-Kapazität.
Managed Agents Multi-Agent-Orchestrierung & Dreaming
Ein Lead-Agent zerlegt Aufgaben und delegiert an Spezialisten mit eigenem Modell, Prompt und Tools — die parallel auf einem geteilten Filesystem arbeiten. Dreaming (Research Preview) wertet vergangene Sessions aus, um Muster zu finden und Agenten selbst zu verbessern. Webhooks und Outcomes-API runden die Plattform ab.
Produkte Claude Security Beta & Claude Design
Claude Security ist als Public Beta für Enterprise verfügbar — scannt Code auf Vulnerabilities und schlägt Fixes per Opus 4.7 vor. Claude Design ist ein neues Anthropic-Labs-Produkt, das mit Opus 4.7 Designs, Prototypen, Slides und One-Pager generiert.
Strategie Kein neues Modell — und das ist die Aussage
Auf der Konferenz fiel der explizite Satz: „Today is about how we are making our products work better for you." Keine Modell-Ankündigung. Stattdessen ein klares Signal: Produktreife ist jetzt das Differenzierungsmerkmal, nicht der nächste Frontier-Score.
OpenAI · 5. Mai
Default-Wechsel GPT-5.5 Instant ersetzt GPT-5.3 in ChatGPT
GPT-5.5 Instant wird neuer Standardmodell in ChatGPT — Rollout an alle User, in der API als chat-latest. Bezahl-Nutzer können GPT-5.3 Instant noch drei Monate über die Modellauswahl verwenden, danach Retirement.
Halluzinationen 52,5 % weniger bei High-Stakes-Prompts
Größter Sprung: 52,5 Prozent weniger halluzinierte Behauptungen bei Prompts aus Recht, Medizin und Finanzen — bei gleicher Latenz wie der Vorgänger. Zusätzlich messbare Verbesserungen bei Bildverständnis, STEM-Fragen und Web-Search-Entscheidungen.
Tonalität Weniger Emoji-Spam, weniger Overformatting
GPT-5.5 Instant gibt knappere, direktere Antworten ohne übermäßiges Formatieren oder gratis-Emojis. Stellt weniger Rückfragen. Personalisierung aus früheren Chats, Files und Gmail startet bei Plus und Pro im Web; Free, Go, Business und Enterprise folgen in den nächsten Wochen.
xAI · 3. – 6. Mai
Release Grok 4.3 GA — 1M Context, 1,25 USD pro Mio Input
xAI macht Grok 4.3 als neuen Frontier-Default in der API verfügbar. Built-in Reasoning, 1 Million Tokens Context, native Video-Inputs. Preis: 1,25 Dollar pro Million Input-Tokens — deutlich unter den meisten Konkurrenten. Parallel: SuperGrok Heavy mit höheren Rate Limits, Custom Voices, Voice Library und der neue Voice Agent grok-voice-think-fast-1.0.
Sunset 8 Legacy-Modelle werden 15. Mai retired
Mit dem Rollout von Grok 4.3 werden acht ältere Modelle am 15. Mai abgeschaltet. Migration über die API erforderlich.
Mistral · 1. – 2. Mai
Open Weights Mistral Medium 3.5 — 128B dense, 256k Context
Public Preview unter modifizierter MIT-Lizenz. 256k Context, multimodal, konfigurierbarer Reasoning-Effort. Auf SWE-Bench Verified erreicht das Modell 77,6 Prozent — schlägt Devstral 2 und deutlich größere Modelle wie Qwen3.5 397B. Frontier-Niveau ohne Frontier-Größe.
Coding-Agent Vibe — Cloud-Sessions, asynchron, parallel
Vibe (Mistrals Coding-Agent) bekommt Remote-Sessions: Coding-Aufträge laufen asynchron und parallel im Hintergrund. Der Entwickler muss nicht mehr daneben sitzen. Standardmodell: Medium 3.5.
Meta · Bekanntgabe Mai
Layoffs 8.000 Stellen werden zum 20. Mai gestrichen
Rund 10 Prozent der 78.865-köpfigen Belegschaft. Weitere Cuts für H2 2026 angekündigt. Anders als 2023: keine Performance-Filterung, sondern Reorganisation rund um den neuen Chief AI Officer Alexandr Wang und seine Superintelligence Labs.
Capex AI-Budget 2026: 115 – 135 Mrd. USD
Die Restrukturierung dient der Umverteilung von Kapital und Köpfen Richtung AI-Infrastruktur und Pod-Struktur. Die teuerste Reorganisation der jüngeren Tech-Geschichte.
Verzögerung Llama 4 Behemoth — auf Herbst oder später vertagt
Der für April geplante Release wurde auf Juni verschoben und ist inzwischen auf Herbst oder später vertagt. Interne Stimmen sehen die Performance-Sprünge nur inkrementell.

Die Modell-Phase, in der jeder Hersteller mit Frontier-Scores um Aufmerksamkeit kämpfte, ist vorbei.

Anthropic kauft GPUs statt zu launchen. OpenAI verkauft Verlässlichkeit statt Geschwindigkeit. Meta entlässt, um zu fokussieren. Mistral und xAI liefern stille Substanz. Wer in den nächsten zwölf Monaten gewinnen will, braucht Strom, Distribution und einen Plan für Operations — nicht den nächsten Punkt im Benchmark.