AI-Stack in Bewegung: Modelle, Infrastruktur, Daten - alles wird neu verteilt
- Ralph Schwehr

- 18. Dez. 2025
- 5 Min. Lesezeit
Noch ein paar Tage bis Weihnachten, draußen Lichterketten, drinnen Release-Feuerwerk. Während viele in den Jahresendmodus schalten, drehen die großen AI-Player noch einmal richtig auf: Google, NVIDIA, OpenAI, Microsoft, Amazon, IBM & Co. verschieben in wenigen Tagen die Gewichte im AI-Stack von Standard-Modellen über Infrastruktur bis hin zu Datenströmen und Standortpolitik.
Bevor wir eintauchen: Danke, dass ihr Woche für Woche dabei seid, diesen Newsletter lest, in Teams-Channels teilt und als Entscheidungsgrundlage in euren Projekten nutzt. Genau dafür schreiben wir ihn. Wenn euch diese Ausgabe gefällt, schickt sie gerne an Kolleg:innen, Kund:innen oder Partner weiter, denn je mehr Menschen den technologischen Wandel verstehen, desto besser werden die Entscheidungen.
Übrigens: Unsere Newsletter gibt es auch auf Englisch 🌍 Ihr müsst dazu lediglich die Sprache der Website auf Englisch stellen und schwups ist der Text auch in dieser Sprache verfügbar. AI sein Dank 😉
Was wir in dieser Vorweihnachtswoche sehen:
Modelle werden zu strategischen Defaults in Search, Apps & Workflows.
Compute & Energie entwickeln sich zur knappsten Ressource.
Datenströme in Echtzeit werden zum Rückgrat agentischer Systeme.
Und Politik & Standortfragen rücken endgültig in den AI-Stack.
Genau diese vier Linien ziehen sich durch die zehn Themen dieser Ausgabe und zeigen, worauf es 2026 wirklich ankommen wird.

1. Modelle: Defaults werden zur strategischen Waffe
Google schaltet hoch: Gemini 3 Flash wird zum neuen Standardmodell in der Gemini-App und in AI-Search. Das Modell soll das bisherige Flash-Modell nicht nur bei Tempo und Kosten schlagen, sondern auch beim Reasoning und wird gleichzeitig breit für Developer ausgerollt, von AI Studio über Gemini API bis Vertex AI.
Damit sendet Google zwei Botschaften:
Default wins, wer die Voreinstellung kontrolliert, kontrolliert die Nutzung.
Low Latency + High IQ ist der neue Sweet Spot: keine Wahl mehr zwischen „schnell“ und „smart“.
OpenAI antwortet auf der Modellebene mit GPT-5.2 in drei Varianten: Instant, Thinking und Pro. Die neue Generation zielt auf bessere Planung, Coding, Long-Context-Verständnis und produktionsreife Outputs (Tabellen, Finanzmodelle, Präsentationen) und folgt einer internen „Code Red“-Priorisierung, um den Druck durch Gemini zu kontern.
Für Unternehmen heißt das:
Modellentscheidungen werden weniger religiös, mehr operativ.
Wichtiger als „welches Modell?“ wird die Frage: Wie integriere ich unterschiedliche Profile (schnell vs. tief) in Prozesse und Agentenarchitekturen?
2. Compute & Infrastruktur: „Infra is King“ wird Realität
Während die öffentliche Aufmerksamkeit bei Modellen bleibt, verlagert sich die eigentliche Macht in Schichten darunter.
Google + Meta: TorchTPU: Mit dem Projekt „TorchTPU“ arbeiten Google und Meta daran, TPUs zur ersten Adresse für PyTorch-Workloads zu machen. Ziel: die Abhängigkeit vom NVIDIA-Ökosystem rund um CUDA reduzieren und TPUs für das dominierende Framework attraktiver machen inklusive möglicher Open-Source-Komponenten.
NVIDIA + SchedMD (Slurm): NVIDIA seinerseits übernimmt SchedMD, den Entwickler des Open-Source-Schedulers Slurm, der heute bereits einen Großteil der größten AI- und HPC-Cluster orchestriert. Slurm bleibt zwar Open Source, wird aber enger in NVIDIAs Stack integriert, von der GPU bis zur Workload-Optimierung.
Microsoft: „Hunderte Milliarden“ als Eintrittsticket: Mustafa Suleyman, CEO von Microsoft AI, formuliert es offen: Wer an der Frontier mithalten will, muss in den nächsten 5-10 Jahren „hunderte Milliarden“ in Rechenkapazität, Energie und Talent investieren. Microsoft beschreibt sich inzwischen halb ironisch als moderne Baufirma, die Gigawatt an AI-Infrastruktur errichtet.
Hut 8 + Fluidstack + Anthropic: Parallel verschieben sich die Player auf der Infrastrukturseite: Hut 8, ehemals Bitcoin-Miner, sichert sich mit Fluidstack und Anthropic einen 15-Jahres-Deal über 7 Mrd. US-Dollar zum Aufbau eines großen AI-Rechenzentrums in Louisiana, mit Option auf deutlich mehr Kapazität. AI-Compute wird zur eigenen Asset-Klasse mit langfristigen Leasing-Strukturen.
Frontier-Tech unter einem Dach: Amazon bündelt mit Peter DeSantis eine neue Einheit, die AI-Modelle, eigene Chips (Graviton, Trainium) und Quantum Computing vereint. Ziel: Innovationszyklen verkürzen, vertikale Integration stärken und AWS-Infrastruktur noch enger auf agentische Workloads ausrichten.
Die Linie ist klar: Compute, Energie und Standortpolitik werden zu Boardroom-Themen.

3. Datenströme & M&A: Streaming wird zum Rückgrat agentischer Systeme
Modelle ohne Datenströme bleiben Blindgänger. Entsprechend aggressiv wird in Data-Plattformen investiert.
IBM + Confluent (11 Mrd. US-Dollar): IBM übernimmt Confluent für 11 Mrd. US-Dollar, um sein Hybrid-Cloud- und AI-Portfolio mit einer Kafka-basierten Real-Time-Streaming-Plattform zu verknüpfen. Ziel ist ein „Smart Data Platform“-Ansatz, in dem AI-Agenten kontinuierlich auf vertrauenswürdige, governance-fähige Echtzeitdaten zugreifen können, quer über Anwendungen und APIs hinweg.
800 Mio. US-Dollar M&A-Feuerkraft: Der SaaS-Anbieter Freshworks kündigt an, seine 800 Mio. US-Dollar Cash gezielt für AI-Zukäufe einzusetzen mit Fokus auf AI-Native Incident Management, IT-Operations und Employee Experience. Mit Deals wie der Übernahme von FireHydrant baut Freshworks eine agentische ServiceOps-Plattform, die Störungen proaktiv verhindern statt nur reagieren soll.
Die Botschaft für Enterprise-IT:
Real-Time-Streaming + AI verschmelzen zu einer Infrastruktur-Kategorie.
Mid-Cap-SaaS-Player werden zu ernstzunehmenden M&A-Akteuren im AI-Ökosystem.
4. Politik & Standort: „Stargate“ wird global und hochpolitisch
Zum Schluss die vielleicht sichtbarste Verschiebung: AI verlässt die reine Tech-Sphäre und wird zur Infrastruktur- und Standortpolitik.
OpenAI holt den ehemaligen britischen Finanzminister George Osborne als Managing Director für „OpenAI for Countries“ und als Gesicht des globalen Stargate-Programms. Osborne soll die internationale Expansion des 500-Mrd.-US-Dollar-Infrastrukturprojekts steuern, inklusive Rechenzentren außerhalb der USA und Partnerschaften mit Regierungen weltweit.
Damit ist klar:
AI-Infrastruktur wird wie Flughäfen oder Häfen verhandelt, mit Fragen zu Sicherheit, Energie, Bildung und Souveränität.
Tech-Unternehmen professionalisieren ihre „Government & Infra“-Teams mit politischen Schwergewichten.
Für Unternehmen bedeutet das: Standort-, Energie- und Datenstrategie lassen sich nicht mehr getrennt von AI-Roadmaps denken.

💡 Kernaussagen in Kürze
Defaults verschieben Macht: Mit Gemini 3 Flash und GPT-5.2 wird das Rennen um Standard-Modelle in Apps und Search neu eröffnet.
Infra is King: TorchTPU, NVIDIA x Slurm und der Kapitalbedarf im „hundert Milliarden“-Maßstab zeigen: Compute & Energie sind der Engpass.
AI-Compute wird Asset-Klasse: Hut-8-Deals und Amazons Bündelung von AI/Chips/Quantum machen Rechenzentren zum strategischen Investmentgut.
Datenströme sind der neue Backbone: IBM + Confluent und Freshworks’ M&A-Hunger verankern Real-Time-Streaming im Enterprise-AI-Stack.
Politik rückt in den Stack: Mit Osborne und Stargate wird AI-Infrastruktur zur geopolitischen Frage und zur Chefsache auf Regierungsseite.
🔍 Quellenübersicht
Google Gemini 3 Flash als neues Default-Modell (18.12.2025), The Verge: https://www.theverge.com/news/845741/gemini-3-flash-google-ai-mode-launch The Verge
Google & Meta „TorchTPU“ macht TPUs PyTorch-freundlicher (18.12.2025), Reuters: https://www.reuters.com/business/google-works-erode-nvidias-software-advantage-with-metas-help-2025-12-17/ Reuters
NVIDIA Übernahme von SchedMD (Slurm) (15.12.2025), NVIDIA / Reuters –https://blogs.nvidia.com/blog/nvidia-acquires-schedmd/ Reuters
OpenAI Release von GPT-5.2 (Instant, Thinking, Pro) (12.12.2025), Ars Technica / Reuters: https://arstechnica.com/information-technology/2025/12/openai-releases-gpt-5-2-after-code-red-google-threat-alert/ Ars Technica+1
Microsoft Mustafa Suleyman: „Hunderte Milliarden“-Investitionen nötig (18.12.2025), Business Insider: https://www.businessinsider.com/microsoft-ai-ceo-mustafa-suleyman-cost-hundred-billions-superintelligence-2025-12 Business Insider
Hut 8, Fluidstack & Anthropic 7-Mrd.-US-Dollar-AI-Infrastrukturdeal über 15 Jahre (18.12.2025), Barron’s: https://www.barrons.com/articles/hut-8-ai-anthropic-fluidstack-edc67485 Barron's
Amazon Peter DeSantis übernimmt AI/Chips/Quantum (18.12.2025), Reuters: https://www.reuters.com/technology/amazon-taps-veteran-peter-desantis-lead-ai-chip-quantum-push-2025-12-17/ Reuters
Freshworks 800 Mio. US-Dollar Cash für AI-M&A (18.12.2025), Reuters: https://www.reuters.com/technology/us-software-firm-freshworks-eyes-acquisitions-with-800-million-cash-pile-ai-2025-12-17/ Reuters
IBM Übernahme von Confluent für 11 Mrd. US-Dollar (09.12.2025), IBM / Fintech News: https://newsroom.ibm.com/2025-12-08-ibm-to-acquire-confluent-to-create-smart-data-platform-for-enterprise-generative-ai IBM Newsroom+1
OpenAI George Osborne leitet globale „Stargate“-Expansion (18.12.2025), Business Insider: https://www.businessinsider.com/openai-hires-george-osborne-uk-chancellor-global-stargate-2025-12 Business Insider
🎯 Fazit & Call-to-Action
Die neue Machtverteilung im AI-Stack entscheidet sich nicht mehr im Promptfenster, sondern:
in Rechenzentren und Gigawatt-Plänen,
in M&A-Deals für Daten- und Streaming-Plattformen,
in Regierungsprogrammen wie Stargate & Co.
Die zentrale Frage ist nicht: „Welches Modell ist das beste?“Sondern: „Wie orchestrierst du Modelle, Infrastruktur und Datenströme so, dass daraus belastbare Produkte, Services und Geschäftsmodelle entstehen?“
👉 Wenn Ihr für Euer Unternehmen genau das sortieren wollt, dann meldet Euch gerne direkt bei OAKAI.
Und noch ein kleiner Ausblick 🎁: Unser interaktiver AI Readiness Check steht kurz vor dem Launch. Damit könnt Ihr in wenigen Minuten sehen, wo Euer Unternehmen im AI-Stack wirklich steht, von Strategie über Daten bis Infrastruktur.
Mehr dazu in den kommenden Wochen hier im Newsletter.
Bis dahin: Wenn Ihr Eure AI-Strategie vom Buzzword-Level auf Infra-, Daten- und Geschäftsmodell-Realität heben wollt, melde Euch jederzeit bei OAKAI.
Euer Ralph Schwehr



Kommentare