3x3 in KI: 🔥 Sommerloch vorbei! ChatGPT Agent arbeitet für euch, Grok 4 ist da, GPT-5 steht vor der Tür & die größten Tech-Dramas des Jahres

3x3 in KI: 🔥 Sommerloch vorbei! ChatGPT Agent arbeitet für euch, Grok 4 ist da, GPT-5 steht vor der Tür & die größten Tech-Dramas des Jahres

Servus KI-Freunde!

Tja, so kann man sich täuschen! Vor drei Wochen schrieb ich noch über das "Sommerloch" in der KI-Welt – und dann passiert DAS hier: OpenAI stellt ChatGPT Agent vor, GPT-5 steht unmittelbar vor der Tür, Grok 4 schockt die Benchmark-Welt und gleich drei Silicon Valley Dramas erschüttern die Tech-Welt.

Ehrlich gesagt war das keine ruhige Zeit 😅 Und während viele von euch am Strand liegen, explodieren die KI-News wieder förmlich. Zeit für ein großes Comeback mit den wichtigsten News der letzten drei Wochen!

ChatGPT Agent: Der KI-Assistent übernimmt jetzt euer Leben


Artikelinhalte

Kurzgesagt:

Am 17. Juli hat OpenAI ChatGPT Agent vorgestellt – einen autonomen KI-Assistenten, der komplexe Aufgaben eigenständig über einen virtuellen Computer erledigt. Von Hochzeitsplanung bis Business-Präsentationen kann der Agent jetzt echte Arbeit übernehmen, während ihr zuschauen könnt.

Detailliert:

Artikelinhalte

Das ist der bisher größte Schritt von OpenAI weg vom reinen Chatbot hin zu einem echten digitalen Assistenten. ChatGPT Agent vereint drei vorherige Durchbrüche: Operators Browser-Fähigkeiten, Deep Research's Synthese-Power und ChatGPTs Konversationsstärke. Der Agent arbeitet mit einem eigenen virtuellen Computer und ihr könnt dabei zusehen, wie er Websites durchklickt, Informationen sammelt und Entscheidungen trifft.

In der Live-Demo zeigte OpenAI, wie der Agent eine komplette Hochzeitsvorbereitung übernahm – von der Geschenkauswahl bis zur Hotelbuchung. Ihr könnt ihm Anfragen stellen wie "Schaue in meinen Kalender und brief mich über kommende Kundentermine basierend auf aktuellen News" oder "Plane und kaufe Zutaten für ein japanisches Frühstück für vier Personen". Er kann Formulare ausfüllen, Spreadsheets bearbeiten, Präsentationen erstellen und sogar in eure Apps wie Gmail oder Google Drive eingreifen.

Das Beeindruckende: Der Agent fragt vor wichtigen Schritten nach – etwa bevor er eine Bestellung abschickt oder eine E-Mail versendet. Ihr könnt ihn jederzeit unterbrechen, korrigieren oder stoppen. Sam Altman warnte jedoch vor Sicherheitsrisiken und empfahl, bei sensiblen Daten vorsichtig zu sein.


Artikelinhalte

Die Benchmark-Ergebnisse sind beeindruckend: Bei "Humanity's Last Exam" erreichte ChatGPT Agent 41,6 Prozent – ein neuer Rekord bei Expert-Level-Fragen. Bei FrontierMath, der schwierigsten bekannten Mathematik-Benchmark, schaffte der Agent 27,4 Prozent und übertraf damit o3 und o4-mini deutlich. Besonders stark zeigt sich der Agent bei realitätsnahen Aufgaben: Bei SpreadsheetBench erreichte er 45,5 Prozent verglichen mit nur 20 Prozent von Microsofts Copilot in Excel. Bei datenwissenschaftlichen Aufgaben lag er mit 89,9 Prozent sogar über menschlicher Leistung.

Verfügbar ist ChatGPT Agent seit 24. Juli für Plus-Nutzer (20 Dollar/Monat) und bereits seit dem Launch für Pro- und Team-Nutzer. Das Feature markiert den Übergang von "ask and answer" zu echten autonomen Helfern und zeigt, wohin die KI-Reise geht.

GPT-5 im August: Das große Finale der Modell-Verwirrung


Artikelinhalte

Kurzgesagt:

Nach monatelangen Spekulationen verdichten sich die Hinweise massiv: GPT-5 kommt Anfang August 2025. Das neue Modell soll erstmals alle OpenAI-Fähigkeiten in einem System vereinen und die verwirrende Modell-Auswahl beenden. Sogar kostenlose Nutzer sollen Zugang bekommen.

Detailliert:

Die Beweise stapeln sich: Am 13. Juli tauchten Code-Referenzen zu "gpt-5-reasoning-alpha-2025-07-13" auf.


Die Beweise stapeln sich: Am 13. Juli tauchten Code-Referenzen zu "gpt-5-reasoning-alpha-2025-07-13" auf.

Artikelinhalte

Sam Altman bestätigte auf Theo Vons Podcast persönlich GPT-5s Fähigkeiten und demonstrierte, wie das Modell eine mathematische Aufgabe löste, die er selbst nicht beantworten konnte – was ihm ein "weird feeling" verschaffte.

Das spannende an GPT-5: Es beendet die Modell-Verwirrung. Statt zwischen o3 (Reasoning), GPT-4.1 (Coding) oder verschiedenen spezialisierten Versionen zu wählen, entscheidet GPT-5 automatisch, welche Fähigkeiten für welche Anfrage benötigt werden. Sam Altman nannte es "magic unified intelligence" – ein System, das Reasoning, Multimodalität und alle Tools nahtlos kombiniert.

Na dann, das wird wohl ein heißer August werden für uns ;-)

Grok 4: Elon schockt mit Benchmark-Dominanz

Kurzgesagt:

XAI hat Grok 4 vorgestellt und schockt die AI-Welt mit Benchmark-Ergebnissen, die fast alle Konkurrenten übertrumpfen. Das neue "intelligenteste Modell der Welt" nutzt Reinforcement Learning auf 200.000 GPUs und erreicht als erstes Modell 50 Prozent bei "Humanity's Last Exam". Doch trotz der Rekorde gibt es praktische Einschränkungen.

Detailliert:

Grok 4 ist das Ergebnis einer beispiellosen Reinforcement Learning-Offensive: XAI trainierte das Modell auf dem 200.000-GPU-Cluster "Colossus" mit 6-fach verbesserter Compute-Effizienz und einer massiven Erweiterung der verifizierbaren Trainingsdaten über Mathematik und Coding hinaus auf viele weitere Domänen.


Artikelinhalte

Die Benchmark-Ergebnisse sind spektakulär: Bei "Humanity's Last Exam" erreichte Grok 4 Heavy als erstes Modell überhaupt 50,7 Prozent und setzt damit einen neuen Meilenstein bei Expert-Level-Fragen. Bei ARC-AGI V2 dominiert Grok 4 mit 15,9 Prozent – fast das Doppelte von Claude Opus 4 (8,6 Prozent). Bei Olympiad-Mathematik (USAMO 2025) führt Grok 4 Heavy mit 61,9 Prozent, während die Konkurrenz bei unter 50 Prozent liegt.


Artikelinhalte

Besonders beeindruckend: Grok 4 Heavy nutzt parallel arbeitende Agenten, die gleichzeitig verschiedene Hypothesen verfolgen und sich abstimmen. Diese "test-time compute"-Architektur ermöglicht deutlich zuverlässigere Ergebnisse bei komplexen Aufgaben.


Artikelinhalte

Das spannende Feature: Native Tool-Integration. Grok 4 kann eigenständig entscheiden, wann es Code-Interpreter, Web-Browsing oder X-Search nutzt. Bei schwierigen Research-Fragen wählt es automatisch eigene Suchstrategien und kann sogar Medieninhalte analysieren.

Doch es gibt Haken: Trotz der Benchmark-Dominanz bleibt Grok 4 bei praktischen Alltagsaufgaben hinter ChatGPT Agent zurück. Der Tool-Zugang ist noch begrenzt, und Real-Time-Informationen funktionieren primär über X und ausgewählte Webquellen. Für 30 Dollar/Monat (Super Grok Plan) bekommt man zwar Gold-Medal-Performance bei Mathe-Olympiaden, aber weniger praktische Alltagshilfe als bei der Konkurrenz.

Perplexity Comet: Der etwas andere Browser


Artikelinhalte

Kurzgesagt:

Perplexity hat mit Comet einen AI-nativen Browser gelauncht, der fundamentals anders funktioniert. Statt selbst zu googeln, chattet ihr mit einem Sidebar-Assistenten, der für euch surft, preisvergleicht und sogar Tweets postet. Aktuell nur für 200-Dollar-Max-Abonnenten verfügbar.

Detailliert:

Comet ist ein Chrome-Fork mit integriertem Perplexity-Assistenten, der die Art des Browsens komplett verändert. Der Assistent kann euren Bildschirm sehen, automatisch scrollen und Aufgaben übernehmen, die ihr normalerweise manuell macht. In Tests konnte er YouTube-Thumbnails analysieren, Preisvergleiche durchführen und sogar automatisch Tweets posten.

Das Geniale: Ihr müsst nicht mehr zwischen Apps springen. Der Assistent kann eure E-Mails checken ("Check my email for anything urgent"), Kalender durchsuchen und komplexe Research-Aufgaben übernehmen. Er zeigt euch transparent, was er gerade macht, und ihr könnt jederzeit eingreifen.

Artikelinhalte

Comet ist derzeit nur für Perplexity Max-Abonnenten verfügbar, die 200 Dollar pro Monat zahlen. Ein kleinerer Kreis von Waitlist-Nutzern hat ebenfalls Zugang erhalten. Perplexity verspricht, dass eine kostenlose Version "immer verfügbar" sein wird, nennt aber keinen konkreten Zeitplan für den breiteren Rollout.

Die Browser-Revolution zeigt sich auch daran, dass OpenAI angeblich "in den kommenden Wochen" einen eigenen AI-Browser launchen will, um direkt mit Chrome und jetzt Comet zu konkurrieren. Das Ziel: Nutzer sollen weniger selbst browsen und mehr delegieren.

Comet ist ein Vorgeschmack darauf, wie wir in Zukunft das Internet nutzen werden – weniger Klicken, mehr Kommunizieren mit intelligenten Assistenten, die für uns die Drecksarbeit erledigen.

KI Drama #1: Das Windsurf-Chaos – Ein Silicon Valley Thriller


Artikelinhalte

Kurzgesagt:

Das AI-Coding-Startup Windsurf war das Zentrum des größten Tech-Dramas der letzten Wochen. OpenAI wollte es für 3 Milliarden kaufen, Google schnappte sich den CEO für 2,4 Milliarden, und am Ende rettete Cognition die Überreste. Ein wilder Ritt durch Silicon Valleys Abgründe.

Detailliert:

Es begann wie ein normaler Tech-Deal: OpenAI verhandelte monatelang über eine 3-Milliarden-Dollar-Übernahme von Windsurf, dem beliebten AI-Coding-Tool. Doch dann kam Microsoft ins Spiel. Als OpenAI-Partner hätte Microsoft automatisch Zugang zu Windsurfs IP bekommen – das wollte OpenAI verhindern. Der Deal platzte am Freitag, 12. Juli.

Innerhalb von Stunden schlug Google zu: 2,4 Milliarden Dollar für CEO Varun Mohan, Co-Founder Douglas Chen und die Top-Forscher. Nicht als Übernahme, sondern als "Reverse Acqui-Hire" – Google holte sich die Köpfe und lizenzierte die Technologie, umging aber Kartellprobleme.

Das Drama: 250 Windsurf-Mitarbeiter blieben zurück. "Probably the worst day of 250 people's lives", beschrieb Jeff Wang die Freitags-Vollversammlung, wo er die Katastrophe verkünden musste. Die Stimmung war "very bleak", einige weinten, die Q&A war "understandably hostile".

Artikelinhalte

Doch das Wochenende brachte die Wende: Cognition meldete sich und kaufte über ein furioses 72-Stunden-Verhandlungs-Marathon die kompletten Überreste – IP, Produkt, Marke und alle verbliebenen Mitarbeiter. Montag 9:30 Uhr war der Deal unterschrieben. "Probably the best day" für dieselben 250 Menschen.

Cognition bekam ein fertiges Produkt mit 82 Millionen Dollar ARR und 350+ Enterprise-Kunden. Windsurf-Mitarbeiter bekommen 100 Prozent Equity-Beschleunigung und finanzielle Beteiligung. Alle gewinnen – außer OpenAI.

KI Drama #2: Meta's Abwerbungs-Offensive erreicht neue Dimensionen

Kurzgesagt: Meta setzt seine aggressive Talent-Offensive fort und holt sich jetzt Apple's Top-AI-Executive Ruming Pang für "tens of millions per year". Gleichzeitig schlägt OpenAI zurück und poacht ihrerseits von Tesla, XAI und Meta. Der AI-Talent-War erreicht neue Dimensionen.

Detailliert: Mark Zuckerbergs Super-Intelligence-Team wächst weiter: Nach dem Scale-CEO, dem Ex-GitHub-Chef und diversen OpenAI-Stars holte sich Meta jetzt Ruming Pang, Apples Distinguished Engineer und Manager des Foundation Models Teams. Das Paket: "Tens of millions of dollars per year" – selbst für Silicon Valley-Verhältnisse absurd.

Hier ist die gesamte Liste (von Deedy auf Twitter):

Artikelinhalte

Man sieht hier sehr viele Abwerbungen von OpenAI und Google.

Doch OpenAI schlägt zurück: David Luan (Ex-Tesla VP Software Engineering), Uday (Ex-XAI Head of Infrastructure), Mike Dalton (XAI Infrastructure Engineer) und Angela Fan (Meta AI Researcher) wechselten zu OpenAI. Es ist ein echter Krieg um die besten Köpfe.

Das wirft interessante Fragen auf: Wenn diese Unternehmen wirklich kurz vor AGI stehen und weltverändernden Durchbrüchen, warum verlassen dann Top-Leute kurz vor dem Ziel ihre Teams? Das könnte ein Indikator sein, dass AGI doch weiter entfernt ist, als die Marketing-Maschinerie suggeriert.

Meta bietet mittlerweile 100-Millionen-Dollar-Signing-Boni, OpenAI kontert mit Equity-Paketen und Stock-Options. Die Spirale dreht sich immer weiter nach oben – und zeigt, wie verzweifelt alle nach den besten Köpfen suchen.

Besonders brisant: Viele der abgeworbenen Talente unterliegen „eigentlich" Wettbewerbsverboten, die jedoch in der aktuellen Marktlage kaum durchsetzbar sind. Die Rechtsabteilungen arbeiten dennoch auf Hochtouren.

KI Drama #3: Microsoft vs OpenAI – Die Partnerschaft bröckelt

Kurzgesagt: Die milliardenschwere Partnerschaft zwischen Microsoft und OpenAI zeigt erste Risse. Der geplatzte Windsurf-Deal offenbarte tiefe Meinungsverschiedenheiten über IP-Rechte und strategische Kontrolle. Gleichzeitig demonstriert Microsoft mit GitHub Spark seine Unabhängigkeit – und nutzt dabei Claude, GPT-4o und o1 statt nur OpenAI-Technologie.

Detailliert: Das Windsurf-Drama war nur die Spitze des Eisbergs. Microsoft hatte als OpenAI-Partner automatisch Anspruch auf alle erworbenen Technologien – ein Automatismus, der OpenAI zunehmend stört. Sam Altman will strategische Autonomie, Satya Nadella will ROI für die 13 Milliarden Dollar Investment.


Artikelinhalte

Besonders pikant: Mit GitHub Spark hat Microsoft ein KI-Tool gelauncht, das bewusst nicht nur auf OpenAI setzt. Spark nutzt wahlweise Claude Sonnet 3.5, GPT-4o, o1-preview oder o1-mini, um "Micro Apps" aus natürlicher Sprache zu generieren. Nutzer können zwischen den Modellen wechseln und in der History sehen, welches Modell welche Revision erstellt hat.

Die Spannungen zeigen sich auch anderswo: OpenAI entwickelt eigene Cloud-Infrastruktur, um weniger von Azure abhängig zu sein. Microsoft integriert OpenAI-Features tiefer in eigene Produkte, was OpenAIs Direktgeschäft kannibalisiert. Beide Seiten flirten mit Konkurrenten – OpenAI mit Google Cloud, Microsoft mit Anthropic.

Die nächste große Bewährungsprobe kommt mit GPT-5: Bekommt Microsoft automatisch Zugang zu allen Features?

Ausblick: Der August wird heiß (auch wenn es die Temperaturen nicht zeigen)

Die Sommerpause ist definitiv vorbei. Bis September wird sich viel bewegen, und ich werde wieder regelmäßig für euch schreiben - vielleicht nicht jede Woche, aber sicher nicht den ganzen Sommer Funkstille.

Euch noch einen angenehmen Sommer und schönen Urlaub, falls ihr noch fährt und bis bald!

Benedikt Backhaus

KI‑Dozent & Keynote Speaker | Praxisnahe KI‑Strategien & Schulungen für Mittelstand & Konzerne | 700+ Mitarbeitende geschult | 35+ Videokurse | 20+ Keynotes | ChatGPT‑Workshops & 2‑Tage‑KI-Strategie‑Sprints

1 Monat

Am spannendsten fand ich die Aussage von Sam Altman zu "therapeutischen" oder unterstützenden Use Cases mit ChatGPT, dass diese natürlich nicht dem Arzt-Patienten-Privileg unterliegen. Das scheint vielen Menschen nicht bewusst zu sein oder sie haben einen solchen Leidensdruck, dass sie es ignorieren.

Fabian Hemmerich

Co-Founder @ mytalents.ai | AI Education for Business | Shaping 25M EU Enterprises' Tomorrow 🌍

1 Monat

.

  • Kein Alt-Text für dieses Bild vorhanden

Zum Anzeigen oder Hinzufügen von Kommentaren einloggen

Ebenfalls angesehen

Themen ansehen