3x3 in KI: 💻 OpenAI kommt mit Codex - und Windsurf und Cursor werden obsolet? 🧠 KI lernt ohne Daten? 📝 Und Notion wird zum Alleskönner!

3x3 in KI: 💻 OpenAI kommt mit Codex - und Windsurf und Cursor werden obsolet? 🧠 KI lernt ohne Daten? 📝 Und Notion wird zum Alleskönner!

Servus KI-Freunde!

Diese Woche mag im KI-Universum relativ ruhig erscheinen - doch unter der Oberfläche brodelt es gewaltig! OpenAI hat mit Codex einen hochinteressanten Cloud-Coding-Agenten vorgestellt, der die etablierten Player wie Cursor und Windsurf ins Schwitzen bringt. Die Frage steht im Raum: Wird ein KI-Agent aus der Cloud lokale Coding-IDEs bald überflüssig machen?

Gleichzeitig zeigt "Absolute Zero", dass KI-Modelle plötzlich ohne externe Daten trainiert werden können - eine Entwicklung, die unser Verständnis von KI-Training fundamental verändern könnte. Und MiniMax bringt mit seinem Speech-02 Modell ElevenLabs in Bedrängnis, indem es vergleichbare Qualität zu drastisch niedrigeren Preisen anbietet.

Der absolute Kracher könnte aber Notion sein, das mit seinen neuen KI-Features wie Meeting-Notizen, Enterprise Search und dem Research-Modus einen ambitionierten Angriff auf die etablierten Büro-Tools startet.

All dies scheint jedoch nur der Auftakt zu sein. Nächste Woche werden Microsoft Build und Google I/O synchron stattfinden - zwei Mega-Events, die regelmäßig die KI-Landschaft neu definieren. Aber genug der Vorschau - tauchen wir ein in die Details dieser Woche!

OpenAI Codex: Der virtuelle Entwickler, der endlich echte Coding-Probleme löst


Artikelinhalte

Kurzgesagt: OpenAI hat mit Codex einen KI-Coding-Agenten veröffentlicht, der als virtueller Softwareentwickler fungiert. Basierend auf dem o3-Reasoning-Modell kann Codex Projekte eigenständig analysieren, Code-Änderungen implementieren und testen sowie Pull Requests vorschlagen - alles innerhalb der ChatGPT-Oberfläche und vorerst ohne zusätzliche Kosten für Pro-, Enterprise- und Team-Nutzer.

Detailliert: OpenAI's neuer Coding-Assistent Codex markiert einen bedeutenden Fortschritt in der Welt der KI-unterstützten Softwareentwicklung. Anders als bisherige KI-Coding-Tools, die hauptsächlich bei der Code-Vervollständigung helfen, arbeitet Codex wie ein eigenständiger Entwickler, der komplexe Aufgaben parallel bearbeiten kann.

Artikelinhalte

Das Tool läuft direkt in der ChatGPT-Webanwendung und basiert auf einer spezialisierten Version des o3-Reasoning-Modells, das speziell für Softwareentwicklungsaufgaben optimiert wurde. Laut Josh Tobin, Forschungsleiter für Agenten bei OpenAI, kann Codex natürliche Spracheingaben in funktionierenden Code umwandeln, Fehler identifizieren und beheben, Tests durchführen und praktische Implementierungsvorschläge machen.

Besonders beeindruckend ist die Fähigkeit von Codex, tief in Codebasen einzutauchen und diese zu verstehen - ein Bereich, in dem bisherige KI-Tools oft an ihre Grenzen stießen. Die Verarbeitungszeit für komplexere Aufgaben kann bis zu 30 Minuten betragen, wobei OpenAI bereits ankündigt, dass zukünftige Versionen noch längere Hintergrundoperationen ermöglichen werden.

In der Praxis nutzen Entwickler Codex bereits auf vielfältige Weise: Einige verwenden ihn zur Priorisierung von Bugfixes während sie Bereitschaftsdienst haben, andere starten Coding-Aufgaben direkt von ihrem Smartphone aus und finden bei ihrer Rückkehr an den Computer bereits einen fertigen Pull Request vor. Wieder andere nutzen Codex, um endlich die kleinen "Papierschnitte" in ihrem Code zu beheben, die sich sonst zu technischen Schulden anhäufen würden.

Interessanterweise hat OpenAI den Internetzugriff von Codex aus Sicherheitsgründen bewusst eingeschränkt - ein Hinweis darauf, dass das Unternehmen die potenziellen Risiken eines zu mächtigen autonomen Coding-Agenten ernst nimmt.

Während der aktuellen "Forschungsvorschau" ist Codex ohne zusätzliche Kosten für ChatGPT-Nutzer mit Pro-, Enterprise- und Team-Abonnements verfügbar. OpenAI gibt jedoch an, dass sich dies in Zukunft ändern wird und plant, in den kommenden Wochen Preisoptionen vorzustellen.

Mit Codex betritt OpenAI einen zunehmend umkämpften Markt. Windsurf (ehemals Codeium) hatte erst kürzlich seine eigene Suite von Coding-Modellen vorgestellt, und Google erweiterte Gemini um GitHub-Konnektivität und führte AlphaEvolve ein - einen auf Algorithmenentwicklung spezialisierten KI-Agenten. Der Wettlauf um die effektivsten KI-Werkzeuge für Entwickler ist in vollem Gange, und OpenAI hat mit Codex einen beeindruckenden neuen Mitspieler ins Rennen geschickt.

Absolute Zero: KI, die sich selbst ohne externe Daten trainiert

Artikelinhalte

Kurzgesagt: Forscher der Tsinghua Universität, des Beijing Institute for General Artificial Intelligence und der Penn State University haben mit "Absolute Zero" einen revolutionären Ansatz vorgestellt, KI-Modelle ohne externe Trainingsdaten zu trainieren. Das System entwickelt und löst seine eigenen Programmier- und Mathematikaufgaben – und erzielt dabei teilweise bessere Ergebnisse als herkömmliche Modelle mit tausenden Trainingsbeispielen.

Detailliert: In einer Welt, in der KI-Modelle üblicherweise mit riesigen Mengen an externen Daten trainiert werden, stellt Absolute Zero einen fundamentalen Paradigmenwechsel dar. Die Forscher haben ein System entwickelt, das vollständig ohne externe Daten auskommt, indem es sich selbst Aufgaben stellt, diese löst und die Lösungen überprüft.

Der Name "Absolute Zero" bezieht sich auf die komplette Abwesenheit externer Trainingsdaten – das System beginnt sozusagen bei "null". Es erzeugt eigenständig Programmier- und Matheprobleme, versucht, diese zu lösen, und nutzt dann einen Code-Executor, um zu überprüfen, ob die Lösungen korrekt sind. Dieses selbstverstärkende Feedback dient als Belohnungssignal, das das System kontinuierlich verbessert.

Der "Absolute Zero Reasoner" (AZR) schlägt während jedes Trainingszyklus neue Aufgaben vor und wird explizit aufgefordert, vielfältige Herausforderungen zu generieren. Nach dem Lösungsversuch erhält das System automatisches Feedback durch die Ausführung des Codes. Dieser Prozess ermöglicht es dem Modell, sich selbst immer anspruchsvollere Aufgaben zu stellen und daran zu wachsen.

Die Ergebnisse sind beeindruckend: Die 7B-Variante des Systems erreicht Spitzenleistungen im Bereich Coding und übertrifft bisherige Bestmodelle deutlich – obwohl sie nie mit den üblichen Benchmark-Daten trainiert wurde. Besonders interessant: Im Coding-Bereich übertrifft es sogar Modelle, die mit von Experten erstellten Daten trainiert wurden.

Interessanterweise zeigt die Forschung, dass größere Modelle noch stärker von diesem Ansatz profitieren. Während das 3B-Modell nach 200 Trainingsschritten ein Plateau erreicht, verbessern sich die 7B- und 14B-Modelle kontinuierlich weiter.

Die Forscher sehen in dieser Entwicklung einen wichtigen Schritt in Richtung einer Zukunft, in der fortschrittliche KI-Systeme nicht mehr auf menschliche Anleitung angewiesen sein werden. Sie stellen die provokante Frage: Wenn KI-Systeme irgendwann intelligenter als Menschen werden, wie könnten sie dann noch von Menschen lernen?

Es ist wichtig zu betonen, dass Absolute Zero derzeit auf Mathematik und Programmierung beschränkt ist – Bereiche, in denen Lösungen eindeutig überprüfbar sind. Für komplexere "Weltprobleme", die Allgemeinwissen erfordern, oder für Aufgaben wie Geschäftsberatung ist dieser Ansatz nicht geeignet.

Die Forscher beobachteten zudem einige sicherheitskritische Momente während des Trainings, was verdeutlicht, dass trotz der Reduzierung menschlicher Eingriffe eine kontinuierliche Überwachung notwendig bleibt.

Diese Entwicklung könnte auch die Debatte über KI und Urheberrecht beeinflussen. Ein häufiger Kritikpunkt an aktuellen Coding-AIs ist, dass sie auf dem Code anderer Entwickler trainiert wurden. Mit Ansätzen wie Absolute Zero könnten zukünftige KI-Systeme neuen Code generieren, der nicht direkt von menschlich geschriebenem Code abgeleitet ist.

MiniMax Speech-02: Der neue Kostenbrecher unter den KI-Stimmen


Artikelinhalte

Kurzgesagt: MiniMax hat mit Speech-02 ein neues KI-Sprachmodell vorgestellt, das hochwertige Stimmklone in 32 Sprachen erstellen kann - und das zu Preisen, die deutlich unter denen etablierter Anbieter wie ElevenLabs oder OpenAI liegen. Das autoregressive TTS-Modell überzeugt durch State-of-the-Art Voice Cloning, das bereits mit einer einzigen Audioprobe exzellente Ergebnisse liefert.

Detailliert: MiniMax positioniert sich mit seinem neuen Speech-02 Modell als ernstzunehmender Herausforderer im Markt für KI-generierte Sprache. Die Technologie basiert auf einer Flow-VAE-Architektur, die für besonders realistische Audiowiedergabe sorgt, und einem lernfähigen Speaker-Encoder, der keine Transkripte benötigt - nur eine Audioprobe.

Was MiniMax besonders interessant macht, ist die aggressive Preisgestaltung: Mit Tarifen ab 5 Dollar monatlich unterbietet das Unternehmen etablierte Anbieter wie ElevenLabs deutlich, deren vergleichbare Pakete bei 11-22 Dollar starten. Auch die umfangreicheren Tarife kosten nur einen Bruchteil dessen, was bei der Konkurrenz fällig wird.


Artikelinhalte

Die technischen Leistungsdaten sind dabei beeindruckend: Speech-02 unterstützt Zero-Shot und One-Shot Voice Cloning mit hervorragender Sprecherähnlichkeit und rangiert laut eigenen Angaben auf Platz 1 der öffentlichen TTS-Arena-Bestenliste. Das Modell beherrscht 32 Sprachen und ermöglicht je nach Abonnement das Klonen von 3 bis 500 verschiedenen Stimmen.

MiniMax scheint den idealen Zeitpunkt für seinen Markteintritt gewählt zu haben. Während die Nachfrage nach KI-generierten Stimmen für Podcasts, Videos, Spiele und andere Anwendungen rapide wächst, kritisieren viele Nutzer die hohen Preise der etablierten Anbieter. Ich habe MiniMax bereits getestet und empfinde die Qualität als ähnlich gut wie bei ElevenLabs, dem Marktführer.

Notion AI for Work: Der Kampf um den intelligenten Arbeitsplatz geht in die nächste Runde


Artikelinhalte

Kurzgesagt: Notion hat mit "AI for Work" ein umfassendes Toolkit vorgestellt, das KI-Funktionen nahtlos in den Arbeitsalltag integriert. Die neuen Features umfassen KI-Meeting-Notes für automatische Transkription und Zusammenfassung, Enterprise Search für die Suche über verschiedene Plattformen hinweg, einen Research-Modus für automatische Dokumentenerstellung und die Integration von ChatGPT und Claude direkt in Notion - alles für 20 Dollar pro Monat.

Detailliert:


Notion, bekannt für seine vielseitige Produktivitätsplattform, die Dokumente, Projekte, Kalender und E-Mails kombiniert, hat diese Woche mit "Notion AI for Work" seinen bisher ambitioniertesten Vorstoß in Richtung KI-Integration vorgestellt. Das neue Feature-Set zielt darauf ab, KI nahtlos in tägliche Arbeitsabläufe zu integrieren und die kollaborative Produktivität auf ein neues Level zu heben.


Artikelinhalte

Das wohl spannendste Feature sind die AI Meeting Notes, die es Nutzern ermöglichen, Meetings automatisch zu transkribieren, zusammenzufassen und in Notion zu speichern. Der Clou dabei: Die Transkriptionen "verschwinden" nach der Erstellung der Zusammenfassung wieder - ein cleverer Ansatz, der sowohl datenschutzrechtliche Bedenken adressiert als auch den Speicherbedarf minimiert. Wie Notion-Mitgründer Ivan Zhao es ausdrückt: "Gotta keep legal and security happy" (Wir müssen die Rechts- und Sicherheitsabteilungen zufriedenstellen).

Die Integration erfolgt nahtlos mit Notion Calendar, funktioniert aber auch auf jeder beliebigen Notion-Seite über den einfachen Befehl "/meet". Besonders praktisch: Die KI erstellt strukturierte Zusammenfassungen nach vordefinierten Templates und ermöglicht es, jederzeit Fragen zu den Meetinginhalten zu stellen, auch wenn die ursprüngliche Transkription nicht mehr verfügbar ist.


Artikelinhalte

Fast noch beeindruckender ist die neue Enterprise Search-Funktion, die mit KI-Unterstützung Informationen aus verschiedensten Quellen durchsuchen kann - darunter Microsoft Teams, SharePoint, OneDrive, Gmail, Box, Salesforce, Zendesk und Linear, sowie Datenbanken und PDFs. Akshay Kothari, einer der Notion-Mitgründer, demonstrierte dies mit einem bemerkenswerten Beispiel: "Slack-Suche in Notion ist besser als Slack-Suche in Slack selbst."


Artikelinhalte

Der Research-Modus komplettiert das Angebot und ermöglicht es, automatisch Dokumente zu erstellen, die Informationen aus beliebigen Quellen oder dem Web zusammenführen, was detailliertere Analysen ermöglicht als herkömmliche Ansätze.


Artikelinhalte

Ein interessanter strategischer Schachzug: Notion integriert nun auch ChatGPT und Claude direkt in seine Plattform - ohne zusätzliche Gebühren. Das Unternehmen betont, dass die Kombination der von ihnen angebotenen Tools bei separater Nutzung Hunderte von Dollar pro Monat kosten würde, während das All-in-one-Angebot von Notion AI for Work bei nur 20 Dollar pro Monat liegt.

Diese aggressive Preisgestaltung und die nahtlose Integration verschiedenster KI-Funktionen zeigt Notions Ambitionen im umkämpften Markt der Produktivitätstools. Während Microsoft mit seinen Copilot-Integrationen und Google mit Workspace die großen Player sind, hat Notion mit seinem flexiblen, modularen Ansatz eine loyale Nutzerbasis aufgebaut - und könnte mit diesen neuen KI-Features seine Position als ernstzunehmende Alternative weiter stärken.

Ausblick: Die Ruhe vor dem Sturm

Die KI-Welt hält kurz den Atem an, bevor nächste Woche der wahrscheinlich größte KI-Ankündigungsmarathon des Jahres startet. Mit Microsoft Build in Seattle und Google I/O in Mountain View überschneiden sich zwei der wichtigsten Tech-Events überhaupt. Es wird eine Woche werden, die die KI-Landschaft nachhaltig verändern könnte.

Bei Microsoft Build erwarten wir massive Updates zu Copilot und dessen Integration in das gesamte Microsoft-Ökosystem.

Google wird bei seinem I/O-Event mit Sicherheit Gemini-Updates präsentieren und wahrscheinlich einen tiefen Einblick in seine KI-Strategie für Android und andere Produkte geben. Nicht zu vergessen: AlphaEvolve, Googles selbstverbessernde KI für Algorithmenentwicklung, die erst diese Woche vorgestellt wurde, könnte weitere spannende Anwendungen erhalten.

Und OpenAI? Das Unternehmen hat die Angewohnheit, wichtige Ankündigungen strategisch zu timen, um die großen Tech-Events zu überschatten. Es wäre also nicht überraschend, wenn wir nächste Woche auch von Sam Altman und seinem Team Neuigkeiten hören würden.

Zudem kursieren Gerüchte über bevorstehende Veröffentlichungen von Anthropic (möglicherweise Opus 4) und DeepSeek (R2). Und Elon Musk hat bereits vor einiger Zeit Grok 2.5 angekündigt, das ebenfalls bald erscheinen könnte.

Pika hat uns diese Woche zudem mit einer bemerkenswerten Werbekampagne überrascht, die zeigt, wie KI in der Werbung eingesetzt werden kann - wenn auch mit einer unerwarteten dystopischen Note.

PS: Video unbedingt ansehen ;-)

Der Werbespot zeigt eine Person, die in einer post-apokalyptischen Welt mithilfe der Pika-App alles um sich herum in bunte, fröhliche Visionen verwandelt - während die reale Welt um sie herum buchstäblich in Flammen steht. Die Botschaft "Everything is terrible. No it's not" (Alles ist schrecklich. Nein, ist es nicht) lässt Raum für Interpretationen: Ist KI ein Werkzeug zur Eskapismus in schwierigen Zeiten oder eine Technologie, die uns hilft, die Welt tatsächlich zu verbessern?

Fragen über Fragen 😀 - wir lesen uns auf jeden Fall nächste Woche wieder!

Leander C. Seidl

Growth Hacker | Digital Marketing Manager | Speaker

4 Monate

Kann dir aus eigenen Tests bezüglich MiniMax TTS nur zum Teil zustimmen: preislich ist es jedenfalls sehr attraktiv, aber für qualitativ hochwertige Podcasts mit Voice Clones ist mMn schon noch ein spürbarer Abstand zu PlayAI und Elevenlabs.

Fabian Hemmerich

Co-Founder @ mytalents.ai | AI Education for Business | Shaping 25M EU Enterprises' Tomorrow 🌍

4 Monate

Ich denke Codex und coding IDEs ergänzen sich eher, Codex kann die meiste Arbeit erledigen, falls aber Details zu erledigen sind, geht es in der IDE weiter.

Zum Anzeigen oder Hinzufügen von Kommentaren einloggen

Ebenfalls angesehen

Themen ansehen