3x3 in KI: ⚠️ Anthropic CEO schockt mit Job-Prognose, 🇪🇺 Mistral Agents greifen OpenAI an & 🎨 FLUX schlägt o4 Image
Servus KI-Enthusiasten!
Was für eine Woche für Europa!
“Wir” melden uns endlich zurück im KI-Rennen und zeigt dem Silicon Valley, wo der Hammer hängt ;-) Mistral aus Frankreich liefert eine umfassende Agent-Plattform ab, die OpenAI richtig unter Druck setzen könnte. Black Forest Labs aus Deutschland macht Bildbearbeitung kinderleicht. Und Perplexity wird zum autonomen Projektmanager.
Doch nicht alles sind gute Nachrichten: Anthropic-CEO Dario Amodei schockiert mit einer düsteren Prognose über unsere Arbeitszukunft, die uns alle betreffen könnte.
Starten wir gleich los!
Mistral Agents API: Europas ernsthafte Alternative zu OpenAI
Kurzgesagt:
Mistral AI hat eine umfassende Agents API veröffentlicht, die autonome KI-Systeme ermöglicht. Die Plattform bietet Code-Ausführung, Web-Suche, Bildgenerierung und Multi-Agent-Koordination. Als europäisches Unternehmen stellt Mistral damit eine Alternative zu amerikanischen KI-Anbietern bereit.
Detailliert:
Mistral AI aus Frankreich hat eine wichtige Erweiterung seines Angebots vorgestellt. Die neue Agents API geht über einfache Textgenerierung hinaus und verbindet Mistrals Sprachmodelle mit praktischen Funktionen für Geschäftsanwendungen. Die Plattform ergänzt die bestehende Chat Completion API um einen spezialisierten Rahmen für agentenbasierte Anwendungsfälle.
Die API umfasst vier Hauptbereiche: Code-Execution ermöglicht die Ausführung von Python-Code in einer sicheren Sandbox-Umgebung für mathematische Berechnungen, Datenvisualisierung und wissenschaftliche Berechnungen. Web-Suche liefert aktuelle Informationen aus verschiedenen Quellen und verbessert die Antwortqualität erheblich - in Tests erreichte Mistral Large mit Web-Suche 82,32% im SimpleQA-Benchmark gegenüber nur 22,08% ohne Web-Zugang.
Die Bildgenerierung nutzt Black Forest Labs' FLUX1.1 [pro] Ultra für verschiedene Anwendungen von Bildungsinhalten bis Marketing-Materialien. Document Library ermöglicht den Zugriff auf hochgeladene Dokumente und verstärkt die RAG-Funktionalität (Retrieval-Augmented Generation) der Agenten.
Besonders interessant ist die Multi-Agent-Orchestrierung. Das System ermöglicht es, mehrere spezialisierte Agenten zu erstellen und diese je nach Bedarf in Gespräche einzubeziehen. Ein Finanz-Agent kann beispielsweise Aufgaben an einen Web-Such-Agent oder Rechner-Agent delegieren, basierend auf den Anforderungen des Gesprächs.
Mistral stellt praktische Beispiele bereit: Ein GitHub-Assistent überwacht autonome Software-Entwicklungsaufgaben, ein Linear-Ticket-Assistent wandelt Anruftranskripte in Produktanforderungen und umsetzbare Issues um, und ein Finanz-Analyst orchestriert mehrere MCP-Server für Finanzmetriken und Erkenntnisse.
Die API unterstützt auch das Model Context Protocol (MCP), einen offenen Standard für die nahtlose Integration zwischen Agenten und externen Systemen. Jedes Gespräch behält seinen Kontext bei und ermöglicht kohärente Interaktionen über längere Zeiträume. Entwickler können Gespräche von jedem Punkt aus fortsetzen oder neue Gesprächspfade initiieren.
FLUX.1 Kontext: Erweiterte Bildbearbeitung durch Textbefehle
Kurzgesagt:
Black Forest Labs hat FLUX.1 Kontext veröffentlicht, eine Erweiterung ihrer Bildgenerierungsmodelle um Bearbeitungsfunktionen. Das System versteht sowohl Text- als auch Bildeingaben und ermöglicht Bildmodifikationen durch einfache Textanweisungen, wobei Charakterkonsistenz und Stil erhalten bleiben. Damit wollen sie ChatGPTs o1 Image Generation einen Strich durch die Rechnung machen.
Detailliert:
Das deutsche Startup Black Forest Labs hat seine FLUX-Modellfamilie um Bearbeitungsfähigkeiten erweitert. FLUX.1 Kontext ist eine Suite von generativen Modellen, die sowohl Bildgenerierung als auch -bearbeitung ermöglichen. Anders als herkömmliche Text-zu-Bild-Modelle verarbeitet das System sowohl Text- als auch Bildeingaben für kontextuelle Generierung.
Die Kernfähigkeiten umfassen vier Bereiche: Style Transfer ermöglicht die Umwandlung von Ölgemälden zu Bleistiftskizzen oder von modernen Postern zu surrealen Collagen - alles mit einem Prompt.
Text Editing kann Schilder, Labels und Poster in Bildern austauschen, wie etwa "replace 'joy' by 'fal'" in einem bestehenden Bild.
Object & Subject Tweaks verwandelt ein gelbes Auto in ein rotes oder verschiebt Berge in den Hintergrund.
Consistent Character Editing behält denselben Charakter oder Stil über völlig verschiedene Szenen hinweg bei. Das System funktioniert durch intuitive Anweisungen.
FLUX.1 Kontext bietet zwei Hauptmodelle: FLUX.1 Kontext [pro] für schnelle, iterative Bildbearbeitung mit Charakterkonsistenz über mehrere Bearbeitungsrunden. FLUX.1 Kontext [max] fokussiert auf maximale Performance bei Geschwindigkeit, Konsistenz und Prompt-Adherence. Nach Angaben des Unternehmens sind die Modelle bis zu 8x schneller als aktuelle führende Modelle bei gleichzeitig verbesserter Prompt-Befolgung und fotorealistischem Rendering.
Die Modelle sind über Black Forest Labs' API und verschiedene Drittanbieter-Plattformen verfügbar, darunter Leonardo AI, Replicate, Together und andere. Ein Playground ermöglicht direktes Testen ohne Registrierung bei Drittanbietern. Neue Nutzer erhalten 200 Credits, ausreichend für etwa 12 Generationen mit dem Pro-Modell. Das Unternehmen plant auch eine Open-Weight-Version namens FLUX.1 Kontext [dev], die sich derzeit in der privaten Beta-Phase für Forschung und Sicherheitstests befindet.
Perplexity Labs: Autonome Projektbearbeitung statt einfacher Antworten
Kurzgesagt:
Perplexity hat mit "Labs" eine Erweiterung vorgestellt, die über Suchfunktionen hinausgeht. Labs arbeitet autonom an kompletten Projekten und erstellt dabei Reports, Spreadsheets, Dashboards und einfache Web-Anwendungen. Die Funktion ist für Pro-Abonnenten verfügbar.
Detailliert:
Perplexity erweitert sein Angebot um eine neue Funktionsebene. Während die bisherige Plattform als "Antwortmaschine" fungierte, positioniert sich Labs als teambasierte Lösung für komplette Projektabwicklung. Labs kann verschiedene Ausgabeformate erstellen, von Reports und Spreadsheets bis hin zu Dashboards und einfachen Web-Anwendungen, basierend auf umfangreicher Recherche und Analyse.
Das System arbeitet mit erweiterten Zeitfenstern von 10 Minuten oder mehr für selbstüberwachte Arbeit. Labs nutzt verschiedene Tools wie tiefes Web-Browsing, Code-Ausführung sowie Chart- und Bildgenerierung, um Ideen in fertige Projekte umzusetzen.
Die Funktionsweise basiert auf drei Hauptkomponenten: Code-Generierung schreibt und führt Code aus für Datenstrukturierung, Formelanwendung und Chart-Erstellung.
Ein Assets-Tab organisiert alle während des Workflows erstellten Dateien, von Charts und Bildern bis hin zu CSV- und Code-Dateien.
Mini-Apps ermöglichen die Entwicklung und das Deployment einfacher interaktiver Web-Anwendungen direkt in einem "App"-Tab des Projekts.
Nun zu den Praxisbeispielen...
Der Unterschied zu Perplexitys bestehender Deep Research-Funktion liegt im Umfang: Deep Research liefert umfassende Antworten in 3-4 Minuten, während Labs längere Bearbeitungszeiten investiert und erweiterte Tools für Dateigenerierung und Anwendungserstellung nutzt. Das Unternehmen benennt Deep Research in "Research" um, um die Position zwischen Such- und Lab-Modi zu verdeutlichen.
Ausblick
Diese Woche sorgte Anthropic-CEO Dario Amodei für heftige Diskussionen mit seiner düsteren Arbeitsmarkt-Prognose. In Interviews warnte er, dass KI bis zu 50% aller Büro-Einstiegsjobs eliminieren könnte - besonders in Technologie, Finanzen, Recht und Unternehmensberatung. Die Arbeitslosigkeit könnte in den nächsten ein bis fünf Jahren auf 10-20% ansteigen.
Amodeis Lösungsvorschlag ist radikal: Eine "Token-Steuer" von 3% auf alle Umsätze, die durch KI-Modelle generiert werden. "Offensichtlich liegt das nicht in meinem wirtschaftlichen Interesse", sagte er, "aber ich denke, das wäre eine vernünftige Lösung." Diese Einnahmen könnten in staatlich finanzierte Weiterbildungsprogramme fließen. Sein paradoxes Szenario: "Krebs ist geheilt, die Wirtschaft wächst mit zehn Prozent pro Jahr - und 20 Prozent der Menschen haben keinen Job."
Das Weltwirtschaftsforum berichtet, dass 41% der Unternehmen Stellenabbau durch KI-Automatisierung planen, während gleichzeitig mehr neue Stellen entstehen sollen als wegfallen. Die Realität wird zeigen, ob Amodeis düstere Prognose oder die optimistischeren Szenarien eintreffen.
Bei mir bezahlt ihr weiterhin Steuern - der Newsletter bleibt kostenlos! ;-)
Wir lesen uns nächste Woche!
Viele Selbstständige sind – egal wie erfolgreich – rastlos. Regulierter, wiederholbarer Superpower-Rhythmus, der spürbaren Impact erzeugt – und dich entspannen lässt. | Impact-Coach | Ehemann, 2x Papa & Tennis-Amateur 🎾
3 MonateFeiere ich: "💣 Anthropic-CEO: "50% aller Bürojobs verschwinden in 5 Jahren!""
Co-Founder @ mytalents.ai | AI Education for Business | Shaping 25M EU Enterprises' Tomorrow 🌍
3 MonateDie Token-Steuer Idee... wie soll das praktisch funktionieren? Wer bestimmt denn, was KI-generiert ist? Ein Blogpost mit Grammarly-Hilfe? Code mit GitHub Copilot? Das ist ja eher ein Spektrum als ein binäres ja/nein.