Von big zu good data: Warum Andrew Ng eine neue Ära der KI ausruft
Andrew Ng zählt als wichtigster Vordenker der KI-Ära. Machine Learning und Big Data waren Trends, die der KI-Vordenker mit seiner Arbeit bei Google und Baidu direkt mitgestaltet hat. Für die nächste Dekade prognostiziert der global vernetzte Wissenschaftler nun einen Paradigmenwechsel: weg von bloß vielen und hin zu besonders guten Daten. Das hängt vor allem mit der Nutzbarmachung von Daten in komplexen B2B-Umfeldern zusammen. Denn die Frage, wie Unternehmen KI nutzen können, wurde nach Ng bis heute nicht zufriedenstellend beantwortet:
In the last decade, the biggest shift in AI was a shift to deep learning. I think it’s quite possible that in this decade the biggest shift will be to data-centric AI. With the maturity of today’s neural network architectures, I think for a lot of the practical applications the bottleneck will be whether we can efficiently get the data we need to develop systems that work well. The data-centric AI movement has tremendous energy and momentum across the whole community. I hope more researchers and developers will jump in and work on it. —Andrew Ng
Konkret prognostiziert Ng nun eine Phase von “good data”, kleine hochwertige Datensätze, die in domain-spezifischen Setups aufbereitet und für Unternehmen zugänglich gemacht werden. Das mag überraschend klingen für jemanden, der lange Zeit die Meinung vertrat, dass möglichst viele Daten nötig seien, um eine KI zu trainieren. Dieses Narrativ hat, rückblickend betrachtet, ja viel dazu beigetragen, dass KI als kompliziert, abstrakt, nicht händelbar gilt. Technologisch sind wir theoretisch an dem Punkt, riesige Datenmengen mit Machine-Learning-Modellen in einer sinnvollen Zeit zu bearbeiten, aber praktisch lässt die Datenqualität der vorhandenen Datenseen oft sehr zu wünschen übrig - das Ergebnis: die Menschen sind enttäuscht von KI, die Prozessintegration kommt selten über Pilotprojekte und Prototypen hinaus, und der Einsatzbereich von KI, vor allem im B2B-Bereich, hinkt seinen Möglichkeiten hinterher. Gleichzeitig benötigen viele Branchen von Automobil bis Gesundheit, von Produktion bis Bauwesen dringend Unterstützung in einer komplexen wirtschaftlichen Umgebung.
Datenoptimierung ersetzt Parametertuning
Ng, dessen Wort in den KI-Schmieden von San Francisco bis Beijing Gewicht hat, ruft nach der Ära des “deep learning” nun die Ära der “data-centric AI” aus. (Warum KI nichts ist, wovor wir uns fürchten sollen, habe ich im Übrigen erst kürzlich in diesem Gespräch mit Anja Mutschler geklärt.). Nach dem erfahrenen KI-Experten Ng lohnt es sich für Industrieanwender mittlerweile mehr, in die Qualität von Daten zu investieren als weiter zu versuchen, aus den breit verfügbaren Machine-Learning-Modellen noch den letzten Promille an Genauigkeit auszuquetschen:
The data-centric approach advocates that AI has reached a point where data is more important than models. If AI is seen as a system with moving parts, it makes more sense to keep the models relatively fixed, while focusing on quality data to fine-tune the models, rather than continuing to push for marginal improvements in the models. —Andrew Ng
Der Artikel führt Ngs These aus, wonach im Big-Data-Ansatz zu wenig Wert darauf gelegt worden sei, die Domänenexpertise der Industrieanwender in KI Lösungen zu integrieren:
The process that Ng described is clearly a departure from the “let’s throw more data at the problem” approach often taken by AI today, pointing more towards approaches based on curation, metadata, and semantic reconciliation. In other words, there is a move towards the type of knowledge-based, symbolic AI that preceded machine learning in the AI pendulum motion.
Ng verweist auch auf den Wert multimodaler Daten, also Daten aus verschiedenen Quellen. Beim data-centric KI-Ansatz geht es also, wenig überraschend, um Qualität statt Quantität. Ein kleiner Datensatz, der aber qualitativ hochwertig ist, kann genutzt werden, um KIs zu trainieren. Diese KI ist viel besser in der Lage, Vorhersagen und Aussagen treffen können als jene, die auf generischen Big Data aufsetzen. Gute Daten sind somit der Grundpfeiler einer nachhaltigen AI Strategie.
Datenqualität durch Domänenexpertise
Wie entsteht diese hohe Datenqualität? Einzig und allein in der Zusammenarbeit der Domänenexperten und Computer Scientists. Nur so lassen sich spezifische KI-Branchenlösungen entwickeln. Im B2B-Bereich weiter auf den Durchbruch von Big-Data-Lösungen zu warten, sei nicht der richtige Weg, so Ng. Und auch gar nicht notwendig, denn:
In many industries where giant data sets simply don’t exist, I think the focus has to shift from big data to good data. Having 50 thoughtfully engineered examples can be sufficient to explain to the neural network what you want it to learn. —Andrew Ng
Genau diese Strategie spiegelt wieder, wie Archilyse seit fünf Jahren als Deep-Tech-Start-Up arbeitet. Ein einzigartiges Team, bestehend aus Machine-Learning-Spezialisten, Computer Scientists und Domänen Experten hat in Kooperation mit führenden Industrieplayern einen Datenprozess entwickelt, der sich genau diese “Good Data”-Strategie zu eigen macht. Dadurch konnte die weltweit führende AI im Immobiliensektor entwickelt werden, die inzwischen Projektentwicklern und Asset-Managern während den herausforderndsten Phasen im Lebenszyklus der Immobilien zur Seite steht. Wir helfen einer stetig wachsenden Anzahl an Teams dabei, nicht nur bessere Entscheidungen in kürzerer Zeit zu treffen, sondern vor allem das Risiko in Entscheidungsprozessen zu reduzieren. Das entlastet - nicht nur zeitlich, sondern vor allem auch auch psychisch - Teams, die mit uns arbeiten. Die die AI als Berater führt damit klar zu einem Anstieg der Motivation.
Als Deep Tech-Unternehmen bieten wir eine branchenspezifische Lösung, die auf die Use Cases in der Bewertung und Entwicklung von Immobilien abgestimmt ist. Archilyse.one macht die Qualität von Architektur und Immobilien digital und objektiv messbar, d. h. wir versetzen Experten in Immobilienfirmen in die Lage, nachhaltige und diverse Raumkonzepte in komplexen Umgebungen zu entwickeln. Wir nutzen KI also bereits seit 2017 in dem von Ng angestrebten Sinne. Und dabei gilt immer dass wenige, aber dafür gute Daten (die wir durch unsere Datenhomogensierung sowohl ab Papierplan als auch ab BIM Modell ableiten können) die Grundlage unserer Benchmarks sind.
Genau diese Datenhomogenisierungspipeline stellen wir unseren Kunden inzwischen auch direkt zur Verfügung. Damit ist es möglich Grundrissdaten so zu strukturieren und anzureichern, dass ML-Modelle rasch und effektiv damit arbeiten können. Das heißt: Unsere KI erlaubt es, Daten aus jeder Quelle auszulesen und das Wissen der in unserem Prozess bislang beteiligten Immobilienexperten und Architekten so mitzunutzen, dass die eigene Arbeit nicht nur einfacher, sondern um ein Vielfaches besser wird. Unsere KI kann, richtig eingesetzt, ein Optimum jenseits unseres menschlichen Erfahrungsschatzes bieten. Der “menschliche Bias” kann mit KI, wie Ng sie versteht, überwunden werden.
Eine Dekade Forschung
Natürlich freue ich mich, im Jahr 2022 von Andrew Ng meine Vision bestätigt zu sehen, die ich bereits 2009 in ersten Publikationen dargelegt habe und auf deren Grundlage schlussendlich die Gründung meines Start-Ups Archilyse erfolgt ist. Schon damals beschäftigte mich die Frage, wie KI als statistisches Tool menschliche Entscheidungen verbessern kann, ohne den Menschen in einen goldenen Determinismuskäfig zu sperren. Prominente Anwendungen (die grosse Bandbreite an Volumenoptimierern, die im Kielwasser von Spacemaker aufgetaucht sind) schaffen leider nur dies: es werden Scheinoptima entworfen, die ihren Versprechungen nicht gerecht werden. Mit Archilyse geben wir also dem Architekten seine Rolle als Designer zurück. Statt eine Vorauswahl von automatisch (und de facto suboptimal) generierten Designs anzubieten, aus der Entwerfer nur noch kuratieren “dürfen”, drehen wir den Spieß um. Entwerfer sollen unserer Meinung nach das tun, wofür sie ausgebildet wurden: entwerfen. Alle Produkte ihrer Arbeit (z. B. Handskizzen, Wettbewerbsplakate, Bestandspläne, generative Methoden, …) können von unserer KI so aufbereitet werden, dass bessere von schlechteren Grundrissen einfacher unterscheidbar werden. Die KI wird also zur Messlatte, anhand derer Entwürfe verglichen werden können. Menschliche Kreativität und technische Expertise produzieren in Symbiose die beste Lösung aus der maximalen Bandbreite von Möglichkeiten.
Warum wir Archilyse bereits vor über 10 Jahren so konzipiert haben? Gerade im Bereich des Architekturdesigns leiden wir seit Jahrhunderten an dem “Human-in-the-Loop”-Effekt (vgl. Thomas Kuhn) in der Gestaltung: die Varianz der Entwürfe reicht nie über die Idee der Architekten hinaus. Kreativität definiert damit die Wahrscheinlichkeit ein globales Optimum zu finden. Deswegen ist Kreativität auch wichtig. Genau diese wird aber zunehmend durch populäre Entwurfsoptimierungsalgorithmen eingeschränkt, welche tatsächlich weniger frei entwerfen als Menschen. Im Kontrast dazu hat Empirie in der Architekturgestaltung hingegen einen schlechten Stand, obwohl Nachschlagewerke wie Typologien oder “der Neufert” jedem ein Begriff sind. Und genau bei diesen klassischen Entwurfswerkzeugen setzte AI nun an. Sie hilft, automatisiert, Benchmarks und Evidenz in die Prozesse zu re-integrieren.
Mehrwert in der industriellen Anwendung
Derzeit sehen sich Projektentwickler mit immer komplexer werdenden Aufgabenstellungen für ihre Bauten konfrontiert: ökonomische, ökologische, politische und soziale Kriterien formen einen Tsunami an Anforderungen, in der den Beteiligten nur noch selten der “optimale Wurf” gelingt. Genau hier kann KI aber bereits heute unterstützen!
Eine KI, die dafür benötigt wird, muss in der Lage sein, aus verschiedenen und fragmentierten (auch historischen!) Datenquellen homogene “digital twins”, also akkurate und operable Abbilder der Realität, zu produzieren. Die Anreicherung und Ergänzung von Daten um zusätzliches Domänenwissen mithilfe unzähliger Spezialauswertungen und -simulationen bildet dann den relevanten zweiten Schritt um Architekten oder Asset Managern die zur Entscheidungsfindung notwendigen Kennzahlen zu liefern. Auf diese Weise erreichen wir endlich unsere Vision:
Die KI von Archilyse wird zum “Kurator”, damit der menschliche Architekt wieder zum “Gestalter” werden kann.
Das ist die Zukunft der KI, wie auch Andrew Ng sie prophezeit hat. KI kann dabei helfen, in einer immer komplexer werdenden Welt kluge Entscheidungen zu unterstützen. Unsere Lösungen helfen beispielsweise dabei Kosten und Renditen besser zu berechnen, nachhaltigere Gebäude zu bauen, oder einen wesentlichen Vorsprung in Architekturwettbewerben zu erlangen.
Sprechen Sie mich bei Fragen dazu an - egal, wie gut ihre bisherige Datengrundlage ist oder wie weit ihr Digitalisierungsprozess schon gediehen ist. Ich bin mir sicher, unser Prozess kann Ihnen helfen zukunftstauglicher und effizienter zu werden.
🌐International Startup Mentor & Coach 🚀Agile Business Transformation Strategist 🎯Sustainability Projects 🔮AI Supported E-Learning Solutions
2 JahreThanks for sharing, Matthias :)
We assist companies to go global, find relevant business partners & close successful deals.
3 JahreHi Matthias, It's very interesting! I will be happy to connect.
CEO bei COMRE AG
3 JahreMega gut aufbereitet das Thema! Bin dann schon sehr gespannt auf Euren Beitrag darüber am Swiss Valuation Congress!
Blush & Blue: Mit Kunst und Wissenschaft transformative Prozesse unterstützen | Research - Transfer - Transformation 20blue | Kunstsalon Mutschler & Friends | Community-Building | forschend, schreibend, wirkend
3 JahreMit Matthias arbeiten, heißt, zu verstehen, worum es bei KI eigentlich geht. Auch der beste Beweis dafür, dass Wissenschaft oft eine Dekade voraus denken kann, denn sein Deep-Tech Start-Up hat seine Wurzeln in der Forschung. Jetzt bekommt sein Datenverarbeitungsansatz endlich Rückenwind, wenn ein KI-Vordenker auch von Big zu Good Data wechselt. Hi Andrew Ng, might be interesting for you to read. I think, Matthias Standfest is also able to provide an EN Version if needed, but well, you might have an AI to help you do the translation stuff.:)