Künstliche Intelligenz (KI) umfasst viele komplexe, neue Technologien, für die früher menschliche Eingaben erforderlich waren und die jetzt von einem Computer ausgeführt werden können. Im Allgemeinen ist KI ein nicht menschliches Programm oder Modell, das eine breite Palette von Problemlösungs- und Kreativitätsfähigkeiten aufweist.
Das Akronym KI wird oft synonym für verschiedene Arten von Technologien im Bereich der künstlichen Intelligenz verwendet, die jedoch in ihrem Umfang stark variieren können.
Es gibt eine Reihe von Begriffen und Konzepten, die künstliche Intelligenz und maschinelles Lernen definieren und die für Sie nützlich sein können. Hier finden Sie Begriffe, die in der Chrome-Dokumentation häufig verwendet werden, insbesondere im Zusammenhang mit clientseitiger KI.
Clientseitige KI
Während die meisten KI-Funktionen im Web auf Servern ausgeführt werden, wird clientseitige KI im Browser des Nutzers ausgeführt und die Inferenz erfolgt auf dem Gerät des Nutzers. Das hat zahlreiche Vorteile, darunter eine geringere Latenz, geringere Kosten für die Entwicklung von Funktionen, ein verbesserter Datenschutz und Offlinezugriff.
Clientseitige KI basiert auf kleineren, optimierten Modellen, die auf Leistung optimiert sind. Es ist möglich, dass solche Modelle bei bestimmten Aufgaben leistungsfähiger sind als größere serverseitige Modelle. Bewerten Sie Ihren Anwendungsfall, um zu ermitteln, welche Lösung für Sie geeignet ist.
Integrierte KI-Funktionen

Integrierte KI ist eine Form von clientseitiger KI, bei der die kleineren Modelle in den Browser integriert sind. Für Chrome umfasst dies Gemini Nano und Expertenmodelle. Sobald diese Modelle heruntergeladen wurden, können alle Websites und Webanwendungen, die integrierte KI verwenden, die Downloadzeit überspringen und direkt mit der Ausführung von Funktionen und der lokalen Inferenz beginnen.
Die integrierten KI-APIs sind so konzipiert, dass sie Inferenz für den richtigen Modelltyp für die Aufgabe ausführen. Mit der Prompt API wird beispielsweise die Inferenz für ein LLM ausgeführt, während mit der Translator API die Inferenz für ein integriertes Expertenmodell ausgeführt wird.
Serverseitige KI
Serverseitige KI umfasst cloudbasierte KI-Dienste. Stellen Sie sich Gemini 1.5 Pro in der Cloud vor. Diese Modelle sind in der Regel viel größer und leistungsfähiger. Das gilt insbesondere für Large Language Models.
Hybride KI
Hybride KI bezieht sich auf alle Lösungen, die sowohl eine Client- als auch eine Serverkomponente umfassen. Beispiel:
- Clientseitige Modelle mit Fallback auf serverseitige Modelle, die für Aufgaben entwickelt wurden, die auf dem Gerät nicht effektiv ausgeführt werden können.
- Möglicherweise fehlen auf dem Gerät Ressourcen.
- Das Modell oder die API ist nur in bestimmten Umgebungen verfügbar.
- Ein Modell, das aus Sicherheitsgründen zwischen Client und Server aufgeteilt ist.
- Sie können ein Modell beispielsweise so aufteilen, dass 75% der Ausführung auf dem Client und die restlichen 25% auf einem Server erfolgen. Das bietet Vorteile auf Clientseite, während ein Teil des Modells auf dem Gerät verbleibt und somit privat bleibt.
Wenn Sie die Prompt API verwenden, können Sie eine Hybridarchitektur mit Firebase AI Logic einrichten.
Generative KI
Generative KI ist eine Form des maschinellen Lernens, die Nutzern hilft, Inhalte zu erstellen, die sich vertraut anfühlen und menschliche Kreativität nachahmen. Bei generativer KI werden Large Language Models verwendet, um Daten zu organisieren und auf Grundlage des bereitgestellten Kontexts Text, Bilder, Videos und Audio zu erstellen oder zu ändern. Generative KI geht über Mustervergleich und Vorhersagen hinaus.
Ein Large Language Model (LLM) hat zahlreiche (oft Milliarden) Parameter, mit denen Sie eine Vielzahl von Aufgaben ausführen können, z. B. das Generieren, Klassifizieren oder Zusammenfassen von Text oder Bildern.
Natural Language Processing (NLP)
Natural Language Processing (NLP) ist eine Klasse von ML, die sich darauf konzentriert, Computern zu helfen, die menschliche Sprache zu verstehen – von den Regeln einer bestimmten Sprache bis hin zu den Eigenheiten, dem Dialekt und dem Slang, die von Einzelpersonen verwendet werden.
Agent oder KI-Agent
Ein Agent ist eine Software, die autonom eine Reihe von Aktionen plant und ausführt, um eine Aufgabe im Namen eines Nutzers zu erledigen, und sich dabei an Änderungen in ihrer Umgebung anpasst. Aktionen können API-Funktionen oder Datenbankabfragen umfassen, die auf einer Webseite oder über eine Drittanbieteranwendung wie Project Mariner ausgeführt werden.
Ein Chatbot ist nicht automatisch ein Agent. Während ein Chatbot auf einen Messenger (ob Mensch oder nicht) reagiert und sich auf ein Modell stützt, um Inhalte wie Antworten auf Fragen zu generieren, interagiert ein Agent mit Tools oder einer Datenbank, um eine Aufgabe zu erledigen.
Zusätzliche Ressourcen
Wenn Sie noch nicht mit KI im Web vertraut sind, sehen Sie sich unsere Sammlung von web.dev-KI-Ressourcen an.