Was ist ein KI-Agent?

Ein KI-Agent ist ein auf künstlicher Intelligenz basierendes Computerprogramm, das im Auftrag menschlicher Nutzender autonom komplexe Aufgaben ausführen kann.

Was ist ein KI-Agent?

Ein KI-Agent ist ein auf künstlicher Intelligenz (KI) basierendes Computerprogramm, das autonom Aufgaben ausführen kann, um menschlichen Nutzenden auch ohne konkrete Anweisungen zu helfen. Im Gegensatz zu anderer KI-gestützter Software, wie z. B. Chatbots, können KI-Agenten auch außerhalb eines bestimmten, auf Prompts basierenden Kontexts arbeiten. Sie können ihre Trainingsdaten verlassen und sich sozusagen in der Welt umsehen, um Informationen zu finden. Dann können sie auf der Grundlage dieser Informationen selbstständig Maßnahmen ergreifen, um ein übergeordnetes Ziel zu verfolgen.

KI-Agenten können Entscheidungen treffen, aus früheren Erfahrungen lernen und ihre Handlungen entsprechend anpassen. Sie können sogar mit anderen KI-Agenten Rücksprache halten, um relevante Informationen zu erhalten. Menschen geben den KI-Agenten Ziele vor, aber es liegt an den Agenten, herauszufinden, wie sie diese Ziele erreichen können. Sie können unabhängig oder mit sehr wenig menschlichem Zutun arbeiten.

KI-Agenten können entweder Hardware steuern (wie in der Robotik) oder ausschließlich softwarebasiert agieren.

Agentenbasierte KI (Agentic AI) vs. KI-Agenten

KI-Agenten sind die oben beschriebenen Softwareprogramme: Sie treffen selbstständig Entscheidungen und erledigen Aufgaben. Agentic AI (agentenbasierte KI) ist der Bereich der KI-Entwicklung, der die Konstruktion von KI-Agenten ermöglicht. (Denken Sie an den Unterschied zwischen generativer KI und einzelnen Large Language Models wie Microsoft Copilot oder an den Unterschied zwischen dem „Kochen“ und einem bestimmten Gericht.)

Agentenbasierte KI im Vergleich zu generativer KI

Generative KI (GenAI) bezieht sich auf eine Art von Deep-Learning-Modell, das als Reaktion auf Prompts Inhalt generieren kann. In diesem Bereich handelt es sich um die Kategorie der KI, zu der LLMs wie ChatGPT gehören. Agentenbasierte KI (Agentic AI) baut auf GenAI auf. Doch während ein LLM nur auf Prompts über eine bestimmte Benutzeroberfläche oder API reagieren kann, kann ein KI-Agent einen definierten Kontext verlassen und auch ohne Prompts Aktionen ausführen.

Ressource
Umfrage zeigt, dass Anwendungsmodernisierung den ROI von KI 3x wahrscheinlicher macht

Eine Vertriebsleiterin in einem großen Unternehmen könnte ein LLM mit folgendem Prompt beauftragen: „Schreibe eine E-Mail, die ich an 10 unserer wichtigsten Kunden senden kann, um sie zu einem Abendessen einzuladen.“ Aber mit agentenbasierter KI könnte die Vertriebsleiterin stattdessen einem KI-Agenten den Auftrag geben: „Lade 10 unserer wichtigsten Kunden zum Abendessen ein.“ Mit anderen Worten: Das LLM kann den Text erstellen, aber der KI-Agent sollte sowohl den E-Mail-Text generieren als auch die 10 größten Kunden im CRM finden und personalisierte Einladungen versenden (sofern die erforderlichen Berechtigungen vorliegen).

Wie funktionieren KI-Agenten?

Große Sprachmodelle (LLMs)

KI-Agenten basieren auf LLMs. Ein LLM ist ein KI-Modelltyp, der auf großen Mengen von Beispieldaten trainiert wurde und dadurch in der Lage ist, von Menschen erstellte Inhalte zu verstehen und selbst Inhalte zu generieren. LLMs verstehen selbst ungenaue menschliche Prompts und Anfragen.

Da sie auf LLMs basieren, können KI-Agenten eine breite Palette von Daten und Inhalten verarbeiten und interpretieren, von Dialoganfragen von Nutzenden bis hin zu im Web gehosteten Videoinhalten. KI-Agenten können Inhalte aus verschiedenen Arten von Medien interpretieren: Code, Text, Audio, Video und so weiter. Sie können die Erkenntnisse aus diesen Inhalten dann nutzen, um ihre Aktionen zu verfeinern.

Externe Integrationen und Interaktionen

Darüber hinaus haben KI-Agenten Möglichkeiten, mit der Welt zu interagieren. In der Robotik können dazu physische Sensoren und Kameras gehören. Bei reinen Software-Agenten kann dies verschiedene Formen annehmen:

  • Agenten können sich über APIs direkt mit externen Anwendungen verbinden
  • Einige KI-Agenten können mit Webanwendungen wie ein menschlicher Nutzender interagieren, indem sie Formulare ausfüllen, Webseiten lesen und so weiter (zu diesem Zweck können sie einen Headless-Browser verwenden)
  • Mit dem neuen Model Context Protocoll (MCP)-Standard werden KI-Agenten mit einer Vielzahl von Tools (E-Mail-Clients, CRM, Abrechnungssysteme usw.) verknüpft, wobei die angemessene Authentifizierung und Autorisierung für den Agenten ermöglicht wird

Diese Arten der Interaktion mit der Welt außerhalb des Kontexts der Umgebung des KI-Agenten ermöglichen es dem KI-Agenten, Maßnahmen zu ergreifen. Organisationen können Schutzmechanismen für KI-Agenten einrichten, um sicherzustellen, dass deren Handlungen korrekt sind – ähnlich wie menschliche Nutzende innerhalb einer IT-Umgebung nur eingeschränkte Berechtigungen haben. Zusätzlich zum Programmieren von Richtlinien in die KI-Agenten können Unternehmen auch einen „Human-in-the-Loop“-Ansatz verfolgen, bei dem Menschen die Richtigkeit der Antworten der KI-Agenten überprüfen oder deren Aktionen genehmigen.

Lernen über den Data-Flywheel-Effekt

Auch KI-Agenten können lernen, indem sie die Ergebnisse vergangener Aktionen und den Input von menschlichen Nutzenden verwenden, um ihre Aktionen in der Zukunft zu verfeinern. Sie haben „Gedächtnis“ – nicht nur im Sinne von RAM, sondern im Sinne einer Erinnerung an vergangene Interaktionen und Ergebnisse. Dieses Lernen erfolgt durch eine Feedbackschleife, die als Datenschwungrad („Data Flywheel“) bezeichnet wird: Aufzeichnungen der Interaktionen eines Agenten werden vom zugrunde liegenden Modell zur Verbesserung der zukünftigen Performance verwendet.

Welche Arten von KI-Agenten gibt es?

Es gibt zwei Haupttypen von KI-Agenten:

  • Background Agents: Sie führen Aufgaben, insbesondere Routineaufgaben, im Hintergrund mit wenig Nutzerinteraktion aus. Background Agents sind wie die Hausmeister oder Wartungsarbeitende, die das Büro sauber halten und für das Licht sorgen.
  • Surface Agents: Sie interagieren direkter mit menschlichen Nutzenden. Chatbot, Kundenservice und unterstützende KI-Agenten fallen in diese Kategorie. Surface Agents sind wie Front-Desk-Mitarbeitende in einem Bürogebäude, die mit den eingehenden Personen interagieren und bei Bedarf bestimmte Aufgaben erledigen.

Es gibt auch Single-Agent- und Multi-Agent-Systeme. KI-Systeme mit einem einzelnen Agenten basieren auf nur einem Modell. Multi-Agenten-KI-Systeme kombinieren die Fähigkeiten mehrerer Agenten, die sich zur Lösung von Problemen gegenseitig absprechen.

Was ist ein agentenbasierter KI-Chatbot?

Agentenbasierte KI-Chatbots sind wie herkömmliche Chatbots in der Lage, im Gespräch mit Menschen zu interagieren. Agentenbasierte KI-Chatbots können jedoch ihren Chatbot-Kontext verlassen – den Chat verlassen – um im Namen der Person, mit der sie interagieren, zu handeln. Ein herkömmlicher Chatbot kann Ihnen Anweisungen zum Einreichen eines Support-Tickets geben. Ein agentenbasierter KI-Chatbot wäre in der Lage, das Ticket selbst einzureichen.

Agentenbasierte KI-Chatbots vs. nicht-agentenbasierte KI-Chatbots

Nicht-agentenbasierte KI-Chatbots sind reaktiv und reagieren auf Prompts von Nutzenden in Übereinstimmung mit ihren Trainingsdaten. Sie können zwar immer noch von einem LLM unterstützt werden, sind aber besser darin, den Nutzenden hilfreiche Inhalte oder Anweisungen zu liefern, als Aktionen im Namen der Nutzenden auszuführen. Agentenbasierte KI-Chatbots sind in der Lage, außerhalb des Kontexts ihrer Interaktion mit einem Nutzenden zu handeln. Agentenbasierte KI-Chatbots können über ihre Trainingsdaten hinaus auch aus einer Reihe von Quellen lernen.

Wie unterstützt Cloudflare agentenbasierte KI (Agentic AI)?

Die Cloudflare-Entwicklerplattform bietet alle Tools, die für die Erstellung und den Einsatz von KI-gestützten Agenten erforderlich sind. Diese können:

  • Aufgaben autonom ausführen
  • In Echtzeit mit Clients kommunizieren
  • KI-Modelle aufrufen
  • Im Web surfen
  • Eine Datenbank abfragen
  • Human-in-the-Loop-Interaktionen unterstützen

Darüber hinaus erlaubt das globale Netzwerk von Cloudflare Entwicklerinnen und Entwicklern die Erstellung von KI-Agenten mit Code, der überall auf der Welt ausgeführt werden kann – so nah wie möglich am Endnutzenden. Erfahren Sie, wie Sie mit der Erstellung von KI-Agenten auf Cloudflare beginnen können.

FAQs

Was ist ein KI-Agent?

Ein KI-Agent ist ein auf künstlicher Intelligenz basierendes Computerprogramm, das autonom komplexe Aufgaben für menschliche Nutzende ausführen kann, auch ohne explizite Anweisungen. Im Gegensatz zu anderer KI-Software, wie z. B. Chatbots, können KI-Agenten über einen bestimmten, auf Prompts basierenden Kontext hinaus agieren und unabhängig Informationen finden und Maßnahmen ergreifen, um ein umfassenderes Ziel zu erreichen.

Wie funktionieren KI-Agenten?

KI-Agenten basieren auf großen Sprachmodellen (LLMs) und sind in der Lage, verschiedene Datentypen zu verarbeiten und zu interpretieren, einschließlich Konversationsanfragen und webgehosteter Inhalte. Sie können über Anwendungsprogrammierschnittstellen (APIs) mit externen Anwendungen interagieren, menschliche Benutzerinteraktionen mit Webanwendungen simulieren (z. B. Formulare ausfüllen, Webseiten lesen) und sich über neue Standards wie das Model Context Protocol (MCP) mit verschiedenen Tools verbinden. Diese Fähigkeiten ermöglichen es ihnen, Maßnahmen über ihre unmittelbare Umgebung hinaus zu ergreifen. Darüber hinaus lernen und verfeinern KI-Agenten ihre zukünftigen Aktionen durch eine „Daten-Flywheel“-Feedbackschleife, die Aufzeichnungen vergangener Interaktionen und menschlicher Eingaben nutzt.

Was ist der Unterschied zwischen agentenbasierter KI (Agentic AI) und KI-Agenten?

KI-Agenten sind die eigentlichen Softwareprogramme, die selbstständig Entscheidungen treffen und Aufgaben erledigen. Agentic AI bezieht sich auf den Bereich der KI-Entwicklung, der sich auf die Erstellung dieser KI-Agenten konzentriert.

Wie schneidet die agentenbasierte KI im Vergleich zur generativen KI ab?

Generative KI (GenAI), zu der auch LLMs wie ChatGPT gehören, ist darauf ausgelegt, Inhalte als Reaktion auf Prompts zu erzeugen. Agentic AI basiert auf GenAI, geht aber noch einen Schritt weiter, indem es KI-Agenten ermöglicht, Aktionen außerhalb eines definierten Kontexts auszuführen, selbst ohne direkte Prompts. Zum Beispiel kann ein LLM einen E-Mail-Entwurf erstellen, während ein KI-Agent auch Kundeninformationen finden und personalisierte E-Mails versenden kann.

Welche verschiedenen Kategorien von KI-Agenten gibt es?

Es gibt zwei Haupttypen von KI-Agenten: Hintergrundagenten (Background Agents) und Oberflächenagenten (Surface Agents). Hintergrundagenten erledigen Routineaufgaben mit minimaler Benutzerinteraktion, ähnlich wie Wartungspersonal. Oberflächenagenten interagieren, wie z. B. Mitarbeitende an der Rezeption, direkter mit menschlichen Nutzern und unterstützen sie bei verschiedenen Aufgaben. Zusätzlich können Systeme Einzelagenten (die ein Modell verwenden) oder Mehrfachagenten (mehrere Agenten, die zur Lösung von Problemen zusammenarbeiten) sein.

Was ist ein agentenbasierter KI-Chatbot?

Ein agentenbasierter KI-Chatbot ist eine Konversations-KI, die nicht nur mit Benutzern interagieren, sondern auch in ihrem Namen Aktionen außerhalb des Chat-Kontexts ausführen kann. Im Gegensatz zu herkömmlichen Chatbots, die Anweisungen geben können, könnte ein agentenbasierter KI-Chatbot die Aktion direkt ausführen, z. B. ein Support-Ticket erstellen.

Wie unterscheiden sich agentenbasierte KI-Chatbots von nicht-agentenbasierten KI-Chatbots?

Nicht-agentenbasierte KI-Chatbots sind reaktiv und liefern hauptsächlich Informationen oder Anweisungen basierend auf ihren Trainingsdaten, selbst wenn sie von einem LLM unterstützt werden. Agentenbasierte KI-Chatbots können jedoch Aktionen initiieren und abschließen, die über die unmittelbare Interaktion des Nutzers hinausgehen, und aus einem breiteren Spektrum an realen Daten lernen, nicht nur aus ihrem ursprünglichen Training.

Wie unterstützt Cloudflare die Entwicklung von agentenbasierter KI (Agentic AI)?

Die Cloudflare-Entwicklungsplattform bietet Werkzeuge zum Erstellen und Bereitstellen von KI-gestützten Agenten, die Aufgaben autonom ausführen, in Echtzeit kommunizieren, mit KI-Modellen interagieren, im Internet surfen, Datenbanken abfragen und menschliche Überwachung unterstützen können. Das globale Netzwerk von Cloudflare ermöglicht auch die Bereitstellung von KI-Agenten mit Code, der in der Nähe von Endnutzern weltweit ausgeführt wird.