An AI agent is a computer program powered by artificial intelligence that can autonomously perform complex tasks for human users, even without explicit instructions. Unlike other AI software, such as chatbots, AI agents can operate beyond a specific prompt-based context and independently find information and take actions to achieve a broader objective.

How do AI agents function?

AI agents are built upon large language models (LLMs) and are capable of processing and interpreting diverse data types, including conversational requests and web-hosted content. They can interact with external applications through application programming interfaces (APIs), simulate human user interactions with web apps (e.g., filling out forms, reading webpages), and connect to various tools via emerging standards like the Model Context Protocol (MCP). These capabilities enable them to take actions beyond their immediate environment. Furthermore, AI agents learn and refine their future actions through a "data flywheel" feedback loop, which uses records of past interactions and human input.

What is the difference between agentic AI and AI agents?

AI agents are the actual software programs that make autonomous decisions and handle tasks. Agentic AI refers to the field of AI development that focuses on creating these AI agents.

How does agentic AI compare to generative AI?

Generative AI (GenAI), which includes LLMs like ChatGPT, is designed to produce content in response to prompts. Agentic AI is built on top of GenAI, but it goes a step further by allowing AI agents to perform actions outside of a defined context, even without direct prompts. For example, while an LLM might generate an email draft, an AI agent could also find customer information and send personalized emails.

What are the different categories of AI agents?

There are two primary types of AI agents: background agents and surface agents. Background agents handle routine tasks with minimal user interaction, similar to maintenance workers. Surface agents, like front-desk staff, interact more directly with human users, assisting them with various tasks. Additionally, systems can be single-agent (using one model) or multi-agent (combining multiple agents that collaborate to solve problems).

What is an agentic AI chatbot?

An agentic AI chatbot is a conversational AI that can not only interact with users but also take actions outside of the chat context on their behalf. Unlike traditional chatbots that might provide instructions, an agentic AI chatbot could directly perform the action, such as filing a support ticket.

How do agentic AI chatbots differ from non-agentic AI chatbots?

Non-agentic AI chatbots are reactive and primarily provide information or directions based on their training data, even if powered by an LLM. Agentic AI chatbots, however, can initiate and complete actions beyond the user's immediate interaction and can learn from a broader range of real-world data, not just their initial training.

How does Cloudflare support the development of agentic AI?

The Cloudflare developer platform offers tools for building and deploying AI-powered agents that can perform tasks autonomously, communicate in real time, interact with AI models, browse the web, query databases, and support human oversight. Cloudflare's global network also enables the deployment of AI agents with code running close to end users worldwide.

What is an AI agent?

Was ist ein KI-Agent?

Ein KI-Agent ist ein auf künstlicher Intelligenz (KI) basierendes Computerprogramm, das autonom Aufgaben ausführen kann, um menschlichen Nutzenden auch ohne konkrete Anweisungen zu helfen. Im Gegensatz zu anderer KI-gestützter Software, wie z. B. Chatbots, können KI-Agenten auch außerhalb eines bestimmten, auf Prompts basierenden Kontexts arbeiten. Sie können ihre Trainingsdaten verlassen und sich sozusagen in der Welt umsehen, um Informationen zu finden. Dann können sie auf der Grundlage dieser Informationen selbstständig Maßnahmen ergreifen, um ein übergeordnetes Ziel zu verfolgen.

KI-Agenten können Entscheidungen treffen, aus früheren Erfahrungen lernen und ihre Handlungen entsprechend anpassen. Sie können sogar mit anderen KI-Agenten Rücksprache halten, um relevante Informationen zu erhalten. Menschen geben den KI-Agenten Ziele vor, aber es liegt an den Agenten, herauszufinden, wie sie diese Ziele erreichen können. Sie können unabhängig oder mit sehr wenig menschlichem Zutun arbeiten.

KI-Agenten können entweder Hardware steuern (wie in der Robotik) oder ausschließlich softwarebasiert agieren.

Agentenbasierte KI (Agentic AI) vs. KI-Agenten

KI-Agenten sind die oben beschriebenen Softwareprogramme: Sie treffen selbstständig Entscheidungen und erledigen Aufgaben. Agentic AI (agentenbasierte KI) ist der Bereich der KI-Entwicklung, der die Konstruktion von KI-Agenten ermöglicht. (Denken Sie an den Unterschied zwischen generativer KI und einzelnen Large Language Models wie Microsoft Copilot oder an den Unterschied zwischen dem „Kochen“ und einem bestimmten Gericht.)

Agentenbasierte KI im Vergleich zu generativer KI

Generative KI (GenAI) bezieht sich auf eine Art von Deep-Learning-Modell, das als Reaktion auf Prompts Inhalt generieren kann. In diesem Bereich handelt es sich um die Kategorie der KI, zu der LLMs wie ChatGPT gehören. Agentenbasierte KI (Agentic AI) baut auf GenAI auf. Doch während ein LLM nur auf Prompts über eine bestimmte Benutzeroberfläche oder API reagieren kann, kann ein KI-Agent einen definierten Kontext verlassen und auch ohne Prompts Aktionen ausführen.

Eine Vertriebsleiterin in einem großen Unternehmen könnte ein LLM mit folgendem Prompt beauftragen: „Schreibe eine E-Mail, die ich an 10 unserer wichtigsten Kunden senden kann, um sie zu einem Abendessen einzuladen.“ Aber mit agentenbasierter KI könnte die Vertriebsleiterin stattdessen einem KI-Agenten den Auftrag geben: „Lade 10 unserer wichtigsten Kunden zum Abendessen ein.“ Mit anderen Worten: Das LLM kann den Text erstellen, aber der KI-Agent sollte sowohl den E-Mail-Text generieren als auch die 10 größten Kunden im CRM finden und personalisierte Einladungen versenden (sofern die erforderlichen Berechtigungen vorliegen).

Wie funktionieren KI-Agenten?

Große Sprachmodelle (LLMs)

KI-Agenten basieren auf LLMs. Ein LLM ist ein KI-Modelltyp, der auf großen Mengen von Beispieldaten trainiert wurde und dadurch in der Lage ist, von Menschen erstellte Inhalte zu verstehen und selbst Inhalte zu generieren. LLMs verstehen selbst ungenaue menschliche Prompts und Anfragen.

Da sie auf LLMs basieren, können KI-Agenten eine breite Palette von Daten und Inhalten verarbeiten und interpretieren, von Dialoganfragen von Nutzenden bis hin zu im Web gehosteten Videoinhalten. KI-Agenten können Inhalte aus verschiedenen Arten von Medien interpretieren: Code, Text, Audio, Video und so weiter. Sie können die Erkenntnisse aus diesen Inhalten dann nutzen, um ihre Aktionen zu verfeinern.

Externe Integrationen und Interaktionen

Darüber hinaus haben KI-Agenten Möglichkeiten, mit der Welt zu interagieren. In der Robotik können dazu physische Sensoren und Kameras gehören. Bei reinen Software-Agenten kann dies verschiedene Formen annehmen:

Agenten können sich über APIs direkt mit externen Anwendungen verbinden
Einige KI-Agenten können mit Webanwendungen wie ein menschlicher Nutzender interagieren, indem sie Formulare ausfüllen, Webseiten lesen und so weiter (zu diesem Zweck können sie einen Headless-Browser verwenden)
Mit dem neuen Model Context Protocoll (MCP)-Standard werden KI-Agenten mit einer Vielzahl von Tools (E-Mail-Clients, CRM, Abrechnungssysteme usw.) verknüpft, wobei die angemessene Authentifizierung und Autorisierung für den Agenten ermöglicht wird

Diese Arten der Interaktion mit der Welt außerhalb des Kontexts der Umgebung des KI-Agenten ermöglichen es dem KI-Agenten, Maßnahmen zu ergreifen. Organisationen können Schutzmechanismen für KI-Agenten einrichten, um sicherzustellen, dass deren Handlungen korrekt sind – ähnlich wie menschliche Nutzende innerhalb einer IT-Umgebung nur eingeschränkte Berechtigungen haben. Zusätzlich zum Programmieren von Richtlinien in die KI-Agenten können Unternehmen auch einen „Human-in-the-Loop“-Ansatz verfolgen, bei dem Menschen die Richtigkeit der Antworten der KI-Agenten überprüfen oder deren Aktionen genehmigen.

Lernen über den Data-Flywheel-Effekt

Auch KI-Agenten können lernen, indem sie die Ergebnisse vergangener Aktionen und den Input von menschlichen Nutzenden verwenden, um ihre Aktionen in der Zukunft zu verfeinern. Sie haben „Gedächtnis“ – nicht nur im Sinne von RAM, sondern im Sinne einer Erinnerung an vergangene Interaktionen und Ergebnisse. Dieses Lernen erfolgt durch eine Feedbackschleife, die als Datenschwungrad („Data Flywheel“) bezeichnet wird: Aufzeichnungen der Interaktionen eines Agenten werden vom zugrunde liegenden Modell zur Verbesserung der zukünftigen Performance verwendet.

Welche Arten von KI-Agenten gibt es?

Es gibt zwei Haupttypen von KI-Agenten:

Background Agents: Sie führen Aufgaben, insbesondere Routineaufgaben, im Hintergrund mit wenig Nutzerinteraktion aus. Background Agents sind wie die Hausmeister oder Wartungsarbeitende, die das Büro sauber halten und für das Licht sorgen.
Surface Agents: Sie interagieren direkter mit menschlichen Nutzenden. Chatbot, Kundenservice und unterstützende KI-Agenten fallen in diese Kategorie. Surface Agents sind wie Front-Desk-Mitarbeitende in einem Bürogebäude, die mit den eingehenden Personen interagieren und bei Bedarf bestimmte Aufgaben erledigen.

Es gibt auch Single-Agent- und Multi-Agent-Systeme. KI-Systeme mit einem einzelnen Agenten basieren auf nur einem Modell. Multi-Agenten-KI-Systeme kombinieren die Fähigkeiten mehrerer Agenten, die sich zur Lösung von Problemen gegenseitig absprechen.

Was ist ein agentenbasierter KI-Chatbot?

Agentenbasierte KI-Chatbots sind wie herkömmliche Chatbots in der Lage, im Gespräch mit Menschen zu interagieren. Agentenbasierte KI-Chatbots können jedoch ihren Chatbot-Kontext verlassen – den Chat verlassen – um im Namen der Person, mit der sie interagieren, zu handeln. Ein herkömmlicher Chatbot kann Ihnen Anweisungen zum Einreichen eines Support-Tickets geben. Ein agentenbasierter KI-Chatbot wäre in der Lage, das Ticket selbst einzureichen.

Agentenbasierte KI-Chatbots vs. nicht-agentenbasierte KI-Chatbots

Nicht-agentenbasierte KI-Chatbots sind reaktiv und reagieren auf Prompts von Nutzenden in Übereinstimmung mit ihren Trainingsdaten. Sie können zwar immer noch von einem LLM unterstützt werden, sind aber besser darin, den Nutzenden hilfreiche Inhalte oder Anweisungen zu liefern, als Aktionen im Namen der Nutzenden auszuführen. Agentenbasierte KI-Chatbots sind in der Lage, außerhalb des Kontexts ihrer Interaktion mit einem Nutzenden zu handeln. Agentenbasierte KI-Chatbots können über ihre Trainingsdaten hinaus auch aus einer Reihe von Quellen lernen.

Wie unterstützt Cloudflare agentenbasierte KI (Agentic AI)?

Die Cloudflare-Entwicklerplattform bietet alle Tools, die für die Erstellung und den Einsatz von KI-gestützten Agenten erforderlich sind. Diese können:

Aufgaben autonom ausführen
In Echtzeit mit Clients kommunizieren
KI-Modelle aufrufen
Im Web surfen
Eine Datenbank abfragen
Human-in-the-Loop-Interaktionen unterstützen

Darüber hinaus erlaubt das globale Netzwerk von Cloudflare Entwicklerinnen und Entwicklern die Erstellung von KI-Agenten mit Code, der überall auf der Welt ausgeführt werden kann – so nah wie möglich am Endnutzenden. Erfahren Sie, wie Sie mit der Erstellung von KI-Agenten auf Cloudflare beginnen können.

FAQs

Was ist ein KI-Agent?

Ein KI-Agent ist ein auf künstlicher Intelligenz basierendes Computerprogramm, das autonom komplexe Aufgaben für menschliche Nutzende ausführen kann, auch ohne explizite Anweisungen. Im Gegensatz zu anderer KI-Software, wie z. B. Chatbots, können KI-Agenten über einen bestimmten, auf Prompts basierenden Kontext hinaus agieren und unabhängig Informationen finden und Maßnahmen ergreifen, um ein umfassenderes Ziel zu erreichen.

Wie funktionieren KI-Agenten?

KI-Agenten basieren auf großen Sprachmodellen (LLMs) und sind in der Lage, verschiedene Datentypen zu verarbeiten und zu interpretieren, einschließlich Konversationsanfragen und webgehosteter Inhalte. Sie können über Anwendungsprogrammierschnittstellen (APIs) mit externen Anwendungen interagieren, menschliche Benutzerinteraktionen mit Webanwendungen simulieren (z. B. Formulare ausfüllen, Webseiten lesen) und sich über neue Standards wie das Model Context Protocol (MCP) mit verschiedenen Tools verbinden. Diese Fähigkeiten ermöglichen es ihnen, Maßnahmen über ihre unmittelbare Umgebung hinaus zu ergreifen. Darüber hinaus lernen und verfeinern KI-Agenten ihre zukünftigen Aktionen durch eine „Daten-Flywheel“-Feedbackschleife, die Aufzeichnungen vergangener Interaktionen und menschlicher Eingaben nutzt.

Was ist der Unterschied zwischen agentenbasierter KI (Agentic AI) und KI-Agenten?

KI-Agenten sind die eigentlichen Softwareprogramme, die selbstständig Entscheidungen treffen und Aufgaben erledigen. Agentic AI bezieht sich auf den Bereich der KI-Entwicklung, der sich auf die Erstellung dieser KI-Agenten konzentriert.

Wie schneidet die agentenbasierte KI im Vergleich zur generativen KI ab?

Generative KI (GenAI), zu der auch LLMs wie ChatGPT gehören, ist darauf ausgelegt, Inhalte als Reaktion auf Prompts zu erzeugen. Agentic AI basiert auf GenAI, geht aber noch einen Schritt weiter, indem es KI-Agenten ermöglicht, Aktionen außerhalb eines definierten Kontexts auszuführen, selbst ohne direkte Prompts. Zum Beispiel kann ein LLM einen E-Mail-Entwurf erstellen, während ein KI-Agent auch Kundeninformationen finden und personalisierte E-Mails versenden kann.

Welche verschiedenen Kategorien von KI-Agenten gibt es?

Es gibt zwei Haupttypen von KI-Agenten: Hintergrundagenten (Background Agents) und Oberflächenagenten (Surface Agents). Hintergrundagenten erledigen Routineaufgaben mit minimaler Benutzerinteraktion, ähnlich wie Wartungspersonal. Oberflächenagenten interagieren, wie z. B. Mitarbeitende an der Rezeption, direkter mit menschlichen Nutzern und unterstützen sie bei verschiedenen Aufgaben. Zusätzlich können Systeme Einzelagenten (die ein Modell verwenden) oder Mehrfachagenten (mehrere Agenten, die zur Lösung von Problemen zusammenarbeiten) sein.

Was ist ein agentenbasierter KI-Chatbot?

Ein agentenbasierter KI-Chatbot ist eine Konversations-KI, die nicht nur mit Benutzern interagieren, sondern auch in ihrem Namen Aktionen außerhalb des Chat-Kontexts ausführen kann. Im Gegensatz zu herkömmlichen Chatbots, die Anweisungen geben können, könnte ein agentenbasierter KI-Chatbot die Aktion direkt ausführen, z. B. ein Support-Ticket erstellen.

Wie unterscheiden sich agentenbasierte KI-Chatbots von nicht-agentenbasierten KI-Chatbots?

Nicht-agentenbasierte KI-Chatbots sind reaktiv und liefern hauptsächlich Informationen oder Anweisungen basierend auf ihren Trainingsdaten, selbst wenn sie von einem LLM unterstützt werden. Agentenbasierte KI-Chatbots können jedoch Aktionen initiieren und abschließen, die über die unmittelbare Interaktion des Nutzers hinausgehen, und aus einem breiteren Spektrum an realen Daten lernen, nicht nur aus ihrem ursprünglichen Training.

Wie unterstützt Cloudflare die Entwicklung von agentenbasierter KI (Agentic AI)?

Die Cloudflare-Entwicklungsplattform bietet Werkzeuge zum Erstellen und Bereitstellen von KI-gestützten Agenten, die Aufgaben autonom ausführen, in Echtzeit kommunizieren, mit KI-Modellen interagieren, im Internet surfen, Datenbanken abfragen und menschliche Überwachung unterstützen können. Das globale Netzwerk von Cloudflare ermöglicht auch die Bereitstellung von KI-Agenten mit Code, der in der Nähe von Endnutzern weltweit ausgeführt wird.