How does generative AI work?

GenAI is based on a type of machine learning called deep learning, which uses complex computing structures known as neural networks. For understanding language, modern deep learning models use a specific type of neural network called a transformer. Transformers use a capability called 'self-attention' to understand how different words in a sequence are connected, allowing them to process and understand the context of large blocks of text.

What kind of data is used to train generative AI?

GenAI models are trained on vast quantities of data, often more than a human could process in a lifetime. For example, a text-based model like ChatGPT was trained on millions of documents, while an image generator would be trained on millions of images. This training data is stored in a special kind of database called a vector database, which helps the model find similar data points to understand context and make associations.

What are the benefits and drawbacks of generative AI?

Benefits include helping with content ideation, creating better chatbots, enhancing research by rapidly processing data, and improving search results. Drawbacks of GenAI include the potential for providing false information (known as 'hallucination'), the risk of data leaks, and the possibility of reproducing biased content.

What is a large language model (LLM)?

A large language model is a GenAI model that processes language and can generate text. This includes both human languages and programming languages.

What is an AI image generator?

An AI image generator works similarly to an LLM, but it is designed to create images instead of text. Examples include models like DALL-E and Midjourney.

What is generative AI?

Q: What is generative AI?

Generative artificial intelligence (GenAI) is a type of deep learning model that can create content like text, images, and computer code when prompted. These models are trained on huge amounts of data and learn to produce responses that are statistically likely to be relevant to the input they receive.

Was ist generative KI?

Generative künstliche Intelligenz (KI) ist eine Art von Deep-Learning-Modell, das als Reaktion auf Prompts Texte, Bilder, Computercode und audiovisuellen Inhalt erzeugen kann.

Modelle generativer KI werden mit großen Mengen von Rohdaten trainiert – im Allgemeinen mit der gleichen Art von Daten, für die sie entwickelt wurden. Anhand dieser Informationen lernen sie, auf beliebigen Input eine Antwort zu generieren, die mit statistischer Wahrscheinlichkeit für diese Eingaben relevant sind. So werden beispielsweise einige Modelle generativer KI auf große Textmengen trainiert, um auf schriftliche Eingabeaufforderungen (Prompts) in einer scheinbar organischen und originellen Weise reagieren zu können.

Einfacher ausgedrückt: Generative KI kann auf Anfragen ähnlich reagieren wie menschliche Künstler oder Autoren, nur schneller. Ob der von diesen Modellen erzeugte Inhalt als „neu“ oder „originell“ gelten werden können, ist umstritten. In vielen Fällen können sie jedoch mit den kreativen Fähigkeiten des Menschen mithalten oder diese sogar übertreffen.

Bekannte Modelle der generativen KI sind ChatGPT für die Texterstellung und DALL-E für die Bilderzeugung. Viele Unternehmen haben auch eigene Modelle entwickelt.

Wie funktioniert die generative KI?

Maschinelles Lernen, Deep Learning und neuronale Netzwerke

Generative KI ist eine Form des maschinellen Lernens, d. h. sie stützt sich auf mathematische Analysen, um relevante Konzepte, Bilder oder Muster zu finden. Anhand dieser Analyse wird dann Inhalt erstellt, der mit statistischer Wahrscheinlichkeit ähnlich oder verwandt mit den erhaltenen Prompts ist.

Generative KI basiert auf einer Form des maschinellen Lernens, dem so genannten Deep Learning. Deep-Learning-Modelle sind leistungsfähig genug, um aus nicht beschrifteten Daten zu lernen. Sie verwenden eine Art von Computerarchitektur, die als neuronales Netzwerk bezeichnet wird. Solche Architekturen bestehen aus mehreren Knoten, die Daten aneinander weitergeben, ähnlich wie ein menschliches Gehirn Daten über Neuronen weitergibt. Neuronale Netzwerke sind in der Lage, anspruchsvolle und komplexe Aufgaben zu erfüllen.

Transformer und Self-Attention

Modelle generativer KI, die Sprache interpretieren können, müssen mehr als nur einzelne Wörter verstehen. Sie müssen in der Lage sein, ganze Sätze, Absätze und Dokumente zu interpretieren. Frühe Modelle des maschinellen Lernens hatten Schwierigkeiten, ganze Sätze zu verstehen, und „vergaßen“ den Anfang eines Satzes, wenn sie das Ende erreicht hatten. Dies führte zu Fehlinterpretationen.

Moderne Modelle der generativen KI verwenden eine bestimmte Art von neuronalen Netzwerken, die so genannten Transformer (Transformers). Diese nutzen eine Fähigkeit, die als Self-Attention (Selbstaufmerksamkeit oder Selbstbeobachtung) bezeichnet wird, um zu erkennen, wie Elemente in einer Sequenz miteinander verbunden sind. Transformer ermöglichen es generativen KI-Modellen, große Textblöcke und nicht nur einzelne Wörter und Sätze zu verarbeiten und zu kontextualisieren.

Trainingsdaten

Um gut zu funktionieren, müssen Modelle der generativen KI mit einer großen Datenmengen gefüttert werden: in den meisten Fällen mit mehr Daten, als ein Mensch in seinem ganzen Leben verarbeiten könnte. So wurde beispielsweise das große Sprachmodell ChatGPT mit Millionen von Dokumenten trainiert. Ein Bildgenerator kann mit Millionen von Bildern trainiert werden, ein Codegenerator mit Milliarden von Codezeilen.

Die Trainingsdaten werden in einer Vektordatenbank aufbewahrt. In einer solchen Datenbank werden die Datenpunkte als Vektoren gespeichert – oder als Koordinatensatz in einem mehrdimensionalen Feld. Auf einer Landkarte verwenden wir Längen- und Breitengrade, um nahe gelegene Orte zu finden. Modelle des maschinellen Lernens können die Daten als Vektoren speichern und mit ihrer Hilfe „nahe gelegene“ Datenpunkte finden. Auf diese Weise können die Modelle Assoziationen herstellen und den Kontext eines Wortes, eines Bildes, eines Tons oder einer anderen Art von Inhalt verstehen.

Sobald das Modell der generativen KI ein gewisses Maß an Feinabstimmung erreicht hat, benötigt es nicht mehr ganz so viele Daten, um ein Ergebnis zu liefern. Beispielsweise können KI-Modelle für die Sprachgenerierung mit Tausenden von Stunden an Sprachaufnahmen trainiert werden. Einmal abgestimmt, benötigen einige Modelle jedoch nur wenige Sekunden einer Aufnahme, um die Stimme eines Menschen realistisch zu imitieren.

Selbst nach der Feinabstimmung durchsuchen viele generative KI-Modelle (oder ihre Betreiber) weiterhin das Internet nach mehr Inhalten. Sie tun dies aus verschiedenen Gründen, einschließlich des Abrufs aktueller Daten als Antwort auf Benutzeranfragen und der Erfassung weiterer Daten für Schulungszwecke.

Welche Vor- und Nachteile hat die generative KI?

Modelle generativer KI erfreuen sich zunehmender Beliebtheit, da sie eine Reihe von potenziellen Vorteilen bieten. Zu diesen Vorteilen gehören unter anderem:

Ideenfindung für Inhalte: Der Einsatz von generativer KI kann Content Creatorn helfen, schneller eine kreative Richtung zu finden.
Bessere Chatbots: Modelle generativer KI können in Chatbots integriert werden, um Kundenfragen besser zu beantworten, potenzielle Kunden anzusprechen und so weiter.
Bessere Forschung: Modelle generativer KI können Big Data, einschließlich medizinischer Daten oder wissenschaftlicher Studien, schnell verarbeiten und so die Forschung unterstützen.
Verbesserte Suchergebnisse: Suchmaschinen und virtuelle Assistenten können Funktionen der generativen KI integrieren, um schneller mit relevanten Informationen zu antworten.
Unterhaltung: Viele Menschen nutzen öffentlich verfügbare Tools der generativen KI zu reinen Unterhaltungszwecken.
Schnelles Software-Prototyping: Ein Ansatz für die Softwareentwicklung namens „Vibe Coding“ hat an Beliebtheit gewonnen. Bei diesem Ansatz verlässt sich ein Entwickler auf ein generatives KI-Tool, um tatsächliche Codezeilen zu erstellen, indem er nur grobe Anweisungen an das Tool gibt.
Andere Vorteile: KI ist ein schnell wachsendes Feld, und weitere Vorteile der generativen KI werden wahrscheinlich noch folgen.

Die generative KI hat jedoch auch ihre Nachteile, wie zum Beispiel:

Halluzinationen und andere Ungenauigkeiten: Modelle der generativen KI sind in der Regel sehr gut darin, Muster zu erkennen, aber manchmal erkennen sie auch Muster, die gar nicht existieren. Dies kann dazu führen, dass die Modelle falsche Informationen liefern, ein Phänomen, das als „Halluzination“ bekannt ist. Darüber hinaus sind Modelle der generativen KI nur so zuverlässig wie die Daten, mit denen sie gefüttert werden. Ohne Zugang zu den Quelldaten kann es schwierig sein, die Ergebnisse der generativen KI zu überprüfen.
Datenlecks: Modelle können die Daten, mit denen sie in Eingabeaufforderungen gefüttert werden, in unerwarteten Kontexten preisgeben. Mehrere große Unternehmen haben auf diese Weise versehentlich vertrauliche Informationen oder Quellcode weitergegeben.
Negative Auswirkungen auf Content Creator: Viele generative KI-Modelle durchsuchen regelmäßig Websites und senden im Gegenzug nur sehr wenig Referral-Traffic. Dies kann Content Creator und Publisher schädigen, die auf Nutzer-Traffic für Einnahmen angewiesen sind.
Unbeabsichtigtes Plagiat oder Missbrauch geistigen Eigentums: Da Modelle generativer KI auf bereits vorhandenem Inhalt basieren, können sie diesen Inhalt ohne Erlaubnis des ursprünglichen Autors oder Urhebers reproduzieren. Cloudflare hilft, KI-Modelle davor zu schützen, ohne Erlaubnis auf Originalinhalte zuzugreifen, indem die AI Audit Pay-per-Crawl-Funktion genutzt wird.
Böswillige Manipulation von Antworten: Angreifer können ein Modell der generativen KI mit Daten füttern, die es dazu veranlassen, gefährliche oder unsichere Informationen für andere Nutzer zu produzieren.
Verzerrungen: lle Verzerrungen in den Informationen, mit denen ein Modell während des Trainings gefüttert wird, bleiben wahrscheinlich erhalten oder verstärken sich sogar, wenn das Modell nicht korrigierend abgestimmt wird. Und selbst dann ist es fast unmöglich sicherzustellen, dass die Ergebnisse frei von Verzerrungen sind, ohne die gesamten Trainingsdaten zu überprüfen.

Was ist ein großes Sprachmodell (LLM)?

„Großes Sprachmodell“ (Large Language Model oder kurz LLM) ist der Fachbegriff für Modelle der generativen KI, die in der Lage sind, Sprache zu verarbeiten und Text zu erzeugen, einschließlich von Menschen gesprochener Sprachen und Programmiersprachen. Bekannte LLMs sind ChatGPT (von OpenAI), Llama (von Meta), Bard (von Google), Copilot (von GitHub) und Bing Chat (von Microsoft).

Was ist ein KI-Bildgenerator?

KI-Bildgeneratoren funktionieren ähnlich wie LLMs, allerdings für Bilder statt für Text. DALL-E und Midjourney sind zwei Beispiele für beliebte Bildgeneratoren, die auf generativer KI basieren.

Unterstützt Cloudflare die Entwicklung mit generativer KI?

Cloudflare ermöglicht es Entwicklern und Unternehmen, ihre eigenen Modelle generativer KI zu erstellen. Cloudflare bietet Vectorize an, damit Entwickler Einbettungen auf dem globalen Cloudflare-Netzwerk aus ihren eigenen Daten generieren und speichern können, und Cloudflare Workers AI für die Ausführung generativer KI-Aufgaben auf einem globalen Netzwerk von GPUs. Erfahren Sie mehr darüber, wie Cloudflare die nächste Generation der generativen KI ermöglicht.

FAQs

Was ist generative KI?

Generative künstliche Intelligenz (GenAI) ist eine Art von Deep-Learning-Modell, das auf Aufforderung Inhalte wie Texte, Bilder und Computercode erstellen kann. Diese Modelle werden mit riesigen Datenmengen trainiert und lernen, Antworten zu generieren, die mit hoher statistischer Wahrscheinlichkeit für die erhaltenen Eingaben relevant sind.

Wie funktioniert die generative KI?

GenAI basiert auf einer Art des maschinellen Lernens, dem sogenannten Deep Learning, das komplexe Rechenstrukturen nutzt, die als neuronale Netzwerke bekannt sind. Um Sprache zu verstehen, verwenden moderne Deep-Learning-Modelle eine bestimmte Art von neuronalen Netzwerken, die als Transformer bezeichnet werden. Transformer nutzen eine Fähigkeit namens „Self-Attention“ (Selbstaufmerksamkeit), um zu verstehen, wie verschiedene Wörter in einer Sequenz miteinander verbunden sind. Dadurch können sie den Kontext großer Textblöcke verarbeiten und zu verstehen

Welche Art von Daten werden zum Trainieren generativer KI verwendet?

GenAI-Modelle werden mit riesigen Datenmengen trainiert, oft mehr, als ein Mensch in seinem Leben verarbeiten könnte. Ein textbasiertes Modell wie ChatGPT wurde beispielsweise mit Millionen von Dokumenten trainiert, während ein Bildgenerator mit Millionen von Bildern trainiert wird. Diese Trainingsdaten werden in einer speziellen Art von Datenbank gespeichert, einer sogenannten Vektordatenbank. Diese hilft dem Modell, ähnliche Datenpunkte zu finden, um den Kontext zu verstehen und Assoziationen herzustellen.

Welche Vor- und Nachteile hat die generative KI?

Zu den Vorteilen gehören die Unterstützung bei der Ideenfindung für Inhalte, die Erstellung besserer Chatbots, die Verbesserung der Forschung durch schnelle Datenverarbeitung und die Verbesserung von Suchergebnissen. Zu den Nachteilen von GenAI gehören das Potential, falsche Informationen zu liefern (bekannt als „Halluzinationen”), das Risiko von Datenlecks und die Möglichkeit, voreingenommene Inhalte zu reproduzieren.

Was ist ein großes Sprachmodell (LLM)?

Ein großes Sprachmodell ist ein GenAI-Modell, das Sprache verarbeitet und Text generieren kann. Dazu gehören sowohl menschliche Sprachen als auch Programmiersprachen.

Was ist ein KI-Bildgenerator?

Ein KI-Bildgenerator funktioniert ähnlich wie ein LLM, ist jedoch darauf ausgelegt, Bilder statt Text zu erstellen. Beispiele hierfür sind Modelle wie DALL-E und Midjourney, die Text-Prompts in einzigartige visuelle Inhalte umwandeln.