Die AI-Inferenz-Plattform
Workers AI ermöglicht es Ihnen, KI-Inferenz global mit einem API-Aufruf auszuführen. Keine GPUs zu verwalten, keine Kapazitätsplanung. Nur intelligente maschinelle Lernmodelle, die dort laufen, wo sie benötigt werden, auf Cloudflares globalem Netzwerk.
Serverless-Preisgestaltung
Umfassender Modellkatalog
weit verbreitete Kompatibilität
Skalieren Sie hoch und herunter
Inference ist schwer vorherzusagen und spikig in der Natur, im Gegensatz zum Training. Die GPU-Auslastung beträgt im Durchschnitt nur 20–40 % – wobei ein Drittel der Organisationen weniger als 15 % nutzt. Workers AI ermöglicht es Kunden, zu sparen, indem sie nur für die Nutzung zahlen. Keine Vermutungen oder Verpflichtungen zu Hardware, die ungenutzt bleibt.
on a hyperscaler
on Cloudflare
KI-Modelle sind leicht über Code, OpenAI SDK oder API zugänglich.
Testen, prototypen und bewerten Sie die neuesten LLMs mit der Geschwindigkeit und Zuverlässigkeit eines Produktionsumfelds, in Sekunden zugänglich.
Kimi K2.6
Mächtige Vision und autonomes Werkzeugaufruf-Modell
GLM 4.7 Flash
Schneller mehrsprachiger Agent mit Expertentoolaufruf
GPT-OSS-120B
Spezialisiert für das Coden und Debuggen
Llama 4 Scout
Ausgeglicher Allrounder für alltägliche Aufgaben
Führen Sie jedes KI-Modell mit einem API-Aufruf aus.
Rufen Sie jedes Modell direkt aus Ihrem Code mit einem einzigen Endpunkt auf. Workers AI übernimmt die Bereitstellung, Skalierung und Latenzoptimierung automatisch.

const response = await env.AI.run("@cf/moonshotai/kimi-k2.6", { messages: [ { role: "system", content: "You are a friendly assistant" }, { role: "user", content: "What is the origin of the phrase Hello, World" }, ]} );
Praktische KI am Edge
KI-Arbeitslasten direkt auf Cloudflare's globales Netzwerk ausführen — von LLMs bis Bildgenerierung und Einbettungen. Keine GPU-Cluster, keine Orchestrierungsschichten — nur schnelle, skalierbare Inferenz, wo immer Ihre Benutzer sind.
Workers AI Entdecken Sie einen reichhaltigen Katalog mit 50+ fertigen Modellen
Praktische Beispiele im Einsatz
Bildgenerierung
Sprach-zu-Text, in Echtzeit
Einbettungen
Große Sprachmodelle
Workers AI Pricing
50+ models running at the edge. View AI pricing details
Neurons
—
$0.011 / thousand neurons