La plataforma de inferencia de IA
Workers AI permite ejecutar inferencia de IA de forma global con una sola llamada a la API. No hay que gestionar GPUs, ni planificación de capacidad. Simplemente modelos de aprendizaje automático inteligentes funcionando donde se necesitan, en la red global de Cloudflare.
Precios de Serverless
Catálogo de modelos rico
Ampliamente compatible
Escalar hacia arriba y hacia abajo
La inferencia es difícil de predecir y con picos en su naturaleza, a diferencia del entrenamiento. La utilización de GPU, en promedio, es solo del 20-40% — un tercio de las organizaciones utiliza menos del 15%. Workers AI permite a los clientes ahorrar solo pagando por el uso. Sin tener que adivinar o comprometerse con hardware que no se utiliza.
on a hyperscaler
on Cloudflare
Modelos de IA fácilmente accesibles a través de código, OpenAI SDK o API
Prueba, prototipa y evalúa los últimos modelos de lenguaje con la velocidad y fiabilidad de un entorno de producción, accesible en segundos.
Llama 4 Scout
Generalista equilibrado para tareas cotidianas
deepseek-r1-qwen-distill
Modelo orientado al razonamiento para lógica y matemáticas
GPT-Código Abierto 120 billones
Potencia para chat a escala empresarial
Qwen 3 Codificador
Especializado para programar y depurar
Ejecuta cualquier modelo de IA con una llamada a la API
Llama a cualquier modelo directamente desde tu código usando un único endpoint. Workers AI gestiona automáticamente la provisión, el escalado y la optimización de la latencia.

const response = await env.AI.run("@cf/meta/llama-4-scout-17b-16e-instruct", { messages: [ { role: "system", content: "You are a friendly assistant" }, { role: "user", content: "What is the origin of the phrase Hello, World" }, ]} );
IA práctica en el borde
Ejecuta cargas de trabajo de inteligencia artificial reales directamente en la red global de Cloudflare — desde LLMs hasta generación de imágenes y embebidos. No hay clusters de GPU, ni capas de orquestación — solo inferencia rápida y escalable dondequiera que estén tus usuarios.
Workers AI Explora un catálogo amplio de 50+ modelos listos para usar
Ejemplos del mundo real en acción
Generación de imágenes
Texto por voz, en tiempo real
Incorporaciones
Grandes Modelos de Lenguaje
Workers AI Pricing
50+ models running at the edge. View AI pricing details
Neurons
—
$0.011 / thousand neurons
Shopify
"
For Shopify, the real challenge is not about how many different pieces of complex technology we can use but the opposite. Cloudflare helps us find a simple way to achieve something very complex that we can scale and maintain. "
Powerful primitives, seamlessly integrated
Built on systems powering 20% of the Internet, Workers AI runs on the same infrastructure Cloudflare uses to build Cloudflare. Enterprise-grade reliability, security, and performance are standard.
Compute
Storage
AI
Media
Network
SASE / Zero Trust
Construye sin límites
Únete a miles de desarrolladores que han eliminado la complejidad de la infraestructura y han desplegado a nivel mundial con Cloudflare. Empieza a construir de forma gratuita — no se requiere tarjeta de crédito.