La plataforma de inferencia de IA

Workers AI permite ejecutar inferencia de IA de forma global con una sola llamada a la API. No hay que gestionar GPUs, ni planificación de capacidad. Simplemente modelos de aprendizaje automático inteligentes funcionando donde se necesitan, en la red global de Cloudflare.
Precios de Serverless

Precio por inferencia sin costos de inactividad. Sin adivinar qué.

Catálogo de modelos rico

50+ modelos funcionando cerca de los usuarios en 200+ ciudades

Ampliamente compatible

Una llamada a la API, funciona con cualquier SDK de OpenAI o tipo de tarea

Escalar hacia arriba y hacia abajo

La inferencia es difícil de predecir y con picos en su naturaleza, a diferencia del entrenamiento. La utilización de GPU, en promedio, es solo del 20-40% — un tercio de las organizaciones utiliza menos del 15%. Workers AI permite a los clientes ahorrar solo pagando por el uso. Sin tener que adivinar o comprometerse con hardware que no se utiliza.

What you pay for
on a hyperscaler
What you pay for
on Cloudflare

Modelos de IA fácilmente accesibles a través de código, OpenAI SDK o API

Prueba, prototipa y evalúa los últimos modelos de lenguaje con la velocidad y fiabilidad de un entorno de producción, accesible en segundos.

Llama 4 Scout

Generalista equilibrado para tareas cotidianas

deepseek-r1-qwen-distill

Modelo orientado al razonamiento para lógica y matemáticas

GPT-Código Abierto 120 billones

Potencia para chat a escala empresarial

Qwen 3 Codificador

Especializado para programar y depurar

Ejecuta cualquier modelo de IA con una llamada a la API

Llama a cualquier modelo directamente desde tu código usando un único endpoint. Workers AI gestiona automáticamente la provisión, el escalado y la optimización de la latencia.

Background Pattern
const response = await env.AI.run("@cf/meta/llama-4-scout-17b-16e-instruct", { messages: [
    { role: "system", content: "You are a friendly assistant" },
    { role: "user", content: "What is the origin of the phrase Hello, World" },
  ]}
);

IA práctica en el borde

Ejecuta cargas de trabajo de inteligencia artificial reales directamente en la red global de Cloudflare — desde LLMs hasta generación de imágenes y embebidos. No hay clusters de GPU, ni capas de orquestación — solo inferencia rápida y escalable dondequiera que estén tus usuarios.

Background Pattern
Workers AI

Explora un catálogo amplio de 50+ modelos listos para usar

Ejemplos del mundo real en acción

Generación de imágenes

Ejecuta generación de imágenes, manipulación y flujos de trabajo creativos sin gestionar la infraestructura de GPU. Perfecto para plataformas de contenido, apps sociales y herramientas creativas.

Texto por voz, en tiempo real

Transcribir, analizar y generar contenido de audio sin infraestructura especializada. Creado para agentes de voz, apps de toma de notas y procesamiento de medios.

Incorporaciones

Crea búsqueda inteligente, recomendaciones y funciones orientadas al contexto utilizando incrustaciones vectoriales. Se integra de forma fluida con Vectorize AI Search para flujos de trabajo de IA completos.

Grandes Modelos de Lenguaje

Realizar un amplio rango de tareas de lenguaje natural. Utiliza modelos de lenguaje grandes para generación de texto, clasificación, respuesta a preguntas y otras operaciones complejas basadas en lenguaje a través de una API sencilla.

Workers AI Pricing

50+ models running at the edge. View AI pricing details

Neurons

Free

Paid

$0.011 / thousand neurons

Shopify

"

For Shopify, the real challenge is not about how many different pieces of complex technology we can use but the opposite. Cloudflare helps us find a simple way to achieve something very complex that we can scale and maintain. "

Duncan Davidson
Duncan Davidson VP of Developer Productivity

Powerful primitives, seamlessly integrated

Built on systems powering 20% of the Internet, Workers AI runs on the same infrastructure Cloudflare uses to build Cloudflare. Enterprise-grade reliability, security, and performance are standard.

Construye sin límites

Únete a miles de desarrolladores que han eliminado la complejidad de la infraestructura y han desplegado a nivel mundial con Cloudflare. Empieza a construir de forma gratuita — no se requiere tarjeta de crédito.