AI Gateway

Un plano de control inteligente para tus aplicaciones de IA

Conecta a cualquier modelo, rutea dinámicamente las solicitudes y gestiona el uso, la facturación y los registros desde una única puerta de enlace unificada.
Reducir costes y latencia

Facilmente cachear respuestas y reducir llamadas API redundantes — lo que conlleva a ahorros directos en costes.

Mejora la fiabilidad con Controles Dinámicos

Configura cómo y cuándo se invocan las API de los proveedores de modelos según atributos específicos o respaldos.

Añadir Observability

Habilita insights de uso ricos, como recuentos de tokens, rendimiento del prompt y análisis de patrones.

Enrutamiento dinámico

Automáticamente enrutar solicitudes según la latencia, el costo o la disponibilidad. Ajustar reglas de inmediato desde el panel de control o la API — sin redespliegues, sin tiempos de inactividad.

Capacidades principales

Background Pattern
Rendimiento de la red global

Construido sobre la infraestructura de Cloudflare. Asegura un acceso con baja latencia, distribuido a nivel mundial, con escalabilidad automática y seguridad integrada.

Background Pattern
Caching

Reduce llamadas a la API redundantes. Ahorra dinero y mejora el tiempo de respuesta almacenando y reutilizando automáticamente solicitudes frecuentes.

Background Pattern
Observabilidad incorporada

Registros, métricas y análisis de uso. Incluye enrutamiento de respaldo, limitación de velocidad y medidas de seguridad para gestionar el coste, el comportamiento y el cumplimiento en múltiples proveedores.

Background Pattern
Controles de seguridad y barandillas de seguridad

Protege tus aplicaciones de IA de filtrar o enviar información confidencial. Protege tu aplicación de IA de tráfico malicioso sin necesidad de configurar o mantener nada adicional.

Background Pattern
Facturación Unificada

Gestiona todos tus gastos con una sola factura sencilla y accede a cada proveedor a través de una sola API. Invierte menos tiempo en la gestión y más tiempo en el envío.

Background Pattern
AI Gateway

Construido para el Control de Aplicación IA

Puedes usar AI Gateway para:

View docs

Reducir la latencia y el costo de las apps de IA mediante el caché de las respuestas de la API

Optimiza el rendimiento de tu aplicación de inteligencia artificial y reduce costos mediante el caché inteligente de las respuestas de los proveedores de inteligencia artificial.

Analytics de uso — monitoreo del rendimiento de las solicitudes, recuentos de tokens y comportamiento

Obtén una visión profunda de tus patrones de uso de IA, consumo de tokens y rendimiento de los prompts en todos los proveedores.

Crear tableros personalizados y sistemas de alerta directamente desde los registros de AI Gateway

Crea sistemas completos de monitoreo y alertas utilizando los datos detallados de registro y métricas de AI Gateway.

Controla tu infraestructura de IA

Ejemplos que muestran cómo configurar Caching, enrutamiento y monitoreo para cargas de trabajo de IA.

Background Pattern
// wrangler.jsonc
// Simple configuration
{
  "ai": {
    "binding": "AI"
  }
}

// Pass through the Gateway from your Worker with Workers AI
// index.js
const resp = await env.AI.run(
  "@cf/meta/llama-3.1-8b-instruct",
  {
    prompt: "tell me a joke",
  },
  {
    gateway: {
      id: "my-gateway",
    },
  },
);

// Use with OpenAI SDK
import OpenAI from "openai";

const openai = new OpenAI({
  apiKey: "my api key", // defaults to process.env["OPENAI_API_KEY"]
  baseURL: await env.AI.gateway("my-gateway").getUrl("openai"),
});

Rightblogger

Without AI Gateway, it’s difficult to see which applications are driving the majority of the costs with the OpenAI API … We can choose to limit the number of requests used by certain tools to control costs.

Powerful primitives, seamlessly integrated

Built on systems powering 20% of the Internet, AI Gateway runs on the same infrastructure Cloudflare uses to build Cloudflare. Enterprise-grade reliability, security, and performance are standard.

Construye sin límites

Únete a miles de desarrolladores que han eliminado la complejidad de la infraestructura y han desplegado a nivel mundial con Cloudflare. Empieza a construir de forma gratuita — no se requiere tarjeta de crédito.