Calculadora de Costes de LLMs. Estimador de Precios de APIs de IA

Modelo LLM

Tokens Entrada

~750 palabras

Tokens Salida

~375 palabras

Número de Peticiones

Coste por Petición

$0.00

x 1,000

Coste Total Estimado

$0.00

Input Output

Preguntas Frecuentes

¿Cómo se calcula el coste de una API de LLM?

Las APIs de LLM cobran de forma separada por los tokens de entrada (el prompt) y los tokens de salida (la respuesta). El coste total por petición es: (tokens entrada × precio entrada + tokens salida × precio salida) / 1.000.000. Multiplica por el número de peticiones para obtener el coste mensual total.

¿Qué son los tokens y cómo se relacionan con las palabras?

Un token es la unidad básica de texto que procesa un modelo de lenguaje. En promedio, 1 token equivale a aproximadamente 0,75 palabras en inglés, es decir, 1.000 tokens ≈ 750 palabras. Los precios se indican por millón de tokens ($/1M), que es la unidad estándar en todos los proveedores.

¿Por qué los tokens de salida son más caros que los de entrada?

Generar texto (salida) requiere que el modelo calcule cada token de forma secuencial, lo cual es computacionalmente más costoso que leer la entrada. La mayoría de los proveedores cobran entre 3 y 5 veces más por los tokens de salida que por los de entrada.

¿Cómo puedo reducir los costes de la API de un LLM?

Usa el modelo más pequeño que cumpla tus requisitos de calidad. Cachea los prompts repetidos cuando sea posible. Minimiza la longitud del prompt de sistema y evita contexto innecesario. Para tareas simples de clasificación o extracción, modelos más pequeños como GPT-4o mini o Gemini Flash ofrecen un ahorro significativo.

# Cómo funciona el precio de las APIs de LLM

Las APIs de modelos de lenguaje cobran en función del uso de tokens, no por tiempo ni por petición. Cada llamada tiene dos costes: el coste de entrada (procesar tu prompt) y el coste de salida (generar la respuesta). Entender esta diferencia es clave para estimar con precisión tu factura mensual.

# Tokens de entrada frente a tokens de salida

Tokens de entrada

Los tokens de entrada representan todo lo que se envía al modelo: tu prompt de sistema, el historial de conversación y el mensaje del usuario. Son más baratos porque el modelo los procesa en paralelo. Un prompt de sistema típico de 200 palabras genera aproximadamente 267 tokens de entrada.

Tokens de salida

Los tokens de salida se generan uno a uno de forma secuencial, lo que los hace computacionalmente más costosos. La mayoría de los proveedores cobran entre 3 y 5 veces más por los tokens de salida. Una respuesta de 300 palabras genera aproximadamente 400 tokens de salida. Mantener las respuestas concisas es una de las estrategias de ahorro más efectivas.

# Elegir el modelo adecuado para tu presupuesto

Empieza con un modelo de gama media como GPT-4o mini o Gemini 1.5 Flash y solo escala si la calidad no es suficiente. La diferencia de coste entre un modelo pequeño y uno grande puede ser de 10 a 100 veces.

No todas las tareas requieren el mismo nivel de modelo. Las tareas de clasificación, extracción y resumen suelen funcionar bien con modelos más pequeños y económicos. Reserva los modelos más grandes como claude-3-opus o o1 para razonamientos complejos donde la calidad afecta directamente al resultado.

Mis mejores utilidades, ahora en tu móvil.

Calculadora de Costes de LLMs. Estimador de Precios de APIs de IA

Coste por Petición

Coste Total Estimado

¿Quieres tener esta utilidad en tu web?

Preguntas Frecuentes

# Cómo funciona el precio de las APIs de LLM

# Tokens de entrada frente a tokens de salida

Tokens de entrada

Tokens de salida

# Elegir el modelo adecuado para tu presupuesto

Referencias Bibliográficas

Más utilidades de Desarrollo Web

Formateador y Validador JSON Online Gratuito

Convertidor de SVG a CSS y Data URI. Optimización Web

Calculadora de Aspect Ratio a Píxeles. Proporciones Online

Generador de Imágenes Placeholder. Mockups Rápidos Online

Codificador y Decodificador de URLs Online

Eliminador de CSS Duplicado Online. Unifica y Limpia Estilos

Convertidor de CSS Externo a Inline HTML. Inliner para Emails

Calculadora de Especificidad CSS Online. Visualizador de Peso

Generador de Expresiones Cron Online. Traductor y Visualizador

Visualizador de Códigos de Teclado Online. KeyCode Inspector

Escalador de Tipografía Musical. Calculadora de Escala Modular

Generador de Mockups para App Store. iPhone y Google Pixel

Generador de Hashes de Seguridad Online

Biblioteca de Prompts de IA

Conversor de Color RGB HEX y HSL

Calculadora de Legibilidad Visual WCAG y APCA

Saneador de SVG Online

Generador de Parámetros UTM para Google Analytics

Limpiador de Tracking de URL: Eliminar UTM, FBCLID y GCLID

Inspector de Certificados SSL/TLS Online Ver PEM y CRT

Generador de Security.txt RFC 9116

Calculadora de Tiempo en Datos Impacto de la Velocidad Web

Conversor de Excel y CSV a Tabla HTML Generador de Código