# Cómo funciona el precio de las APIs de LLM
Las APIs de modelos de lenguaje cobran en función del uso de tokens, no por tiempo ni por petición. Cada llamada tiene dos costes: el coste de entrada (procesar tu prompt) y el coste de salida (generar la respuesta). Entender esta diferencia es clave para estimar con precisión tu factura mensual.# Tokens de entrada frente a tokens de salida
Tokens de entrada
Los tokens de entrada representan todo lo que se envía al modelo: tu prompt de sistema, el historial de conversación y el mensaje del usuario. Son más baratos porque el modelo los procesa en paralelo. Un prompt de sistema típico de 200 palabras genera aproximadamente 267 tokens de entrada.
Tokens de salida
Los tokens de salida se generan uno a uno de forma secuencial, lo que los hace computacionalmente más costosos. La mayoría de los proveedores cobran entre 3 y 5 veces más por los tokens de salida. Una respuesta de 300 palabras genera aproximadamente 400 tokens de salida. Mantener las respuestas concisas es una de las estrategias de ahorro más efectivas.
# Elegir el modelo adecuado para tu presupuesto
GPT-4o mini o Gemini 1.5 Flash y solo escala si la calidad no es suficiente. La diferencia de coste entre un modelo pequeño y uno grande puede ser de 10 a 100 veces. claude-3-opus o o1 para razonamientos complejos donde la calidad afecta directamente al resultado.