Créditos, no tokens: una decisión de pricing en abierto
Por qué tiramos la matemática por proveedor y por token y enviamos un pool de créditos compartido. El argumento honesto, las cuentas y la crítica.
- precios
- filosofía
Tuvimos un debate interno largo sobre pricing en febrero. Dos bandos: uno quería trasladar los costes de proveedor con un margen (que el usuario viera «5 000 tokens de input GPT-5 · 2 000 de output · $0,043» en su dashboard); el otro quería un único pool de créditos que abstrajera a los proveedores.
Enviamos créditos. Aquí va el porqué, en abierto, con las partes que encontramos genuinamente difíciles.
El problema del traslado por token
El pricing por token tiene todo el sentido para un servicio de un solo proveedor. El dashboard de OpenAI está bien. El de Anthropic está bien. Cada uno vende un producto con un precio.
En cuanto pasas a multi-proveedor, el pricing por token se vuelve intelectualmente honesto y prácticamente inútil:
- Los tokens no son comparables entre modelos. Un token de GPT-5 y un token de Claude Opus no son la misma unidad de trabajo, y el ratio de conversión cambia cada pocas semanas según los labs ajustan precios. Tu factura a fin de mes es impredecible de una forma que un usuario monoproveedor no experimenta.
- Multimodal lo empeora. ¿Qué es un «token» de imagen? ¿Uno de audio? Cada proveedor responde distinto. Coserlo todo en un dashboard unificado obliga a elegir una normalización que está mal para al menos la mitad de los proveedores.
- La factura desincentiva explorar. Si cambiar de GPT-5 a Opus para un solo mensaje cambia tu coste mensual proyectado en $4, dejas de cambiar. Eso anula el sentido entero de un studio multi-proveedor.
Nos vimos a nosotros mismos dejando de probar modelos alternativos en la beta temprana porque veíamos el precio subir. Es el incentivo equivocado.
Lo que enviamos
Una cuota mensual de créditos por plan — 2 000 en Pro, 10 000 en Max. Los créditos son un pool compartido. Los gastas en chat, imagen o vídeo, lo que necesites ese mes. El coste por generación es visible antes de enviar: abre el selector de modelo y ves «Opus 4.7 thinking — 12 créditos estimados para este turno». Pulsas enviar, el coste se confirma, sigues.
Esto te da dos cosas:
- Facturas predecibles. Tu coste es $20 o $100, punto. No puedes acabar accidentalmente con un mes de $400 porque hablaste mucho con Veo.
- Sin impuesto «¿debería cambiar de modelo?». Cambiar es gratis, porque la contabilidad de créditos es idéntica. Prueba Opus en el problema difícil, baja a Haiku en los fáciles, genera un borrador con Grok Imagine, finaliza con Veo. El studio no te castiga por usar la herramienta correcta.
La objeción que nos tomamos en serio
El argumento más fuerte contra los créditos es la subvención cruzada. Si tú apenas usas créditos y yo quemo 9 000 de los míos en clips Veo 4K, ambos pagamos los mismos $20. Estás subvencionando mi hábito de vídeo. Es real.
Tres cosas nos dejaron tranquilos:
- La varianza está acotada. Con un cap de 2 000 créditos en Pro, un usuario intensivo no puede quemar 50× lo que uno ligero. Puede quemar 1,5×, quizá 2×. No es una subvención salvaje — es el mismo trade que los seguros y los servicios públicos llevan haciendo desde siempre.
- La transparencia de precios cierra la brecha. Como el coste por generación es visible, los usuarios se autoseleccionan al plan correcto. Lo vemos en los datos — los usuarios intensivos de vídeo caen mayoritariamente en Max en su primer mes. Los ligeros se quedan en Pro y rara vez tocan el cap.
- Los usuarios intensivos tienen otra conversación. Si pasas consistentemente los 10 000 créditos de Max, la respuesta correcta no es encarecer Pro — es ponerte en contacto con nosotros para un pool enterprise ajustado a tu carga.
Dónde no funciona
Los créditos serían la decisión equivocada para un negocio de plataforma para developers — inference-as-an-API donde los usuarios enrutan tráfico de producción a través de nosotros. Esos usuarios quieren el traslado por token porque están modelando unit economics, y la predictibilidad que damos a los consumidores es la impredictibilidad que necesitan diseñar para evitarla.
No somos ese negocio. Somos un producto de chat, imagen y vídeo para gente que hace trabajo creativo y operativo. Forma distinta, respuesta correcta distinta sobre pricing.
La nota al pie que ojalá hubiéramos añadido antes
Lo que infravaloramos en el debate original es cómo el framing crédito cambia el comportamiento del usuario. La gente trata los tokens como un contador (ansiosa por apagarlo) y los créditos como un presupuesto (dispuesta a gastarlo hasta cero en cosas que le importan). No es coincidencia — es un patrón conocido en pricing al consumidor, y produjo exactamente el resultado que queríamos: los usuarios exploran el catálogo en vez de atarse a un proveedor.
Si llevas tiempo aplazando un modelo porque no sabías cuánto te iba a costar — abre el studio, dispáralo, mira el contador de créditos. En el peor caso quemas 30 créditos. La matemática se supone que ya es aburrida. Ese es el punto.
¿Has visto una errata o quieres replicar? Escríbenos .