Crédits, pas tokens : une décision tarifaire à voix haute
Pourquoi on a abandonné le calcul par fournisseur et par token au profit d’un seul pool de crédits partagé. L’argument honnête, les calculs, et le contre-argument.
- tarifs
- philosophie
On a eu un long débat interne sur le prix en février. Deux camps : l’un voulait répercuter les coûts fournisseur avec une marge (l’utilisateur verrait « 5 000 tokens GPT-5 en entrée · 2 000 en sortie · $0,043 » dans son dashboard) ; l’autre voulait un pool unique de crédits qui abstrait les fournisseurs.
On a livré les crédits. Voici pourquoi, à voix haute, avec les parties qu’on a trouvées vraiment difficiles.
Le problème du pass-through au token
Le prix au token a tout son sens pour un service mono-fournisseur. Le dashboard d’OpenAI va bien. Celui d’Anthropic va bien. Chacun vend un produit tarifé d’une seule façon.
Dès qu’on est sur plusieurs fournisseurs, le prix au token devient intellectuellement honnête et pratiquement inutile :
- Les tokens ne sont pas comparables d’un modèle à l’autre. Un token GPT-5 et un token Claude Opus ne sont pas la même unité de travail, et le taux de conversion change toutes les quelques semaines au gré des re-tarifications. Votre facture en fin de mois est imprévisible d’une manière que les utilisateurs mono-fournisseur ne vivent pas.
- Le multimodal aggrave les choses. C’est quoi, un « token » image ? Un « token » audio ? Chaque fournisseur répond différemment. Recoller tout ça dans un dashboard unifié, c’est choisir une normalisation qui est fausse pour au moins la moitié des fournisseurs.
- La facture décourage l’exploration. Si basculer de GPT-5 vers Opus pour un message change votre coût mensuel projeté de $4, vous arrêtez de basculer. Ça défait tout l’intérêt d’un studio multi-fournisseurs.
On s’est surpris à arrêter de tester d’autres modèles pendant la beta parce qu’on voyait le prix grimper. C’est la mauvaise incitation.
Ce qu’on a livré
Une allocation mensuelle de crédits par palier — 2 000 sur Pro, 10 000 sur Max. Les crédits sont un pool partagé. Vous les dépensez en chat, image ou vidéo, selon vos besoins du mois. Le coût par génération est visible avant l’envoi : ouvrez le sélecteur de modèles et vous voyez « Opus 4.7 thinking — 12 crédits estimés pour ce tour ». Envoyez, le coût se confirme, vous continuez.
Deux choses que ça achète :
- Des factures prévisibles. Votre coût est $20 ou $100, point. Vous ne pouvez pas accidentellement empiler un mois à $400 parce que vous avez beaucoup parlé à Veo.
- Pas de « taxe au changement de modèle ». Basculer est gratuit, parce que la comptabilité crédit est identique. Essayez Opus sur le problème dur, descendez sur Haiku pour les faciles, générez un brouillon avec Grok Imagine, finalisez avec Veo. Le studio ne punit pas le choix du bon outil.
L’objection qu’on a prise au sérieux
L’argument le plus fort contre les crédits est la subvention croisée. Si vous utilisez quasiment aucun crédit et que je brûle 9 000 des miens sur des clips Veo 4K, on a payé les mêmes $20. Vous subventionnez ma consommation vidéo. C’est réel.
Trois choses nous ont rendus à l’aise avec ça :
- La variance est bornée. Avec un plafond de 2 000 crédits sur Pro, un gros utilisateur ne peut pas brûler 50× ce qu’un léger consomme. Il peut brûler 1,5×, peut-être 2×. Ce n’est pas une subvention folle — c’est le même arbitrage que font les assurances et les utilités depuis toujours.
- La transparence du prix réduit l’écart. Comme le coût par génération est visible, les utilisateurs se rangent d’eux-mêmes vers le bon palier. On le voit dans les données — les gros consommateurs vidéo finissent surtout sur Max dans leur premier mois. Les légers restent sur Pro et atteignent rarement leur plafond.
- Les gros consommateurs ont une autre conversation. Si vous dépassez systématiquement les 10 000 crédits de Max, la bonne réponse n’est pas de renchérir Pro — c’est qu’on vous mette en relation avec nous pour un pool entreprise calibré sur votre charge.
Là où ça ne marche pas
Les crédits seraient le mauvais choix pour une plateforme développeurs — inference-as-an-API où les utilisateurs routent du trafic production à travers nous. Ceux-là veulent le pass-through au token parce qu’ils modélisent leur unit economics, et la prévisibilité qu’on offre aux consommateurs est l’imprévisibilité qu’ils doivent éliminer.
On n’est pas cette boîte. On est un produit de chat, d’images et de vidéos pour des gens qui font du travail créatif et opérationnel. Forme différente, bonne réponse différente sur le prix.
La note de bas de page qu’on aurait dû ajouter plus tôt
Ce qu’on avait sous-estimé dans le débat initial, c’est combien le cadrage en crédits change le comportement. Les gens traitent les tokens comme un compteur (l’angoisse de l’éteindre) et les crédits comme un budget (prêts à dépenser jusqu’à zéro sur ce qui leur tient à cœur). Ce n’est pas un hasard — c’est un schéma connu dans le pricing grand public, et ça a produit exactement ce qu’on voulait : les utilisateurs explorent le catalogue au lieu de se verrouiller sur un fournisseur.
Si vous avez retardé l’essai d’un modèle parce que vous ne saviez pas ce qu’il coûterait — ouvrez le studio, lancez, regardez le compteur de crédits. Pire cas, vous brûlez 30 crédits. Le calcul est censé être ennuyeux maintenant. C’est tout l’intérêt.
Une coquille ou un désaccord ? Écrivez-nous .