26 aprile 2026 4 min read Any AI Studio

Crediti, non token: una decisione di pricing alla luce del sole

Perché abbiamo abbandonato la matematica per provider e per token e spedito un singolo pool di crediti condiviso. L'argomento onesto, i conti che abbiamo fatto e il caso contrario.

prezzi
filosofia

A febbraio abbiamo avuto una lunga discussione interna sul pricing. Due schieramenti: uno voleva girare i costi dei provider con un markup (così l’utente vede «5.000 token input GPT-5 · 2.000 output · $0,043» nella sua dashboard); l’altro voleva un singolo pool di crediti che astraesse i provider.

Abbiamo spedito i crediti. Ecco perché, alla luce del sole, comprese le parti che ci sono sembrate davvero difficili.

Il problema del pass-through a token

Il pricing a token ha perfettamente senso per un servizio single-provider. La dashboard di OpenAI va bene. Quella di Anthropic va bene. Ognuno vende un prodotto con un prezzo unico.

Non appena sei multi-provider, il pricing a token diventa intellettualmente onesto e praticamente inutile:

I token non sono comparabili tra modelli. Un token GPT-5 e un token Claude Opus non sono la stessa unità di lavoro, e il tasso di conversione cambia ogni poche settimane mentre i lab riprezzano. La tua bolletta a fine mese è imprevedibile in un modo che gli utenti single-provider non sperimentano.
Il multi-modale peggiora la cosa. Cos’è un «token» immagine? Un «token» audio? Ogni provider risponde in modo diverso. Cucire tutto in una dashboard unificata significa scegliere una normalizzazione sbagliata per almeno metà dei provider.
La bolletta scoraggia l’esplorazione. Se passare da GPT-5 a Opus per un messaggio cambia il costo mensile previsto di $4, smetti di cambiare. Questo annulla del tutto il senso di uno studio multi-provider.

Durante la beta iniziale ci siamo visti smettere di provare modelli alternativi perché vedevamo il prezzo salire. È l’incentivo sbagliato.

Cosa abbiamo spedito

Un’allowance mensile di crediti per piano — 2.000 su Pro, 10.000 su Max. I crediti sono un pool condiviso. Li spendi in chat, immagini o video, come ti serve nel mese. Il costo per generazione è visibile prima di inviare: apri il selettore di modelli e vedi «Opus 4.7 thinking — 12 crediti stimati per questo turno». Premi invia, il costo si conferma, vai avanti.

Due cose che si comprano così:

Bollette prevedibili. Il tuo costo è $20 o $100, punto. Non puoi ritrovarti per sbaglio con un mese da $400 perché hai parlato molto a Veo.
Niente «conviene cambiare modello?» tax. Cambiare è gratis, perché la contabilità in crediti è identica. Prova Opus sul problema difficile, scendi a Haiku per quelli facili, genera una bozza con Grok Imagine, finalizza con Veo. Lo studio non ti punisce per usare lo strumento giusto.

L’obiezione che abbiamo preso sul serio

L’argomento più forte contro i crediti è la sovvenzione incrociata. Se tu non usi quasi crediti e io brucio 9.000 dei miei in clip 4K Veo, abbiamo pagato gli stessi $20. Mi stai sovvenzionando l’abitudine al video. È reale.

Tre cose ce l’hanno fatto accettare:

La varianza è limitata. Con il tetto a 2.000 crediti su Pro, un utente intenso non può bruciare 50× quanto un utente leggero. Può bruciare 1,5×, forse 2×. Non è una sovvenzione folle — è lo stesso trade-off che assicurazioni e utility fanno da sempre.
La trasparenza sul prezzo chiude il gap. Poiché il costo per generazione è visibile, gli utenti si auto-selezionano sul piano giusto. Lo vediamo nei dati — gli utenti video pesanti finiscono su Max entro il primo mese. Gli utenti leggeri restano su Pro e raramente toccano il tetto.
Gli utenti pesanti hanno una conversazione diversa. Se sfondi costantemente i 10.000 crediti di Max, la risposta giusta non è rendere Pro più caro — è metterci in contatto per un pool enterprise tarato sul tuo carico di lavoro.

Dove non funziona

I crediti sarebbero la scelta sbagliata per un business developer-platform — inference-as-API dove gli utenti instradano traffico di produzione attraverso di noi. Quegli utenti vogliono il pass-through a token perché modellano l’unit economics, e la prevedibilità che offriamo ai consumer è l’imprevedibilità che loro devono ingegnerizzare via.

Non siamo quel business. Siamo un prodotto chat, immagini e video per persone che fanno lavoro creativo e operativo. Forma diversa, risposta giusta diversa sul pricing.

La nota a piè di pagina che avremmo voluto aggiungere prima

Il pezzo che abbiamo sottopesato nel dibattito originale è quanto la cornice crediti cambi il comportamento utente. La gente tratta i token come un tassametro (ansiosa di spegnerlo) e i crediti come un budget (disposta a scendere fino a zero su ciò a cui tiene). Non è una coincidenza — è un pattern noto nel consumer pricing, e ha prodotto esattamente il risultato che volevamo: gli utenti esplorano il catalogo invece di chiudersi in un provider.

Se stavi rimandando un modello perché non eri sicuro di quanto sarebbe costato — apri lo studio, lancialo, guarda il conto crediti. Nel caso peggiore bruci 30 crediti. La matematica deve essere noiosa ora. Questo è il punto.

Hai trovato un refuso o vuoi dissentire? Scrivici .