Pular para o conteúdo
Any AI
Abrir app
← Todos os posts
4 min read Any AI Studio

Créditos, não tokens: uma decisão de pricing aberta

Por que abandonamos a matemática por provedor e por token e lançamos um pool único de créditos. O argumento honesto, as contas que fizemos e o caso contra.

  • preços
  • filosofia

Tivemos uma discussão interna longa sobre pricing em fevereiro. Dois campos: um queria repassar os custos do provedor com markup (então o usuário vê “5.000 tokens de input do GPT-5 · 2.000 de output · $0,043” no dashboard); o outro queria um pool único de créditos que abstraísse os provedores.

Lançamos créditos. Aqui está o porquê, aberto, com as partes que achamos genuinamente difíceis.

O problema com pass-through de tokens

Precificação por token faz perfeito sentido para um serviço single-provider. O dashboard da OpenAI é bom. O dashboard da Anthropic é bom. Cada um vende um produto precificado de um jeito.

No momento em que você atravessa provedores, precificação por token se torna intelectualmente honesta e praticamente inútil:

  • Tokens não são comparáveis entre modelos. Um token do GPT-5 e um token do Claude Opus não são a mesma unidade de trabalho, e a taxa de conversão muda a cada poucas semanas conforme os labs reprecificam. Sua fatura no fim do mês é imprevisível de um jeito que usuários single- provider não experimentam.
  • Multimodal piora a coisa. O que é um “token” de imagem? Um “token” de áudio? Cada provedor responde de um jeito. Costurar tudo em um dashboard unificado significa escolher uma normalização que está errada para pelo menos metade dos provedores.
  • A fatura desencoraja exploração. Se trocar de GPT-5 para Opus em uma mensagem muda seu custo mensal projetado em $4, você para de trocar. Isso destrói o ponto inteiro de um studio multi-provedor.

Nós mesmos nos pegamos parando de testar modelos alternativos no beta inicial porque víamos o preço subir. Esse é o incentivo errado.

O que lançamos

Uma cota mensal de créditos por plano — 2.000 no Pro, 10.000 no Max. Créditos são um pool compartilhado. Você gasta em chat, imagem ou vídeo, o que precisar no mês. O custo por geração fica visível antes de enviar: abra o seletor de modelo e você vê “Opus 4.7 thinking — 12 créditos estimados para este turno”. Aperta enviar, o custo confirma, você segue.

Duas coisas que isso compra:

  1. Fatura previsível. Seu custo é $20 ou $100, ponto. Você não acumula um mês de $400 acidentalmente porque conversou demais com o Veo.
  2. Sem imposto de “devo trocar de modelo”. Trocar é grátis, porque a contabilidade de créditos é idêntica. Teste Opus no problema difícil, caia para Haiku nos fáceis, gere um rascunho com Grok Imagine, finalize com Veo. O studio não te pune por usar a ferramenta certa.

A objeção que levamos a sério

O argumento mais forte contra créditos é subsídio cruzado. Se você usa quase nenhum crédito e eu queimo 9.000 dos meus em clipes 4K do Veo, pagamos os mesmos $20. Você está subsidiando meu vício em vídeo. Isso é real.

Três coisas nos fizeram aceitar:

  • A variância é limitada. Com um teto de 2.000 créditos no Pro, um usuário pesado não consegue queimar 50× o que um usuário leve queima. Ele queima 1,5×, talvez 2×. Isso não é um subsídio absurdo — é o mesmo trade que seguros e utilidades fazem há sempre.
  • Transparência de preço fecha a lacuna. Como o custo por geração é visível, usuários se auto-selecionam para o tier certo. Vemos isso nos dados — usuários pesados de vídeo na maioria vão para Max no primeiro mês. Usuários leves ficam no Pro e raramente batem no teto.
  • Usuários pesados têm uma conversa diferente. Se você está consistentemente furando os 10.000 créditos do Max, a resposta certa não é encarecer o Pro — é colocar você em contato conosco para um pool enterprise sintonizado com seu workload.

Onde não funciona

Créditos seriam a escolha errada para um negócio de developer-platform — inference-as-an-API onde usuários estão roteando tráfego de produção por nós. Esses usuários querem pass-through de token porque modelam unit economics, e a previsibilidade que oferecemos a consumidores é a imprevisibilidade que precisam engenhosamente eliminar.

Não somos esse negócio. Somos um produto de chat, imagem e vídeo para pessoas fazendo trabalho criativo e operacional. Forma diferente, resposta diferente sobre pricing.

A nota de rodapé que queríamos ter adicionado antes

A peça que subestimamos no debate original é como o enquadramento de crédito muda o comportamento do usuário. Pessoas tratam tokens como um medidor (ansiosas para desligar) e créditos como um orçamento (dispostas a gastar até zero em coisas que importam). Isso não é coincidência — é um padrão conhecido em pricing de consumo, e produziu exatamente o resultado que queríamos: usuários exploram o catálogo em vez de travar em um provedor.

Se você está adiando um modelo porque não tinha certeza de quanto ia custar — abra o studio, mande, olhe a contagem de créditos. No pior caso, você queima 30 créditos. A matemática deve ser entediante agora. Esse é o ponto.


Achou um erro ou quer discordar? Escreva para nós .

Teste o produto por trás do texto.
studio.

Plano grátis. Sem cartão. Login por Google ou Apple.