トークンではなく、クレジット:公開で決めた料金の話
プロバイダーごと・トークンごとの計算をやめ、共有クレジットプールを採用した理由。正直な議論、検討した計算、そして反対意見。
- 料金
- 考え方
2 月、社内で長い料金議論をしました。2 派に分かれて:1 派はプロバイダー原価にマージンを乗せて通す(ダッシュボードで「GPT-5 入力 5,000 トークン · 出力 2,000 · $0.043」と見える)案。もう 1 派はプロバイダーを抽象化する単一クレジットプール案。
私たちはクレジット案を出荷しました。なぜか、公開で、本当に難しかった部分も含めて書きます。
トークン課金の問題
トークン課金は単一プロバイダーのサービスでは完璧に筋が通ります。OpenAI のダッシュボードは問題なし。Anthropic のダッシュボードも問題なし。それぞれ 1 つの製品を 1 つの値付けで売っているからです。
複数プロバイダーをまたいだ瞬間、トークン課金は知的に誠実で実務的に役立たずになります:
- **トークンはモデル間で可換ではない。**GPT-5 のトークンと Claude Opus のトークンは同じ仕事の単位ではなく、ラボの再価格設定で換算レートが数週間ごとに動きます。月末の請求が、単一プロバイダーのユーザーには起きない予測不能さで揺れます。
- **マルチモーダルでさらに悪化。**画像「トークン」とは?音声「トークン」とは?プロバイダーごとに答えが違います。統一ダッシュボードにまとめるには、半分以上のプロバイダーに合わない正規化を選ぶしかありません。
- **請求が試行錯誤を抑えつける。**1 通だけ GPT-5 から Opus に切り替えるだけで月予想コストが $4 動くなら、切り替えをやめます。これではマルチプロバイダースタジオの存在意義が消えます。
初期ベータで、料金がチクチク上がるのを見て自分たち自身が他モデルを試さなくなっていました。それは逆向きのインセンティブです。
出荷したもの
ティアごとの月間クレジット枠 — Pro は 2,000、Max は 10,000。クレジットは共有プール。チャット・画像・動画のうち、その月に必要なものに使えます。生成ごとの消費量は送信 前 に見える:モデルピッカーを開けば「Opus 4.7 thinking — このターン推定 12 クレジット」と表示。送信ボタンを押し、コストが確定、次へ進む。
これで 2 つ得られます:
- **請求が読める。**料金は $20 か $100、それだけ。Veo を喋りすぎて 1 か月 $400 を「うっかり」払うことはあり得ません。
- **「モデル切り替え税」がない。**切り替えは無料、クレジット計算が同じだからです。難問は Opus、楽な質問は Haiku、ドラフトは Grok Imagine、最終仕上げは Veo。スタジオは適材適所を罰しません。
真剣に受け止めた反論
クレジット制の最強の反論は、相互補助 です。私が Veo 4K で 9,000 クレジット消費し、あなたがほとんど使わない場合、同じ $20 を払っています。あなたが私の動画習慣を補助している。これは事実です。
3 点で受け入れることにしました:
- **ばらつきには上限がある。**Pro の 2,000 クレジット上限により、ヘビーユーザーがライトユーザーの 50 倍使うことはあり得ない。1.5 倍、せいぜい 2 倍です。野放図な補助ではありません — 保険や公共料金が昔からやってきた取引と同じ。
- **価格透明性がギャップを埋める。**生成ごとのコストが見えるので、ユーザーは自分で適切なティアを選びます。データもそう示しています — 動画のヘビーユーザーは初月のうちにほぼ Max に着地、ライトユーザーは Pro に留まり上限にもめったに触れません。
- **ヘビーユーザーには別の対話。**Max の 10,000 クレジットを常に超えるなら、正解は Pro を値上げすることではなく — ワークロードに合わせた Enterprise プールについて私たちと話していただくことです。
どこで成り立たないか
クレジット制は、開発者向けプラットフォーム事業 — ユーザーが本番トラフィックを経由させる inference-as-an-API — では誤った判断になります。そうしたユーザーはユニットエコノミクスをモデリングしているので、トークンパススルーを 望みます。私たちが消費者向けに提供する予測可能性は、エンジニアリングで取り除きたい不確実性そのものなのです。
私たちはその事業ではありません。クリエイティブと業務を回す人のための、チャット・画像・動画プロダクトです。形が違えば、料金の正解も違います。
後から付け足したかった脚注
最初の議論で過小評価していたのは、クレジット というフレーミングがユーザー行動を変えること。人はトークンをメーター(早く止めたい)として扱い、クレジットを予算(気にする対象にはゼロまで使い切ってよい)として扱います。これは偶然ではなく — 消費者向け価格設定で既知のパターンで、まさに私たちが望んだ結果を生みました:ユーザーは特定プロバイダーに固定されず、カタログを試します。
コストが分からなくてあるモデルを試せずにいたなら — スタジオを開き、押してみて、クレジットカウンターを見てください。最悪でも 30 クレジット消費するだけ。計算は退屈になるはずです。それが狙いです。
誤字を見つけた、または意見を寄せたい? メールしてください 。