點數,不是 token:公開的定價決策
為什麼我們捨棄按供應商、按 token 計費,改成單一共用點數池。誠實的論點、我們算過的數學,以及反對的理由。
- 定價
- 理念
我們在二月時內部對定價吵了很久。兩派:一派想把供應商成本加價後轉嫁(使用者在儀表板上會看到「5,000 GPT-5 輸入 token · 2,000 輸出 · $0.043」);另一派想做一個把供應商抽象掉的單一點數池。
我們最後選了點數。以下公開說明原因,包含我們覺得真正困難的部分。
Token 轉嫁的問題
Token 計費對單一供應商的服務完全合理。OpenAI 自己的儀表板沒問題。Anthropic 自己的儀表板沒問題。他們各自賣一個產品,用一種方式定價。
但只要跨供應商,token 計費就會變成「理論上誠實、實務上沒用」:
- **不同模型的 token 不能比。**GPT-5 的 token 和 Claude Opus 的 token 不是同一個工作單位,而且各家實驗室每幾週就會重新定價,換算比例會變。月底的帳單變得難以預估,這是單一供應商使用者不會遇到的。
- **多模態讓事情更糟。**圖像的「token」是什麼?聲音的「token」是什麼?每家供應商答案都不同。把這些拼成統一儀表板,等於選一個對至少一半供應商都錯誤的正規化方式。
- **帳單會打擊探索。**如果為了一則訊息從 GPT-5 切到 Opus 會讓你預估月費上升 $4,你就會停止切換。這正好抵銷了多供應商工作室的整個意義。
我們自己在早期 beta 階段就看到,因為價格在跳,就會停止嘗試替代模型。這是錯的誘因。
我們做了什麼
按方案配每月點數額度 — Pro 2,000 點,Max 10,000 點。點數是共用池。你想花在聊天、圖像或影片都行,看當月需要什麼。每次生成的成本在「送出前」就看得見:打開模型挑選器你會看到「Opus 4.7 thinking — 本輪估計 12 點」。按下送出,成本確認,繼續工作。
這買到兩件事:
- **可預測的帳單。**你的成本就是 $20 或 $100,到此為止。你不會因為某個月跟 Veo 聊太多就意外冒出 $400 的帳單。
- **沒有「該不該切模型」的稅。**切換是免費的,因為點數會計是一致的。難題用 Opus,簡單的問題降到 Haiku,用 Grok Imagine 出草稿,再用 Veo 收尾。工作室不會懲罰你用對的工具。
我們認真看待的反對意見
對點數最強的反對就是「交叉補貼」。如果你幾乎沒用點數,而我把 9,000 點都燒在 Veo 4K 上,我們付的都是 $20。你在補貼我的影片癖好。這是真的。
讓我們接受的理由有三個:
- **變異是有界的。**Pro 2,000 點上限下,重度使用者再怎麼燒也不會是輕度使用者的 50 倍。最多 1.5 倍、頂多 2 倍。這不是誇張的補貼 — 保險與公用事業一直在做同樣的權衡。
- **價格透明縮小差距。**因為每次生成的成本看得見,使用者會自己選對的方案。從數據上看 — 重度影片使用者大多在第一個月內就轉到 Max。輕度使用者留在 Pro 而很少打到上限。
- **重度使用者該有不同的對話。**如果你一直突破 Max 的 10,000 點,正確答案不是把 Pro 提價 — 是讓你跟我們聯絡,量身做企業點數池。
哪些情境不適用
點數對開發者平台的生意是錯的選擇 — 也就是把推論當 API 賣,使用者用我們路由生產流量的那種。那些使用者「想要」按 token 轉嫁,因為他們在算單位經濟,我們給消費者的可預測性正是他們需要去工程化掉的不可預測性。
我們不是那種生意。我們是給創意與營運工作者用的聊天、圖像、影片產品。形狀不同,定價的正確答案也不同。
我們希望當初就該加上的補註
當初辯論時被低估的,是「點數」這個框架對使用者行為的影響。人對待 token 像對待碼錶(焦慮著想關掉),對待點數像對待預算(願意把它花光在自己在乎的事情上)。這不是巧合 — 這是消費者定價中已知的模式,而且產生了我們想要的結果:使用者去探索整個型錄,而不是鎖死一家供應商。
如果你一直因為不確定成本而沒去用某款模型 — 打開工作室,丟給它,看一下點數。最糟情況就是燒掉 30 點。數學現在應該很無聊。這就是重點。
發現錯字或想反駁? 來信 。