أرصدة لا توكنات: قرار تسعير في العلن
لماذا تخلّينا عن حسابات التوكن لكل مزوّد وأطلقنا مجمّع أرصدة مشترك. الحجّة الصريحة، الحسابات التي أجريناها، والحجّة المضادّة.
- الأسعار
- فلسفة
كان لدينا نقاش داخلي طويل حول التسعير في فبراير. معسكران: الأوّل أراد تمرير تكاليف المزوّدين مع هامش (فيرى المستخدم في لوحته «5,000 توكن إدخال GPT-5 · 2,000 إخراج · $0.043»)؛ الثاني أراد مجمّع أرصدة واحدًا يجرّد المزوّدين بعيدًا.
أطلقنا الأرصدة. إليك السبب، في العلن، مع الأجزاء التي وجدناها صعبة فعلًا.
مشكلة تمرير التوكن
تسعير التوكن منطقي تمامًا لخدمة بمزوّد واحد. لوحة OpenAI نفسها كافية. لوحة Anthropic كافية. كلٌّ منهما يبيع منتجًا واحدًا بسعر واحد.
لحظة تتعدّى المزوّدين، يصبح تسعير التوكن صادقًا فكريًّا وعديم الفائدة عمليًّا:
- التوكنات ليست قابلة للمقارنة بين النماذج. توكن GPT-5 وتوكن Claude Opus ليسا نفس الوحدة من العمل، ومعدّل التحويل يتغيّر كل بضعة أسابيع مع إعادة تسعير المختبرات. فاتورتك في نهاية الشهر غير قابلة للتنبّؤ بشكل لا يعرفه مستخدمو المزوّد الواحد.
- متعدّد الوسائط يفاقمها. ما «توكن» الصورة؟ ما «توكن» الصوت؟ كل مزوّد يجيب مختلفًا. خياطة كل ذلك في لوحة موحّدة يعني اختيار معامل تطبيع خطأ لنصف المزوّدين على الأقلّ.
- الفاتورة تثبّط الاستكشاف. إن كان التحوّل من GPT-5 إلى Opus لرسالة واحدة يغيّر تكلفتك الشهرية المتوقّعة بـ $4، تتوقّف عن التحوّل. وهذا يلغي كل الهدف من استوديو متعدّد المزوّدين.
شاهدنا أنفسنا نتوقّف عن تجربة نماذج بديلة في البيتا المبكّر لأن الأرقام كانت تصعد. تلك حافزية خاطئة.
ما الذي أطلقناه
حصّة أرصدة شهرية لكل باقة — 2,000 في Pro، 10,000 في Max. الأرصدة مجمّع مشترك. تنفقها على المحادثة أو الصور أو الفيديو، أيًّا كان ما تحتاجه ذلك الشهر. التكلفة لكل توليد مرئية قبل الإرسال: افتح منتقي النماذج وترى «Opus 4.7 thinking — تقدير 12 رصيدًا لهذا الدور». اضغط إرسال، تتأكّد التكلفة، تكمل.
شيئان يكسبهما هذا:
- فواتير قابلة للتنبّؤ. تكلفتك $20 أو $100، انتهى. لا يمكنك أن تتراكم عليك $400 لأنك تحدّثت كثيرًا مع Veo.
- بلا ضريبة «هل أبدّل النموذج». التبديل مجّاني لأن محاسبة الأرصدة متطابقة. جرّب Opus على المشكلة الصعبة، انزل إلى Haiku للسهلة، ولّد مسوّدة بـ Grok Imagine، وأنهِ بـ Veo. الاستوديو لا يعاقبك على استخدام الأداة الصحيحة.
الاعتراض الذي أخذناه بجدّية
الحجّة الأقوى ضدّ الأرصدة هي الدعم المتبادل. إن استخدمتَ القليل وأنا أحرقت 9,000 من أرصدتي على مقاطع Veo 4K، دفعنا نفس $20. أنت تدعم عادتي مع الفيديو. هذا حقيقي.
ثلاثة أشياء جعلتنا نقبل بهذا:
- التباين محدود. بسقف 2,000 رصيد في Pro، المستخدم الكثيف لا يستطيع حرق 50x ما يحرقه الخفيف. يستطيع 1.5x، ربما 2x. ليس دعمًا جامحًا — هو نفس المقايضة التي يعقدها التأمين والمرافق منذ زمن.
- شفافية التسعير تضيّق الفجوة. لأن تكلفة كل توليد مرئية، المستخدمون يختارون الباقة المناسبة. نرى هذا في البيانات — مستخدمو الفيديو الكثيفون ينتقلون إلى Max خلال أوّل شهر. الخفيفون يبقون على Pro ونادرًا ما يصلون السقف.
- المستخدمون الكثيفون يستحقّون حديثًا مختلفًا. إن كنت تتجاوز باستمرار 10,000 رصيد في Max، فالجواب الصحيح ليس رفع سعر Pro — بل أن نتواصل معك لمجمّع enterprise مضبوط على عبء عملك.
حيث لا يعمل هذا
الأرصدة قرار خاطئ لشركة منصّة مطوّرين — inference-as-an-API حيث يوجّه المستخدمون حركة إنتاج عبرنا. هؤلاء يريدون تمرير التوكن لأنهم يصمّمون اقتصاديات الوحدة، والقابلية للتنبّؤ التي نقدّمها للمستهلكين هي عدم القابلية للتنبّؤ التي يحتاجون هندستها بعيدًا.
نحن لسنا تلك الشركة. نحن منتج محادثة وصور وفيديو لمن يقومون بعمل إبداعي وتشغيلي. شكل مختلف، إجابة مختلفة على التسعير.
الحاشية التي تمنّينا إضافتها أبكر
ما قلّلنا من وزنه في النقاش الأصلي هو كيف يغيّر تأطير الأرصدة سلوك المستخدم. الناس يعاملون التوكنات كعدّاد (قلقون من إيقافه) والأرصدة كميزانية (مستعدّون لإنفاقها على ما يهمّهم). ليست صدفة — نمط معروف في تسعير المستهلك، وأنتج بالضبط ما أردنا: المستخدمون يستكشفون الكتالوج بدل التحصّن في مزوّد واحد.
إن كنت ممتنعًا عن نموذج لأنك لم تكن متأكّدًا من تكلفته — افتح الاستوديو، اضغطه، انظر عدّاد الأرصدة. أسوأ الأحوال تحرق 30 رصيدًا. المفترض أن تكون الحسابات مملّة الآن. هذا هو الهدف.
وجدت خطأً أو تريد الاعتراض؟ راسلنا .