Credits, nicht Tokens: eine Preisentscheidung im Offenen
Warum wir Pro-Anbieter-Pro-Token-Mathe abgeschafft und einen geteilten Credit-Pool ausgeliefert haben. Das ehrliche Argument, die Mathe dahinter und die Gegenposition.
- Pricing
- Philosophie
Wir hatten im Februar eine lange interne Debatte zu Preisen. Zwei Lager: das eine wollte Anbieterkosten mit Aufschlag durchreichen (Nutzer sehen „5.000 GPT-5 Input-Tokens · 2.000 Output · $0,043” im Dashboard); das andere wollte einen einzigen Credit-Pool, der die Anbieter wegabstrahiert.
Wir haben Credits ausgeliefert. Hier ist warum, offen, mit den Teilen, die wir wirklich schwer fanden.
Das Problem mit Token-Durchreichung
Token-Pricing ergibt für einen Single-Provider-Dienst totalen Sinn. OpenAIs eigenes Dashboard ist okay. Anthropics eigenes Dashboard ist okay. Jeder verkauft ein Produkt zu einem Preis.
Sobald du anbieterübergreifend bist, wird Token-Pricing intellektuell ehrlich und praktisch unbrauchbar:
- Tokens sind nicht modellübergreifend vergleichbar. Ein GPT-5-Token und ein Claude-Opus-Token sind nicht dieselbe Arbeitseinheit, und die Wechselrate ändert sich alle paar Wochen, wenn die Labs neu bepreisen. Deine Monatsrechnung ist unvorhersehbar auf eine Weise, die Single- Provider-Nutzer nicht erleben.
- Multimodal macht es schlimmer. Was ist ein Bild-„Token”? Ein Audio-„Token”? Jeder Anbieter antwortet anders. Das in ein einheitliches Dashboard zu nähen heißt, eine Normalisierung zu wählen, die für mindestens die Hälfte der Anbieter falsch ist.
- Die Rechnung entmutigt Exploration. Wenn ein Wechsel von GPT-5 zu Opus für eine Nachricht deine Monatsprognose um $4 ändert, hörst du auf zu wechseln. Das untergräbt den ganzen Punkt eines Multi-Provider- Studios.
Wir haben uns selbst dabei beobachtet, in der frühen Beta alternative Modelle nicht mehr zu probieren, weil wir den Preis ticken sahen. Das ist der falsche Anreiz.
Was wir ausgeliefert haben
Ein monatliches Credit-Kontingent pro Tarif — 2.000 bei Pro, 10.000 bei Max. Credits sind ein geteilter Pool. Du gibst sie für Chat, Bild oder Video aus, je nachdem was der Monat verlangt. Die Kosten pro Generierung sind vor dem Senden sichtbar: öffne den Modell-Picker und du siehst „Opus 4.7 thinking — geschätzt 12 Credits für diesen Turn”. Senden, Kosten bestätigt, weiter.
Zwei Dinge bringt das:
- Vorhersehbare Rechnungen. Deine Kosten sind $20 oder $100, Punkt. Du kannst keinen $400-Monat versehentlich anhäufen, weil du viel mit Veo geredet hast.
- Keine „soll ich Modelle wechseln”-Steuer. Wechseln ist gratis, weil die Credit-Buchhaltung identisch ist. Probier Opus am schweren Problem, fall auf Haiku bei einfachen zurück, generiere einen Entwurf mit Grok Imagine, finalisiere mit Veo. Das Studio bestraft dich nicht dafür, das richtige Werkzeug zu wählen.
Der Einwand, den wir ernst nahmen
Das stärkste Argument gegen Credits ist Quersubventionierung. Wenn du fast keine Credits nutzt und ich 9.000 meiner durch Veo-4K-Clips jage, haben wir beide $20 gezahlt. Du subventionierst meine Videogewohnheit. Das ist real.
Drei Dinge ließen uns damit leben:
- Die Varianz ist begrenzt. Mit einem 2.000-Credit-Cap auf Pro kann ein Heavy User nicht das 50-fache eines Light Users verbrennen. Er kann das 1,5-fache verbrennen, vielleicht 2-fache. Das ist keine wilde Subvention — es ist derselbe Handel, den Versicherungen und Versorger seit jeher machen.
- Preistransparenz schließt die Lücke. Weil die Kosten pro Generierung sichtbar sind, selektieren sich Nutzer zum richtigen Tarif. Wir sehen das in den Daten — Heavy Video User landen meist innerhalb des ersten Monats auf Max. Light User bleiben auf Pro und treffen ihren Cap selten.
- Heavy User bekommen ein anderes Gespräch. Wenn du Max’ 10.000 Credits konsequent sprengst, ist die richtige Antwort nicht, Pro teurer zu machen — sondern dich mit uns zu verbinden, für einen Enterprise-Pool, der auf deine Last abgestimmt ist.
Wo es nicht funktioniert
Credits wären für ein Developer-Platform-Geschäft falsch — Inference-as- an-API, wo Nutzer Produktionstraffic durch uns routen. Die wollen Pro-Token-Durchreichung, weil sie Unit Economics modellieren, und die Vorhersehbarkeit, die wir Konsumenten bieten, ist die Unvorhersehbarkeit, die sie wegtechnisieren müssen.
Wir sind nicht dieses Geschäft. Wir sind ein Chat-, Bild- und Videoprodukt für kreative und operative Arbeit. Andere Form, andere richtige Antwort bei Preisen.
Die Fußnote, die wir früher hätten hinzufügen sollen
Was wir in der Originaldebatte untergewichtet haben: wie Credit-Framing Nutzerverhalten ändert. Leute behandeln Tokens wie einen Zähler (ängstlich ihn abzustellen) und Credits wie ein Budget (bereit, es für Dinge auf null zu fahren, die ihnen wichtig sind). Das ist kein Zufall — es ist ein bekanntes Muster im Consumer-Pricing, und es produzierte genau das Ergebnis, das wir wollten: Nutzer erkunden den Katalog, statt sich bei einem Anbieter festzubeißen.
Wenn du ein Modell gemieden hast, weil du dir bei den Kosten unsicher warst — öffne das Studio, drück drauf, sieh auf den Credit-Stand. Im schlimmsten Fall verbrennst du 30 Credits. Die Mathe soll jetzt langweilig sein. Das ist der Punkt.
Tippfehler entdeckt oder anderer Meinung? Schreib uns .