Kredyty, nie tokeny: decyzja o cenniku na widoku
Dlaczego porzuciliśmy matematykę per dostawca, per token i wypuściliśmy jedną wspólną pulę kredytów. Uczciwy argument, liczby, które zrobiliśmy, i kontrargumenty.
- cennik
- filozofia
W lutym mieliśmy długą wewnętrzną kłótnię o pricing. Dwa obozy: jeden chciał przenosić koszty dostawców z narzutem (żeby użytkownik widział „5 000 tokenów wejściowych GPT-5 · 2 000 wyjściowych · $0,043” na dashboardzie); drugi chciał jednej puli kredytów, która abstrahuje dostawców.
Wypuściliśmy kredyty. Oto dlaczego, na widoku, z fragmentami, które naprawdę były trudne.
Problem z przenoszeniem tokenów
Pricing tokenowy ma sens dla usługi single-provider. Własny dashboard OpenAI jest okej. Własny dashboard Anthropic jest okej. Każdy z nich sprzedaje jeden produkt wyceniony w jeden sposób.
W momencie, gdy przekraczasz dostawców, pricing tokenowy staje się intelektualnie uczciwy i praktycznie bezużyteczny:
- Tokeny nie są porównywalne między modelami. Token GPT-5 i token Claude Opus to nie ta sama jednostka pracy, a kurs przeliczeniowy zmienia się co kilka tygodni, gdy laby przewalają cenniki. Twój rachunek na koniec miesiąca jest nieprzewidywalny w sposób, którego użytkownicy single-provider nie doświadczają.
- Multimodalność pogarsza sprawę. Co to jest „token” obrazu? „Token” audio? Każdy dostawca odpowiada inaczej. Spinanie wszystkiego w jednym dashboardzie wymaga normalizacji, która jest błędna dla co najmniej połowy dostawców.
- Rachunek zniechęca do eksploracji. Jeśli przełączenie z GPT-5 na Opus dla jednej wiadomości zmienia twoją prognozowaną comiesięczną fakturę o $4, przestajesz się przełączać. To przekreśla cały sens studia multi-provider.
Sami złapaliśmy się na tym, że w trakcie wczesnej bety przestawaliśmy próbować alternatywnych modeli, bo widzieliśmy, że cena rośnie. To zła motywacja.
Co wypuściliśmy
Miesięczny przydział kredytów per tier — 2 000 na Pro, 10 000 na Max. Kredyty to wspólna pula. Wydajesz je na czat, obraz lub wideo — to, czego potrzebujesz w danym miesiącu. Koszt per generacja jest widoczny przed wysłaniem: otwierasz selektor modelu i widzisz „Opus 4.7 thinking — szacowane 12 kredytów na tę turę”. Klikasz wyślij, koszt się potwierdza, idziesz dalej.
To kupuje dwie rzeczy:
- Przewidywalne rachunki. Twój koszt to $20 lub $100, kropka. Nie nabijesz przypadkiem miesiąca za $400, bo akurat dużo gadałeś z Veo.
- Brak podatku za „czy mam przełączyć model”. Przełączanie jest darmowe, bo księgowanie kredytów jest identyczne. Wypróbuj Opus na trudnym problemie, zejdź na Haiku w łatwych, wygeneruj draft w Grok Imagine, sfinalizuj w Veo. Studio nie karze cię za używanie właściwego narzędzia.
Argument, który potraktowaliśmy poważnie
Najmocniejszy argument przeciw kredytom to cross-subsydiowanie. Jeśli używasz prawie zero kredytów, a ja palę 9 000 swoich na klipy Veo 4K, zapłaciliśmy te same $20. Ty subsydiujesz mój wideo-nawyk. To prawda.
Trzy rzeczy nas z tym pogodziły:
- Wariancja jest ograniczona. Z limitem 2 000 kredytów w Pro ciężki użytkownik nie spali 50× tego, co lekki. Spali 1,5×, może 2×. To nie dziki subsydiat — to ten sam handel, który ubezpieczenia i media robią od zawsze.
- Transparentność cen domyka lukę. Ponieważ koszt per generacja jest widoczny, użytkownicy sami trafiają na właściwy tier. Widzimy to w danych — ciężcy użytkownicy wideo głównie lądują na Max w pierwszym miesiącu. Lekcy zostają na Pro i rzadko uderzają w limit.
- Ciężcy użytkownicy dostają inną rozmowę. Jeśli stale przebijasz 10 000 kredytów Max, prawidłowa odpowiedź to nie podnoszenie ceny Pro — to skontaktowanie się z nami w sprawie puli enterprise dostrojonej do twojego workloadu.
Gdzie to nie działa
Kredyty byłyby złym wyborem dla biznesu developer-platform — inference-as-an-API, gdzie użytkownicy przepuszczają przez nas ruch produkcyjny. Tacy użytkownicy chcą tokenowego pass-through, bo modelują unit economics, a przewidywalność, którą oferujemy konsumentom, to nieprzewidywalność, którą muszą wyinżynierować.
My nie jesteśmy takim biznesem. Jesteśmy produktem czat, obraz i wideo dla ludzi robiących pracę kreatywną i operacyjną. Inny kształt, inna prawidłowa odpowiedź na pricing.
Przypis, który dodalibyśmy wcześniej
Element, który niedoważyliśmy w pierwotnej debacie, to jak framing kredytów zmienia zachowanie użytkownika. Ludzie traktują tokeny jak licznik (chcą go wyłączyć) i kredyty jak budżet (skłonni wydać do zera na to, co ich obchodzi). To nie zbieg okoliczności — to znany wzorzec w cenniku konsumenckim, i dał dokładnie ten wynik, który chcieliśmy: użytkownicy eksplorują katalog zamiast okopywać się u jednego dostawcy.
Jeśli odkładałeś jakiś model, bo nie wiedziałeś, ile będzie kosztował — otwórz studio, uderz w niego, spójrz na licznik kredytów. W najgorszym wypadku spalisz 30 kredytów. Matematyka ma być teraz nudna. O to chodzi.
Znalazłeś literówkę albo chcesz coś poprawić? Napisz do nas .