Dodajemy wideo: jak wybraliśmy modele na start
Osiem modeli wideo, jedna wspólna pula kredytów. Co weszło, co nie, i cztery kryteria, którymi się kierowaliśmy.
- wideo
- aktualizacje
W tym tygodniu wypuściliśmy wideo. Osiem modeli, jedna pula kredytów, zero osobnych kontraktów z dostawcami. Zanim przejdziemy do listy, krótka notka o tym, jak wybieraliśmy — bo odpowiedź na pytanie „które modele wideo są najlepsze” jest dużo mniej oczywista niż dla czatu.
Cztery osie, które się liczą
Modele czatu rywalizują głównie inteligencją. Modele wideo rywalizują na czterech osiach jednocześnie i prawie żaden model nie wygrywa we wszystkich:
- Jakość wizualna — ostrość, spójność ruchu, jak często ręka ma pięć palców.
- Szybkość i koszt — ile czasu mija, zanim coś zobaczysz, i ile kosztuje iteracja.
- Kontrola — referencje, seedy, długości, ruchy kamery, lip-sync.
- Dźwięk — czy model wypluwa dźwięk pasujący do obrazu, czy musisz dokleić foley później.
Generator kinowy w 4K jest złym wyborem do odpowiedzi na X. Szybki model social-tier jest złym wyborem do ujęcia hero. Dlatego lineup jest mnogi z założenia — chcemy mieć jedno właściwe narzędzie na zadanie, nie jeden model próbujący być wszystkim.
Co weszło
HappyHorse 1.0 to nowy szczyt katalogu według wczorajszych zewnętrznych benchmarków, ale interesowało nas nie tyle samo wynikiem wizualnym — tylko to, że dźwięk jest faktycznie generowany wspólnie z obrazem, a nie nakładany po fakcie. Lip-sync działa. Muzyka rośnie razem z ruchem. Napiszemy o tym osobny post, gdy przejedziemy go na większej liczbie realnych zleceń.
Veo 3.1 to opcja kinowa. Natywne 4K, najczystszy text-to-shot, jaki widzieliśmy, i absurdalnie drogi — więc kierujemy do niego, gdy prompt wygląda jak ujęcie hero („szeroki kadr, dolly in, złota godzina”), a nie jak social clip.
Seedance 2.0 ląduje jutro z multi-input — do dziewięciu obrazów referencyjnych, trzech klipów referencyjnych, trzech ścieżek audio. Testowaliśmy wcześniej z kluczami beta ByteDance i to inny rodzaj narzędzia: mniej dla „wpisz prompt, dostań wideo”, bardziej dla „daj mi brief reżysera”. Pokryjemy go osobno 3 maja.
Kling 3.0 Omni to specjalista od płynności ruchu. Najlepsza ciągłość multi-shot w naszych testach, zwłaszcza gdy postać musi przejść przez kilka beatów bez morfującej się twarzy.
Runway Gen-4.5 zostaje w zestawie dla kinematografistów, którzy mają już do niego pamięć mięśniową. Kontrolki ruchu kamery i interfejs keyframe’ów są nadal najlepsze w kategorii, jeśli faktycznie chcesz wyreżyserować ujęcie.
Grok Imagine to opcja social-native — szybkie, drafty, klipy z poczuciem realności. Dodaliśmy go w zeszłym tygodniu i mamy w drodze pełniejszy artykuł.
Wan 2.7 to tier budżetowy z obsługą LoRA. Korzenie open-source, więc jeśli wytrenowałeś już własne LoRA postaci lub stylu, tu się wpinają.
Hailuo 2.3 to najtańsza wiarygodna opcja. Nic błyszczącego. Przydatny, gdy iterujesz nad miniaturkami albo testujesz koncept i nie chcesz palić kredytów premium.
Co nie weszło
Trzy poważne modele prawie weszły na start i nie weszły, z różnych powodów.
Pierwszy nie wypuścił tieru bez watermarku — nie pokażemy modelu, który brandzuje twój output. Drugi ma świetne wizualnie, ale brak API do kontroli seeda, co czyni iterację bolesną w wielokrotnym workflow. Trzeci jest po prostu drogi w sposób, który się nie spina — nawet dla użytkowników Max koszt per klip wymusiłby podniesienie limitu.
Wrócimy do całej trójki, gdy zmieni się ich pricing.
Jedna pula, osiem modeli
Powód, dla którego to wszystko działa, to fakt, że nie kupujesz ośmiu osobnych subskrypcji. Wydajesz te same wspólne kredyty bez względu na to, jaki model wybierzesz, i widzisz koszt per generacja przed kliknięciem. Pro to 2 000 kredytów miesięcznie, Max to 10 000. Typowy klip text-to-video z HappyHorse to 40–60 kredytów; ujęcie hero w Veo 4K to bardziej 120; iteracja w Hailuo to 6.
To ta proporcja, z której jesteśmy najbardziej dumni. Sens studia polega na tym, że nie musisz zawczasu deklarować dostawcy, zanim poznasz potrzeby promptu — a wideo, bardziej niż jakakolwiek inna modalność, karze takie wcześniejsze zobowiązania.
Wideo jest dostępne dla Pro i Max od dziś. Darmowy tier jeszcze tego nie obejmuje; chcemy zobaczyć, jak się rozłoży matematyka kredytów przez miesiąc, zanim otworzymy bramę szerzej.
Znalazłeś literówkę albo chcesz coś poprawić? Napisz do nas .