Zum Inhalt springen
Any AI
App öffnen
← Alle Beiträge
3 min read Any AI Studio

Video kommt dazu: wie wir das Launch-Lineup ausgesucht haben

Acht Videomodelle, ein geteilter Credit-Pool. Was es ins Lineup geschafft hat, was nicht, und die vier Kriterien, mit denen wir entschieden haben.

  • Video
  • Releases

Wir haben diese Woche Video ausgeliefert. Acht Modelle, ein Credit-Pool, keine Pro-Anbieter-Verträge. Bevor wir zum Lineup kommen, kurz zur Auswahl — denn die Antwort auf „welche Videomodelle sind am besten” ist weit weniger offensichtlich als auf der Chat-Seite.

Die vier Achsen, die zählen

Chat-Modelle konkurrieren vor allem um Intelligenz. Videomodelle konkurrieren gleichzeitig auf vier Achsen, und fast kein Modell gewinnt alle vier:

  1. Visuelle Qualität — Schärfe, Bewegungskohärenz, wie oft eine Hand fünf Finger hat.
  2. Geschwindigkeit und Kosten — wie lange bis du etwas zu sehen bekommst und was es kostet zu iterieren.
  3. Kontrolle — Referenzen, Seeds, Längen, Kamerafahrten, Lip-Sync.
  4. Audio — ob das Modell Sound produziert, der zu den Bildern passt, oder ob du Foley nachträglich aufpfropfen musst.

Ein 4K-Cinematic-Generator passt nicht zu einer X-Antwort. Ein schnelles Social-Tier-Modell passt nicht zu einem Hero-Shot. Das Lineup ist also bewusst plural — wir wollen pro Job das richtige Werkzeug, nicht ein Modell, das alles versucht.

Was drin ist

HappyHorse 1.0 ist seit gestern an der Spitze der externen Benchmarks, aber uns interessierte nicht der Visual-Score — sondern dass der Sound tatsächlich gemeinsam mit dem Video erzeugt wird, statt nachträglich darübergelegt zu werden. Lip-Sync funktioniert. Musik schwillt im Takt der Bewegung. Wir schreiben einen eigenen Beitrag dazu, sobald wir es an mehr echten Jobs nutzen.

Veo 3.1 ist die cineastische Option. 4K-nativ, das sauberste Text-to-Shot, das wir gesehen haben, und lächerlich teuer — wir routen dorthin, wenn der Prompt nach Hero-Shot klingt („Weitwinkel, Dolly-In, goldene Stunde”), und nicht, wenn es nach Social-Clip aussieht.

Seedance 2.0 landet morgen mit Multi-Input — bis zu neun Referenzbildern, drei Referenzclips, drei Audio-Tracks. Wir haben mit ByteDances Beta-Keys vorgetestet, und es ist ein anderes Werkzeug: weniger „Prompt eingeben, Video bekommen” und mehr „gib mir den Brief”. Mehr dazu separat am 3. Mai.

Kling 3.0 Omni ist der Spezialist für flüssige Bewegung. Beste Multi-Shot-Kontinuität in unseren Tests, besonders wenn eine Figur durch mehrere Beats laufen muss, ohne dass ihr Gesicht sich dazwischen verändert.

Runway Gen-4.5 bleibt im Kit für Filmemacher, die schon Muscle Memory dafür haben. Die Kamerafahrt-Steuerung und das Keyframe-Interface sind in der Kategorie weiterhin das Beste, wenn du einen Shot wirklich inszenieren willst.

Grok Imagine ist die Social-native-Option — schnell, Draft-Qualität, echt wirkende Clips. Wir haben es letzte Woche hinzugefügt, ein ausführlicherer Beitrag folgt.

Wan 2.7 ist die Budget-Stufe mit LoRA-Support. Open-source-Wurzeln, wenn du deine eigenen Character- oder Style-LoRAs schon trainiert hast, hier dockst du sie an.

Hailuo 2.3 ist die günstigste zuverlässige Option. Nichts Flashiges. Nützlich, wenn du Thumbnails iterierst oder ein Konzept stresstestest und keine Premium-Credits dafür verbrennen willst.

Was es nicht geschafft hat

Drei ernsthafte Modelle waren nah am Launch und kamen aus unterschiedlichen Gründen nicht rein.

Das erste hatte noch keinen Tarif ohne Wasserzeichen — wir zeigen kein Modell, das deinen Output brandet. Das zweite hat tolle Visuals, aber keine API für Seed-Kontrolle, was Iteration in einem Multi-Take-Workflow schmerzhaft macht. Das dritte ist schlicht teuer auf eine Weise, die nicht aufgeht — selbst für Max-Nutzer würden die Kosten pro Clip uns zwingen, das Cap anzuheben.

Wir schauen alle drei wieder an, wenn sich ihre Tarife ändern.

Ein Pool, acht Modelle

Der Grund, warum das überhaupt funktioniert: du kaufst nicht acht separate Abos. Du gibst die gleichen geteilten Credits aus, egal welches Modell du wählst, und siehst die Kosten pro Generierung, bevor du sendest. Pro sind 2.000 Credits im Monat, Max sind 10.000. Ein typischer Text-to-Video-Clip von HappyHorse liegt bei 40–60 Credits; ein Veo-4K- Hero-Shot eher bei 120; eine Hailuo-Iteration bei 6.

Auf dieses Verhältnis sind wir am meisten stolz. Der Punkt des Studios ist, dass du dich nicht für einen Anbieter entscheiden musst, bevor du weißt, was dein Prompt braucht — und Video, mehr als jede andere Modalität, bestraft solche Vorab-Festlegungen.

Video ist heute live für Pro und Max. Der Free-Tarif bekommt es noch nicht; wir wollen einen Monat sehen, wie die Credit-Mathe aufgeht, bevor wir die Tür weiter öffnen.


Tippfehler entdeckt oder anderer Meinung? Schreib uns .

Probier das Produkt hinter dem Text.
Studio.

Free-Tarif. Keine Kreditkarte. Anmeldung mit Google oder Apple.