Vai al contenuto
Any AI
Apri l'app
← Tutti gli articoli
4 min read Any AI Studio

Aggiungere il video: come abbiamo scelto la lineup di lancio

Otto modelli video, un pool di crediti condiviso. Cosa è entrato, cosa no e i quattro criteri che abbiamo usato per decidere.

  • video
  • release

Questa settimana abbiamo spedito il video. Otto modelli, un pool di crediti, zero contratti per provider da gestire. Prima di entrare nel merito della lineup, una nota su come abbiamo scelto — perché la risposta a «quali modelli video sono i migliori» è molto meno ovvia di quella per la chat.

I quattro assi che contano

I modelli di chat competono soprattutto sull’intelligenza. I modelli video competono su quattro assi contemporaneamente, e quasi nessun modello li vince tutti:

  1. Qualità visiva — nitidezza, coerenza del movimento, quante volte una mano ha cinque dita.
  2. Velocità e costo — quanto ci metti a vedere qualcosa e quanto costa iterare.
  3. Controllo — riferimenti, seed, durate, movimenti di camera, lip-sync.
  4. Audio — se il modello produce un suono che combacia col video, o se devi attaccare il foley dopo.

Un generatore cinematografico 4K è sbagliato per una risposta su X. Un modello social-tier veloce è sbagliato per un hero shot. Quindi la lineup è plurale per design — vogliamo uno strumento giusto per ogni lavoro, non un modello che cerca di essere tutto.

Cosa è entrato

HappyHorse 1.0 è il nuovo top del catalogo secondo i benchmark esterni di ieri, ma la parte che ci interessava non era il punteggio visivo — era che l’audio viene davvero generato insieme al video invece di essere sovrapposto dopo. Il lip-sync funziona. La musica cresce in tempo col movimento. Scriveremo un post dedicato dopo averlo usato su più lavori veri.

Veo 3.1 è l’opzione cinematografica. 4K nativo, il più pulito text-to-shot che abbiamo visto, e ridicolmente caro — quindi lo usiamo quando il prompt sembra un hero shot («grandangolo, dolly in, golden hour») e non una clip social.

Seedance 2.0 arriva domani con multi-input — fino a nove immagini di riferimento, tre clip di riferimento, tre tracce audio. Lo abbiamo testato in anteprima con le chiavi beta di ByteDance ed è uno strumento di tipo diverso: meno «scrivi un prompt, ottieni un video» e più «dammi un brief da regista». Ne parliamo a parte il 3 maggio.

Kling 3.0 Omni è lo specialista della fluidità di movimento. La miglior continuità multi-shot nei nostri test, soprattutto quando un personaggio deve camminare in più beat senza che la faccia muti tra uno e l’altro.

Runway Gen-4.5 resta nel kit per i filmmaker che ci hanno già memoria muscolare. I controlli sui movimenti di camera e l’interfaccia keyframe sono ancora i migliori della categoria se vuoi davvero dirigere una ripresa.

Grok Imagine è l’opzione social-native — veloce, qualità da bozza, clip che sembrano vere. L’abbiamo aggiunto la scorsa settimana e arriva un articolo più ampio.

Wan 2.7 è il tier budget con supporto LoRA. Radici open-source, quindi se hai già addestrato le tue LoRA character/style, è qui che si innestano.

Hailuo 2.3 è l’opzione affidabile più economica. Niente di vistoso. Utile quando iteri thumbnail o stress-testi un concept e non vuoi bruciare crediti premium.

Cosa non è entrato

Tre modelli seri sono arrivati vicini al lancio e non sono entrati, per ragioni diverse.

Il primo non ha ancora un tier senza watermark — non mostriamo un modello che marchia l’output. Il secondo ha ottime visuali ma niente API per il controllo del seed, e questo rende l’iterazione dolorosa in un workflow multi-take. Il terzo è proprio caro in un modo che non torna — anche per utenti Max, il costo per clip ci spingerebbe ad alzare il tetto.

Li rivaluteremo quando cambierà il tiering.

Un pool, otto modelli

Il motivo per cui tutto questo funziona è che non stai comprando otto abbonamenti separati. Spendi gli stessi crediti condivisi qualunque modello scegli, e vedi il costo per generazione prima di confermare. Pro è 2.000 crediti al mese, Max è 10.000. Una tipica clip text-to-video da HappyHorse costa 40–60 crediti; un hero shot 4K Veo è più sui 120; un’iterazione Hailuo è 6.

Quel rapporto è la parte di cui andiamo più fieri. Il senso dello studio è che non devi impegnarti su un provider prima di sapere cosa serve al tuo prompt — e il video, più di qualunque altra modalità, punisce questo tipo di impegno anticipato.

Il video è live per Pro e Max da oggi. Il piano gratuito non lo include ancora; vogliamo vedere come torna la matematica dei crediti per un mese prima di aprire di più.


Hai trovato un refuso o vuoi dissentire? Scrivici .

Prova il prodotto dietro l'articolo.
studio.

Piano gratuito. Senza carta. Accedi con Google o Apple.