Ajout de la vidéo : comment on a choisi la sélection de lancement
Huit modèles vidéo, un seul pool de crédits partagé. Ce qui est entré, ce qui n’est pas entré, et les quatre critères qui ont décidé.
- vidéo
- notes
On a livré la vidéo cette semaine. Huit modèles, un seul pool de crédits, aucun contrat fournisseur à gérer. Avant d’entrer dans la sélection, un mot sur la méthode — parce que « quels modèles vidéo sont les meilleurs » est bien moins évident que l’équivalent côté chat.
Les quatre axes qui comptent
Les modèles de chat se battent surtout sur l’intelligence. Les modèles vidéo se battent sur quatre axes à la fois, et presque aucun ne gagne sur les quatre :
- Qualité visuelle — netteté, cohérence du mouvement, fréquence à laquelle une main a cinq doigts.
- Vitesse et coût — combien de temps avant d’avoir un résultat à regarder, et ce que coûte une itération.
- Contrôle — références, seeds, durées, mouvements de caméra, lip-sync.
- Audio — le modèle émet-il un son qui colle aux images, ou faut-il poser le foley après ?
Un générateur cinéma 4K est mauvais pour un reply sur X. Un modèle social rapide est mauvais pour un hero shot. La sélection est donc plurielle par design — on veut le bon outil par tâche, pas un modèle qui essaie d’être tout.
Ce qui est dans la sélection
HappyHorse 1.0 est le nouveau sommet du catalogue selon les benchmarks externes d’hier, mais ce qui nous a marqués n’est pas le score visuel — c’est que l’audio est réellement généré conjointement avec la vidéo, au lieu d’être posé après. Le lip-sync marche. La musique enfle en rythme avec le mouvement. On y consacrera un article dédié une fois qu’on l’aura utilisé sur plus de vrais projets.
Veo 3.1 est l’option cinéma. 4K natif, le text-to-shot le plus propre qu’on ait vu, et un coût ridiculement élevé — donc on y route quand le prompt ressemble à un hero shot (« grand-angle, travelling avant, golden hour ») et pas quand il ressemble à un clip social.
Seedance 2.0 sort demain en multi-entrées — jusqu’à neuf images de référence, trois clips de référence, trois pistes audio. Pré-test avec les clés beta de ByteDance : c’est un autre type d’outil, moins pour « tape un prompt, récupère une vidéo » et plus pour « voici un brief de réalisateur ». Article séparé le 3 mai.
Kling 3.0 Omni est le spécialiste de la fluidité du mouvement. Meilleure continuité multi-plans dans nos tests, surtout quand un personnage doit traverser plusieurs beats sans que son visage ne morphe.
Runway Gen-4.5 reste dans le kit pour les cinéastes qui ont déjà la mémoire musculaire. Les contrôles de mouvement de caméra et l’interface de keyframes sont toujours ce qui se fait de mieux si vous voulez réellement diriger un plan.
Grok Imagine est l’option social-native — clips rapides, qualité brouillon, sensation réelle. Ajouté la semaine dernière, article plus complet à venir.
Wan 2.7 est le tier budget avec support LoRA. Racines open-source, donc si vous avez déjà entraîné vos propres LoRAs de personnage ou de style, c’est ici qu’ils se branchent.
Hailuo 2.3 est l’option fiable la moins chère. Rien de tape-à-l’œil. Utile quand vous itérez des vignettes ou stress-testez un concept et ne voulez pas brûler des crédits premium pour ça.
Ce qui n’est pas entré
Trois modèles sérieux ont failli faire partie du lancement, pour des raisons différentes.
Le premier n’a pas encore livré de tier sans watermark — on ne mettra pas en avant un modèle qui marque vos rendus. Le deuxième a un visuel excellent mais aucune API pour le contrôle des seeds, ce qui rend l’itération douloureuse en multi-prises. Le troisième est simplement cher d’une manière qui ne tient pas — même pour les utilisateurs Max, le coût par clip nous pousserait à relever le plafond.
On reviendra sur les trois quand leur tarification changera.
Un pool, huit modèles
Si tout cela fonctionne, c’est parce que vous n’achetez pas huit abonnements séparés. Vous dépensez les mêmes crédits partagés quel que soit le modèle choisi, et vous voyez le coût par génération avant de valider. Pro, c’est 2 000 crédits par mois ; Max, 10 000. Un text-to-video typique avec HappyHorse coûte 40 à 60 crédits ; un hero shot Veo 4K plutôt 120 ; une itération Hailuo, 6.
C’est ce ratio dont on est le plus fiers. Le point du studio, c’est de ne pas avoir à s’engager auprès d’un fournisseur avant de savoir ce que votre prompt exige — et la vidéo, plus que n’importe quelle autre modalité, punit ce genre d’engagement prématuré.
La vidéo est en ligne pour Pro et Max aujourd’hui. Le tarif gratuit ne l’inclut pas encore ; on veut voir comment les crédits se comportent sur un mois avant d’ouvrir la porte plus largement.
Une coquille ou un désaccord ? Écrivez-nous .