Seedance 2.0 і мульти-вхідний момент для відео
Дев'ять референсних зображень. Три референсні кліпи. Три аудіодоріжки. Тиждень ламаємо Seedance 2.0 — ось де він сяє, а де ще спотикається.
- відео
- моделі
- релізи
Більшість відео-моделей бере промпт. Seedance 2.0, який ByteDance випустив у ранньому доступі в березні й зробив загальнодоступним цього тижня, бере щось ближче до режисерського брифу: до дев’яти референсних зображень, трьох референсних кліпів, трьох аудіодоріжок, і промпт. Ми били по ньому тиждень. Можливість реальна, шорсткі краї теж реальні, а сценарії, де він виграє, не ті, що ми очікували.
Чому мульти-вхід — це категорія, а не фіча
У чому відео-моделі стабільно слабкі — у всіх провайдерів — це консистентність. Згенеруйте три кліпи «жінка йде через кав’ярню» — отримаєте трьох різних жінок у трьох різних кав’ярнях. Для сторібордингу, бренд-роботи, музичних кліпів, серійного контенту це й є реальний блокер. Візуал виглядає добре окремо; він перестає бути корисним у момент, коли потрібно, щоб сцена B виглядала як те, що належить до того ж світу, що й сцена A.
Мульти-вхід виправляє це, дозволяючи сказати «ось як виглядає персонаж (зображення 1), ось кімната (зображення 2), ось настрій, до якого йдемо (кліпи 1 і 2), ось музика (аудіо 1)». Seedance 2.0 не перший, хто пробує — Pika мала версію, у Runway є бета, — але це перший, де воно працює достатньо часто, щоб ми радили будувати воркфлоу довкола нього.
Де він реально виграє
Тиждень стрес-тестів — три категорії явних перемог:
Сторібординг для короткого відео. Візьміть брендовий референс-дек, завантажте 4–6 кадрів у Seedance — і можна згенерувати послідовність кліпів, що всі мають спільну візуальну ідентичність. Ми отримували близько 80% консистентності персонажа на послідовностях з 8 кліпів, що достатньо, аби бути корисним у реальному продакшн-циклі (погані 20% просто регенеруються).
Музичні кліпи й темпо-залежні послідовності. Аудіо-доріжка не для генерації звуку — Seedance німий — а для темпу. Кидайте 30-секундний кліп вашого треку — модель ріже рух під біти. Ми спробували це на трьох справжніх треках, і результат коливався від «окей, корисна відправна точка» до «це насправді відправне з легкими правками». В порівнянні з генерацією тихих кліпів та редагуванням під музику потім — це години економії.
Бренд-консистентний рух продукту. Завантажте кадр продукту і три бренд-стильові референси; згенеруйте продукт, що крутиться, в русі, в контексті. Сам продукт залишається напрочуд стабільним між генераціями так, як promptonly-моделі не вміють. Чи виглядає контекст довкола як ваш бренд — більше lottery, але це вже не вузьке місце.
Де він ще спотикається
У моделі є явні слабкі місця, про які launch-анонс, мабуть, не скаже:
- Довготривалий рух. Усе за 10–12 секунд — і консистентність різко падає. Модель тримає перші кілька секунд добре, дрейфує посередині й відновлюється тільки інколи в кінці. Поки що ставтесь до неї як до генератора кліпів, а не сцен.
- Складне аудіо-вирівнювання. Темп під один інструментальний трек: працює. Темп під діалог чи трек із кількома різними секціями: лотерея. Модель ловить темп, але плутається зі структурними переходами на кшталт «куплет — приспів».
- Руки й стопи. Стандартне застереження — Seedance не кращий за решту поля тут. Тісне кадрування на руках чи стопах — досі місце, де ламаються відео-моделі.
Як ми його використовуємо
У студії Seedance 2.0 стоїть у відео-перемикачі поряд з іншими, але з іншим дефолтним UI: панель вводу показує референс-слоти попереду, бо модель призначена для подавання референсів. Якщо ви даєте лише текстовий промпт, отримаєте щось прийнятне, але використовуєте модель неправильно — як FLUX без указання стилю.
З цим запуском ми додали в студію патерн «референс-набір»: завантажте набір кадрів одного разу, назвіть («Бренд-кіт Northbreak», «Майя — персонаж»), і він доступний у відео-моделях, що підтримують референси, — не лише Seedance. Один референс-набір може живити Seedance-послідовність і Kling-продовження в одному проєкті.
Де він у лінійці
Seedance 2.0 не замінює нічого в нашій логіці рекомендацій. HappyHorse досі дефолт для спільного аудіо-відео. Veo досі кінематографічний hero-кадр. Grok Imagine досі соц-дефолт. Seedance — брифо-керована опція — коли у вас є чіткий візуальний намір, підкріплений референс- матеріалом, і ви хочете консистентність як головну фічу.
Додайте його в ротацію. Не виводьте нічого з лінійки, щоб звільнити місце.
Знайшли друкарську помилку чи хочете заперечити? Напишіть нам .