2026年5月3日 6 min read Any AI Studio

Seedance 2.0 與影片的多輸入時刻

九張參考圖。三段參考片。三條音軌。我們花一週試著弄壞 Seedance 2.0 — 它的亮點在哪、又在哪裡卡住。

影片
模型
更新

大多數影片模型只吃一個提示。ByteDance 三月推出搶先體驗、本週正式上線的 Seedance 2.0，吃的東西比較接近一份導演簡報：最多九張參考圖、三段參考片、三條音軌，「再加上」一個提示。我們把它操了一週。它的能耐是真的，粗糙邊緣也是真的，而且它真正贏的使用情境不是我們預期的那些。

為什麼多輸入是一個類別、不只是一個功能

影片模型一直做不好的一件事 — 跨每家供應商 — 就是「一致性」。請它生成三段「一個女人走過咖啡店」的片段，你會拿到三個不同的女人在三家不同的咖啡店。對分鏡、品牌工作、音樂錄影帶、影集內容來說，這就是真正的卡關。畫面個別看起來都還行；只要你需要 B 場景跟 A 場景看起來像在同一個世界，它們就不再有用。

多輸入修了這個問題，讓你能說「這就是角色長相（圖 1）、這是房間（圖 2）、這是調性（片段 1 和 2）、這是音樂（音軌 1）」。Seedance 2.0 不是第一個嘗試 — Pika 有過版本，Runway 有 beta — 但它是第一個成功率高到讓我們會建議圍繞它建工作流的。

它真正贏的地方

壓力測試一週後，三個類別很明顯是贏的：

**短影音的分鏡。**拿一份品牌參考集，丟 4–6 張靜態圖到 Seedance，你可以生成一系列共享視覺識別的片段。我們在 8 個片段的序列上拿到大約 80% 的角色一致性，這在真實製作循環裡夠用了（壞掉的 20% 重生成一次）。

**音樂錄影帶與節奏鎖定序列。**音軌輸入不是用來生成聲音 — Seedance 是無聲的 — 它是用來「定節奏」。丟 30 秒的歌曲片段，模型會把動作剪到節拍上。我們在三首實際歌曲上試過，結果從「好，可用的起點」到「稍微修一下就能交件」都有。比起無聲生成片段再事後配音樂剪，省好幾個小時。

**品牌一致的產品動態。**載入一張產品靜態圖加三張品牌風格參考；生成產品旋轉、動作、有情境的畫面。產品本身在多次生成間穩定得驚人，是只靠提示的模型做不到的。產品「周圍」的情境是否看起來像你的品牌就比較不一定，但它已經不再是瓶頸。

它還會卡的地方

模型有幾個明顯弱點，發佈公告大概不會告訴你：

**長時間動作。**超過 10–12 秒，一致性會急劇下降。模型把前幾秒撐得很好，中段會飄，只有時會在尾段救回來。目前我們把它當片段生成器，不是場景生成器。
**複雜音訊匹配。**對單一純樂器音軌定節奏：可以。對對話或有多段不同結構的音軌定節奏：時好時壞。模型能抓拍子，但對段落結構的線索（如主歌副歌轉折）就吃力。
**手和腳。**標準注意事項 — Seedance 在這上面沒有比同業強。手腳特寫構圖仍是影片模型崩壞的地方。

我們怎麼用

在工作室裡，Seedance 2.0 跟其他模型一樣放在影片挑選器裡，但有不同的預設介面：它的輸入面板會把參考素材欄放在最前面，因為這款模型本來就「該」被餵參考。如果你只給文字提示，你會拿到可接受的東西，但用法是錯的 — 像是用 FLUX 卻不指定風格。

伴隨這次上線，我們在工作室加了一個「參考集」模式：一次上傳一組靜態圖、命名（如「Northbreak 品牌包」、「角色 Maya」），就能在所有支援參考的影片模型間共用 — 不只是 Seedance。同一個參考集可以驅動一段 Seedance 序列和同一個專案裡的 Kling 接續。

它在陣容裡的位置

Seedance 2.0 並沒有取代我們推薦邏輯裡的任何東西。音畫同生 HappyHorse 仍是預設。電影主視覺鏡頭 Veo 仍勝。社群風格 Grok Imagine 仍是預設。Seedance 是「簡報驅動」的選擇 — 當你有明確視覺意圖、有參考素材撐腰，並且想把一致性當主打賣點時。

加進輪替名單，不要為了騰位置而退掉任何模型。

發現錯字或想反駁？來信。