跳至內容
Any AI
開啟應用
← 所有文章
6 min read Any AI Studio

Seedance 2.0 與影片的多輸入時刻

九張參考圖。三段參考片。三條音軌。我們花一週試著弄壞 Seedance 2.0 — 它的亮點在哪、又在哪裡卡住。

  • 影片
  • 模型
  • 更新

大多數影片模型只吃一個提示。ByteDance 三月推出搶先體驗、本週正式上線的 Seedance 2.0,吃的東西比較接近一份導演簡報:最多九張參考圖、三段參考片、三條音軌,「再加上」一個提示。我們把它操了一週。它的能耐是真的,粗糙邊緣也是真的,而且它真正贏的使用情境不是我們預期的那些。

為什麼多輸入是一個類別、不只是一個功能

影片模型一直做不好的一件事 — 跨每家供應商 — 就是「一致性」。請它生成三段「一個女人走過咖啡店」的片段,你會拿到三個不同的女人在三家不同的咖啡店。對分鏡、品牌工作、音樂錄影帶、影集內容來說,這就是真正的卡關。畫面個別看起來都還行;只要你需要 B 場景跟 A 場景看起來像在同一個世界,它們就不再有用。

多輸入修了這個問題,讓你能說「這就是角色長相(圖 1)、這是房間(圖 2)、這是調性(片段 1 和 2)、這是音樂(音軌 1)」。Seedance 2.0 不是第一個嘗試 — Pika 有過版本,Runway 有 beta — 但它是第一個成功率高到讓我們會建議圍繞它建工作流的。

它真正贏的地方

壓力測試一週後,三個類別很明顯是贏的:

**短影音的分鏡。**拿一份品牌參考集,丟 4–6 張靜態圖到 Seedance,你可以生成一系列共享視覺識別的片段。我們在 8 個片段的序列上拿到大約 80% 的角色一致性,這在真實製作循環裡夠用了(壞掉的 20% 重生成一次)。

**音樂錄影帶與節奏鎖定序列。**音軌輸入不是用來生成聲音 — Seedance 是無聲的 — 它是用來「定節奏」。丟 30 秒的歌曲片段,模型會把動作剪到節拍上。我們在三首實際歌曲上試過,結果從「好,可用的起點」到「稍微修一下就能交件」都有。比起無聲生成片段再事後配音樂剪,省好幾個小時。

**品牌一致的產品動態。**載入一張產品靜態圖加三張品牌風格參考;生成產品旋轉、動作、有情境的畫面。產品本身在多次生成間穩定得驚人,是只靠提示的模型做不到的。產品「周圍」的情境是否看起來像你的品牌就比較不一定,但它已經不再是瓶頸。

它還會卡的地方

模型有幾個明顯弱點,發佈公告大概不會告訴你:

  • **長時間動作。**超過 10–12 秒,一致性會急劇下降。模型把前幾秒撐得很好,中段會飄,只有時會在尾段救回來。目前我們把它當片段生成器,不是場景生成器。
  • **複雜音訊匹配。**對單一純樂器音軌定節奏:可以。對對話或有多段不同結構的音軌定節奏:時好時壞。模型能抓拍子,但對段落結構的線索(如主歌副歌轉折)就吃力。
  • **手和腳。**標準注意事項 — Seedance 在這上面沒有比同業強。手腳特寫構圖仍是影片模型崩壞的地方。

我們怎麼用

在工作室裡,Seedance 2.0 跟其他模型一樣放在影片挑選器裡,但有不同的預設介面:它的輸入面板會把參考素材欄放在最前面,因為這款模型本來就「該」被餵參考。如果你只給文字提示,你會拿到可接受的東西,但用法是錯的 — 像是用 FLUX 卻不指定風格。

伴隨這次上線,我們在工作室加了一個「參考集」模式:一次上傳一組靜態圖、命名(如「Northbreak 品牌包」、「角色 Maya」),就能在所有支援參考的影片模型間共用 — 不只是 Seedance。同一個參考集可以驅動一段 Seedance 序列和同一個專案裡的 Kling 接續。

它在陣容裡的位置

Seedance 2.0 並沒有取代我們推薦邏輯裡的任何東西。音畫同生 HappyHorse 仍是預設。電影主視覺鏡頭 Veo 仍勝。社群風格 Grok Imagine 仍是預設。Seedance 是「簡報驅動」的選擇 — 當你有明確視覺意圖、有參考素材撐腰,並且想把一致性當主打賣點時。

加進輪替名單,不要為了騰位置而退掉任何模型。


發現錯字或想反駁? 來信

試試這篇文章背後的產品。
工作室.

免費方案。免信用卡。可用 Google 或 Apple 登入。