
【記者蔡富丞/柯妮妮 綜合報導】影音AI的發展正從單一模型競爭,轉向「可組裝式框架」。最新延伸的VideoComposer架構近期再度引發關注,其核心在於將影片生成拆解為多個可獨立控制的模組,讓開發者能像拼積木一樣組合不同功能,打造專屬的影音生成流程。
傳統影音生成模型多採用端到端設計,雖然使用方便,但彈性有限。一旦需要調整畫面風格、動作或鏡頭語言,往往需要重新訓練模型。VideoComposer則透過模組化設計,將動作、結構、風格與場景分開控制,使不同元素可以自由組合。
這樣的架構讓影音製作更接近「開發流程」。使用者可以根據需求替換特定模組,例如改變人物動作或背景風格,而不影響整體生成結果,大幅提升可控性與效率。
此外,這種框架也更容易整合到平台中。企業可依應用場景選擇不同模組組合,從短影音生成到影視製作,都能建立客製化流程,降低開發門檻。
整體來看,影音AI正從封閉模型走向「開放式組裝架構」,未來競爭關鍵將不只是模型能力,而是誰能提供更靈活、可擴展的工具鏈,讓創作流程真正模組化。

