【記者蔡富丞/柯妮妮綜合報導】影音AI的發展正從單一模型競爭，轉向「可組裝式框架」。最新延伸的VideoComposer架構近期再度引發關注，其核心在於將影片生成拆解為多個可獨立控制的模組，讓開發者能像拼積木一樣組合不同功能，打造專屬的影音生成流程。

傳統影音生成模型多採用端到端設計，雖然使用方便，但彈性有限。一旦需要調整畫面風格、動作或鏡頭語言，往往需要重新訓練模型。VideoComposer則透過模組化設計，將動作、結構、風格與場景分開控制，使不同元素可以自由組合。

這樣的架構讓影音製作更接近「開發流程」。使用者可以根據需求替換特定模組，例如改變人物動作或背景風格，而不影響整體生成結果，大幅提升可控性與效率。

此外，這種框架也更容易整合到平台中。企業可依應用場景選擇不同模組組合，從短影音生成到影視製作，都能建立客製化流程，降低開發門檻。

整體來看，影音AI正從封閉模型走向「開放式組裝架構」，未來競爭關鍵將不只是模型能力，而是誰能提供更靈活、可擴展的工具鏈，讓創作流程真正模組化。

影音開發進入「可組裝框架」時代！VideoComposer架構升級，創作流程像拼積木一樣運作