
【記者蔡富丞/柯妮妮 綜合報導】除了生成與理解能力的提升,影音AI也開始改變「思考方式」。最新研究提出“Thinking with Video”概念,將影片視為推理媒介,使AI能透過生成動態畫面來解決問題,而非僅依賴文字或靜態圖像。

這種方法的核心,在於利用影片的連續性來表達推理過程。例如在空間推理或動態問題中,AI可以透過生成畫面來模擬變化過程,進而找到解答,類似人類在腦中「想像畫面」的方式。
研究顯示,這類框架能同時處理視覺與語言任務,並在多種測試中展現出良好的推理能力,顯示影片不只是輸出形式,也能成為計算與思考的一部分。
這項發展也意味著影音AI的角色正在改變。從原本的內容生成工具,逐步轉變為「認知工具」,可應用於教育、設計甚至科學模擬等場景。
可以觀察到,影音AI正從單純的內容生產,邁向更高層次的「理解與推理」。當影片成為AI思考的一部分,未來技術發展將不再局限於創作,而是進一步擴展至解決複雜問題的能力。

