AI最新進展:一鍵生成電影?NVIDIA研究團隊發(fā)布可處理視頻的文本提示模型

NVIDIA研究團隊剛剛發(fā)布了一篇關(guān)于如何通過文本提示創(chuàng)建高質(zhì)量短視頻的新研究論文。
它可以創(chuàng)建1280x2048分辨率的113幀視頻,以24 FPS渲染,生成4.7秒的短片。該團隊首先對模型進行圖像訓練,然后添加了時間維度,使其可以處理視頻。
這項新的研究是令人印象深刻的。在當前的開發(fā)速度下,我們可能很快就能夠在未來幾年內(nèi)僅憑少量的文本提示生成完整長度的電影。

Video LDMs生成的相關(guān)視頻示例:https://research.nvidia.com/labs/toronto-ai/VideoLDM/samples.html
標簽: