幾款A(yù)I新應(yīng)用-文本轉(zhuǎn)視頻、AI瀏覽器
最近出了幾款A(yù)I新應(yīng)用,簡單分享一下看看應(yīng)用的功能和使用方法。
1.Opera One瀏覽器-一直以輕量、極速著稱的opera推出了新一代AI瀏覽器Opera One | Browsing reinvented | Opera:集成了AI應(yīng)用、聊天機器人和常用社交軟件,本地安裝嘗試一下。

直接下載完,默認(rèn)安裝,會有一些簡單的配置,例如選擇社交軟件和從別的瀏覽器內(nèi)導(dǎo)入數(shù)據(jù)。

配置完畢就正式進入瀏覽器主界面了,左側(cè)可以看到opera自家的AI工具Aria,集成常用的社交軟件,另外opera最新升級的標(biāo)簽也是它的一大亮點。

總結(jié),總體界面是很簡潔美觀的,類似edge瀏覽器。感興趣的朋友可以試一下
2.阿里達摩院出的文本轉(zhuǎn)視頻項目,這是在huggingface上的項目鏈接:ModelScope Text To Video Synthesis – a Hugging Face Space by damo-vilab,同DragGAN一樣支持在部署。

具體操作步驟參照我這一篇:最強AI修圖來了-DragGAN在colab部署教程 | 高治中的個人空間 (x521.top),非常類似。最后部署完畢看一下效果:

如果本地有8G以上顯存顯卡的主機可以部署在本地試一下。
3.Zeroscope Text-To-Video – a Hugging Face Space by fffiloni,看它的標(biāo)題仍然是一個文本轉(zhuǎn)視頻的項目,同樣的是通過輸入關(guān)鍵詞來實現(xiàn)生成視頻的效果,其余操作不再贅述。

4.一個根據(jù)一張人物頭像圖生成3D的項目:SizheAn/PanoHead: Code Repository for CVPR 2023 Paper “PanoHead: Geometry-Aware 3D Full-Head Synthesis in 360 degree” (github.com),這里是它的項目文檔和圖片演示,我將摘要提取一部分介紹一下這個項目。
3D人頭的合成和重建最近在計算機視覺和計算機圖形學(xué)中引起了越來越多的興趣。 用于3D人頭合成的現(xiàn)有最先進的3D生成對抗網(wǎng)絡(luò)(GAN)要么僅限于近視圖或難以在大視角下保持 3D 一致性。我們提出了PanoHead,這是第一個3D感知生成模型,僅使用各種外觀和詳細(xì)的幾何形狀即可進行 360° 的高質(zhì)量視圖一致圖像合成用于訓(xùn)練的野外非結(jié)構(gòu)化圖像。從本質(zhì)上講,我們提升了最近 3D GAN 的表示能力,并橋接了 從具有廣泛分布視圖的野外圖像進行訓(xùn)練時的數(shù)據(jù)對齊差距。具體來說,我們提出了一種新穎的兩階段 自適應(yīng)圖像對齊,可實現(xiàn)強大的 3D GAN 訓(xùn)練。我們進一步介紹了一種三網(wǎng)格神經(jīng)體積表示,有效解決前臉和后頭特征糾纏,根植于廣泛采用的三平面公式。 我們的方法在2D神經(jīng)場景結(jié)構(gòu)的對抗學(xué)習(xí)中灌輸了3D圖像分割的先驗知識,在不同背景下實現(xiàn)可合成頭部合成。受益于這些設(shè)計,我們的方法明顯優(yōu)于以前的3D GAN,生成具有精確幾何形狀和多樣化外觀的高質(zhì)量 3D 頭像,即使是長波浪和非洲發(fā)型,也可以從任意姿勢渲染。 此外,我們展示了我們的系統(tǒng)可以從單個輸入圖像中重建完整的3D頭像,以獲得個性化的逼真3D頭像。
不過本地部署對主機有著極高的性能要求,需要3090或4090的顯卡,有條件的同學(xué)可以試一下。