賽博女友,完美變聲,如今AI語音有多超乎想象?

首先感謝拉導(dǎo)賞識(shí)并向大眾介紹DiffSinger項(xiàng)目,這個(gè)項(xiàng)目能有今天的成果是我的小伙伴們和我一起站在巨人的肩膀上努力的結(jié)果!
不過我其實(shí)對(duì)于視頻中體現(xiàn)的一些擔(dān)憂可能比拉導(dǎo)樂觀一點(diǎn),因?yàn)槠鋵?shí)像我們這些經(jīng)常接觸AI語音的人來說,對(duì)AI語音的分辨能力都會(huì)大幅提升,包括sv、ace這些引擎,我們現(xiàn)在都可以分辨出來。通常來說,語音越長(zhǎng),出現(xiàn)瑕疵的可能性越大,無人工修正的情況下給人帶來的不適感也可能會(huì)越大。熟悉了一個(gè)技術(shù)的發(fā)展、使用和模型訓(xùn)練的過程以后,反而會(huì)對(duì)這些瑕疵非常敏感,這就是我們分辨AI語音的重要方式。
所以我認(rèn)為更重要的是,每個(gè)人或許都應(yīng)該增進(jìn)自己對(duì)AI語音技術(shù)的了解,從而對(duì)這些技術(shù)有一個(gè)基本的概念,一定程度上可以防范AI語音的危機(jī),也可以減輕人們的恐慌。其實(shí)在項(xiàng)目啟動(dòng)之初,我就一直非常重視對(duì)相關(guān)關(guān)注者的知識(shí)科普,也取得了很不錯(cuò)的效果,至少這樣做讓更多人不會(huì)輕易將AI神秘化、妖魔化,“談AI色變”了。
技術(shù)的發(fā)展是必然的,這些技術(shù)出于解放生產(chǎn)力的目的而研發(fā),本無惡意。但如果被少數(shù)人所掌握而不被大眾所知,這種信息差反而可能造成更加可怕的后果。此外,我相信也會(huì)出現(xiàn)一些AI判別的技術(shù),也就是由另外一個(gè)AI來分辨一張圖片或者一段音頻的真?zhèn)???傊?,技術(shù)的發(fā)展是魔高一尺道高一丈的,我相信隨著技術(shù)的發(fā)展,我們能夠重新尋找到一個(gè)平衡點(diǎn)。