墨言教育討論:為什么AI畫不好手?
人工智能(AI)在生成逼真圖像方面越來越出色,但它在畫手方面存在一個(gè)明顯的弱點(diǎn)。我們經(jīng)??吹紸I生成的手要么扭曲成奇怪的形狀,要么多了或少了幾根手指,給人一種極不舒服的感覺。那么為什么會出現(xiàn)這種情況呢?

人的手是非常復(fù)雜的。手是人體的一個(gè)復(fù)雜部位,它有五個(gè)手指,包含許多不同的骨骼和肌肉,每個(gè)手指看起來都不盡相同。與人臉相比,手在不同角度看起來差異很大。比如,當(dāng)一個(gè)人拿著雨傘時(shí),手會蜷縮起來;當(dāng)同一個(gè)人手里拿著一個(gè)大碗時(shí),手的形狀又完全不同;如果手捏成拳頭,手指甚至完全看不見。

事實(shí)上,不僅是AI畫不好手,對于人類來說,畫好手也并非易事。學(xué)過繪畫的人都知道,畫手是一個(gè)難點(diǎn)。手的形狀是固定的。當(dāng)AI生成一棵樹時(shí),葉子的數(shù)量可以是任意的,但這并不重要,因?yàn)闆]有人會在意到底有多少片葉子。但是,如果是一只有7或9個(gè)手指的手,人們會立刻注意到。
此外,AI并不真正理解手的概念。AI只能了解事物的外觀,而無法理解其內(nèi)在的工作原理。因此,AI并不真正理解手的概念,它只是在模仿而已。在訓(xùn)練AI時(shí),我們只是向其提供了大量的圖像,其中一些圖像顯示了五個(gè)手指,而其他一些可能顯示了四個(gè)手指,甚至可能沒有顯示手指。AI無法從這些圖像中理解手的三維結(jié)構(gòu)。與其他身體部位相比,手在這些圖像中出現(xiàn)的機(jī)會相當(dāng)少。AI也并不真正了解手與人體的連接方式。
另外,手在圖像中所占的空間往往較小,提供的信息相對較少。從穩(wěn)定擴(kuò)散(Stable Diffusion)的訓(xùn)練過程來看,圖像逐步加入噪點(diǎn),而AI的學(xué)習(xí)過程與此相反,是從噪點(diǎn)中逐步恢復(fù)原圖。因此,在畫面中占據(jù)很小空間的手,在一堆噪點(diǎn)中恢復(fù)出如此復(fù)雜的手自然是非常困難的。
從這個(gè)角度來看,所謂AI是拼湊藝術(shù)家作品的說法并不準(zhǔn)確,實(shí)際上,AI是在混沌中尋找秩序。