GeForce RTX 4060 Ti 16G - Stable Diffusion XL最具性價比的圖像卡
在過去的幾個月中,您很可能已在網(wǎng)上的社交媒體帖子、新聞文章和視頻中見識到人工智能及其所能生成的內(nèi)容。在眾多人工智能產(chǎn)品中,OpenAI公司推出的ChatGPT備受青睞。其聊天風(fēng)格的界面允許用戶與人工智能模型進(jìn)行交互,提出問題,向其發(fā)出指令,甚至要求其編寫代碼、段落或整篇文章!除了像ChatGPT這樣的文本模型外,還有諸多視覺形式的AI模型正不斷涌現(xiàn)。這些模型,例如MidJourney、Stable Diffusion、DALL-E等,都能根據(jù)特定的提示生成圖像。人們也可以向這些模型發(fā)出指令,要求其創(chuàng)建數(shù)字藝術(shù)作品。
Prompt:
Space battleship, causing objects to disintegrate into atomic particles. cinematic shot + dynamic composition, incredibly detailed, sharpen, details + intricate detail + professional lighting, film lighting + 35mm + anamorphic + lightroom + cinematography + bokeh + lens flare + film grain + HDR10 + 8K + Roger Deakins, ((cinematic)), perfect composition, hyperrealistic, super detailed, 8k, high quality, trending art, trending on artstation, sharp focus, studio photo, intricate details, highly detailed
Negative Prompt:
(3d, cartoon, anime, sketches), (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), bad anatomy, out of view, cut off, ugly, deformed, mutated, ((young)), EasyNegative, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans,extra fingers,fewer fingers, (ugly eyes, deformed iris, deformed pupils, fused lips and teeth:1.2), (un-detailed skin, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.2), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions
Steps:
30, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 189104945, Size: 1024x1024, Model hash: 31e35c80fc, Model: sd_xl_base_1.0, Clip skip: 2, Version: v1.5.1
借助上述模型,我們得到了以下輸出結(jié)果。

毋庸置疑,這種強(qiáng)大的工具業(yè)已引起了全行業(yè)的劇變。盡管就藝術(shù)、圖形、撰寫和創(chuàng)造力而言,目前尚無任何人工智能模型能夠完全模擬人類,然而許多職業(yè)已開始因其而受到波及。不過,人工智能所生成的內(nèi)容一般僅作為生成通用內(nèi)容(如文本、代碼片段、圖像或圖形)的輔助手段,因為在不同場景下其易出現(xiàn)錯誤。事實上,谷歌的Bard AI聊天機(jī)器人在首次演示時便出現(xiàn)了實質(zhì)性的錯誤!不過,隨時間的推移,它們的實用性將會持續(xù)提升。目前,我們已經(jīng)見證了諸多更新的AI模型的誕生,這些模型多數(shù)是在以往的版本基礎(chǔ)上進(jìn)行的改進(jìn)。
VRAM和AI模型:你需要多少?
當(dāng)前,一些人工智能工具因其開源特性而備受矚目——授權(quán)用戶、企業(yè)及組織可在其硬件上進(jìn)行本地化部署,無需擔(dān)憂任何隱私或安全方面的顧慮。
盡管大型企業(yè)具備自主托管人工智能模型所需的基礎(chǔ)設(shè)施和資金,但個人和專業(yè)人士在利用人工智能時可能會面臨困難。這些困難主要來自于AI模型在現(xiàn)代硬件上可能運(yùn)行緩慢甚至無法運(yùn)行,其中一個重要原因是這些模型對VRAM的需求。
Stable Diffusion XL最低要求
Stability AI公司最近發(fā)布了一個名為Stable Diffusion XL(SDXL)的模型,這個模型是迄今為止該公司所稱的“最先進(jìn)的”版本之一。
目前,該技術(shù)已具備以較短提示生成逼真度更高的人臉、清晰易讀的文本及美觀程度更高的藝術(shù)品的潛能。然而,這些性能增強(qiáng)功能亦增加了相應(yīng)的硬件成本,特別是對VRAM的需求和GPU性能的要求。所以,在家用電腦上享受SDXL的改進(jìn)需要滿足哪些要求呢?首先,Stability AI推薦我們使用Nvidia圖形卡,因此,我們將使用當(dāng)前和前代產(chǎn)品,以更好地理解它們的性能??紤]到Stability AI在發(fā)布的新聞稿中明確要求顯卡需要有至少8GB的顯存,但我們希望研究更高顯存容量所帶來的效果。僅僅達(dá)到最低要求(或稍微超過一點)會對性能產(chǎn)生很大影響,還是更強(qiáng)大的GPU可以抵消缺乏VRAM帶來的影響?針對這一問題,我們已安排實驗室在不同硬件上進(jìn)行測試,包括現(xiàn)有及以往的設(shè)備。這些所得數(shù)據(jù)均應(yīng)有助于您在購買下一款顯卡時做出更明智的決策。
適用于GeForce顯卡的SDXL GPU基準(zhǔn)測試
在我們的實驗中,我們將采用一塊RTX 4060 Ti 16 GB顯卡、一塊RTX 3080 10 GB顯卡以及一塊RTX 3060 12 GB顯卡作為測試對象。首先,我們將從使用默認(rèn)參數(shù)進(jìn)行簡單的藝術(shù)合成任務(wù),以便讓這些GPU得到充分的性能測試。



對于通常關(guān)注游戲基準(zhǔn)測試的玩家而言,所得的結(jié)果可能會讓他們感到驚訝。RTX 4060 Ti 16GB配置了16GB的VRAM緩沖區(qū),以優(yōu)異的16秒成績輕松完成了任務(wù),表現(xiàn)超越了其他同類產(chǎn)品。緊隨其后的是RTX 3060 12GB,由于其12GB的VRAM配置,其完成時間稍長,為27.2秒。盡管成績并非最佳,但仍然在相當(dāng)不錯的范疇內(nèi)。遺憾的是,RTX 3080由于顯存容量的限制,其性能在某些情況下可能受到影響。據(jù)測試,其以較為緩慢的速度完成任務(wù),時間為65.1秒,其性能表現(xiàn)并不盡如人意。因此,我們可以看到,這一代的RTX 4060 Ti 16GB GPU在圖像生成時間上相較于上代高端的RTX 3080快了約4倍。
SDXL 基準(zhǔn)測試:1024x1024+LORA
我們可以在下一次測試中適當(dāng)增加挑戰(zhàn)性,采用LoRA進(jìn)行嘗試。敬請期待。
在使用LoRA或低秩適應(yīng)技術(shù)對特定藝術(shù)風(fēng)格或字符進(jìn)行穩(wěn)定擴(kuò)散模型的微調(diào)時,,這將會增加VRAM的負(fù)擔(dān)。因此,為了評估“參賽者”的表現(xiàn),需要仔細(xì)觀察他們在本次測試中的成果。



我們通過運(yùn)用LoRA來制作一件“Cybergirl”藝術(shù)品,以此來考察擁有有限VRAM的顯卡與擁有更大VRAM的顯卡在性能上究竟存在多少差距。實驗結(jié)果顯示,RTX 3080輕易地被擁有更多內(nèi)存的40系列顯卡所超越。RTX 4060 Ti 16GB再次展示出卓越的性能,僅耗費17秒就完成了圖像生成,相對比之下,RTX 3080的表現(xiàn),猶如蝸牛般的緩慢,其生成時長長達(dá)98.8秒。
SDXL 基準(zhǔn)測試:1024x1024+LoRA+ControlNet
好的,接下來我們將使用ControlNet為40系顯卡添加一些額外的條件以展現(xiàn)其更強(qiáng)大的能力。
首先,ControlNet是一種神經(jīng)網(wǎng)絡(luò)模型,其作用在于對Stable Diffusion的輸出進(jìn)行更精細(xì)的控制和微調(diào)。具體而言,ControlNet通過在輸出中添加更多特定條件,使Stable Diffusion能夠更好地理解并滿足用戶對設(shè)計的需求。因此,使用ControlNet可以更加精準(zhǔn)地指導(dǎo)生成結(jié)果,使其與用戶提供的清晰參考更加貼合。請轉(zhuǎn)到ControlNet的GitHub頁面以獲取更多詳細(xì)信息和關(guān)于如何設(shè)置它的文檔!



競爭非常激烈,RTX 3080幾乎已經(jīng)追上了RTX 4060 TI 16 GB的性能,并最終成功超越了RTX 3060 12 GB。不過,盡管計算量需求巨大,RTX 4060 Ti 16GB仍然在微弱優(yōu)勢下取得了最終勝利。

SDXL 基準(zhǔn)測試:1024x1024+Upscaling
現(xiàn)在,我們嘗試加入一些超分辨率技術(shù)。讓我們看看,這款40系顯卡能否跟上RTX 3080的強(qiáng)大超分辨率能力?在這項測試中,我們將使用Real Enhanced Super-Resolution Generative Adversarial Networks技術(shù),為易于理解,后續(xù)縮寫為R-ESRGAN 4x+。


在對一張1024x1024圖像進(jìn)行2倍放大時,RTX 4060 Ti 16 GB所花費的時間上超越了RTX 3080和RTX 3060 12 GB。它僅用了5.5秒就成功完成了任務(wù),其生成圖像的速度比RTX 3080 10 GB快出了36%。



在進(jìn)行R-ESRGAN 4x+ upscaler的4倍放大時,RTX 4060 Ti 16 GB與競品之間的差距較之前有所縮小。測試結(jié)果顯示,RTX 4060 Ti 16 GB完成這項任務(wù)時的性能較RTX 3080 10 GB快23%,而RTX 3060 12 GB已能與RTX 3080的性能相提并論。盡管如此,RTX 4060 Ti 16 GB依然保持領(lǐng)先地位。根據(jù)幾次測試結(jié)果可以看出,縮放工作負(fù)載越密集,RTX 3080就越接近40系列顯卡的競爭水平。

Stable Diffusion XL最具性價比的圖形卡
在處理諸如Stable Diffusion XL這樣的AI模型時,擁有足夠的VRAM顯得尤為關(guān)鍵。從之前的測試數(shù)據(jù)中,我們可以清晰地發(fā)現(xiàn),RTX 4060 Ti 16GB是目前市場上最適合AI圖像生成的顯卡。

用戶可前往Stability AI的GitHub頁面獲取更多關(guān)于SDXL以及Stability AI其他擴(kuò)散模型的信息。