《科技觀察》014:盤(pán)古大模型:以AI織新衣,傳遞科技溫度和創(chuàng)新速度
12月的一天,華為云AI高級(jí)研究員任星一大早就忙著出發(fā),從北京飛往西昌,落地后從西昌機(jī)場(chǎng)驅(qū)車4個(gè)小時(shí),在山林峽谷間來(lái)回穿梭,再換乘有經(jīng)驗(yàn)的本地車隨“之字形”的盤(pán)山公路蜿蜒而上,輾轉(zhuǎn)大半天,他來(lái)到了身處大涼山腹地、海拔2360米的四川省涼山彝族自治州美姑縣采紅村曉明愛(ài)心小學(xué)。
這次來(lái)大涼山采紅村曉明愛(ài)心小學(xué),任星一是希望為孩子們帶去一堂生動(dòng)的科技AI課,從“衣、食、住、行”這些貼近生活的維度,讓孩子們親身體驗(yàn)到人工智能、“數(shù)字人”、VR等前沿科技;二是他和同事們還為孩子們帶去了一份特別的新年禮物——一件由華為云盤(pán)古AI大模型和時(shí)諦智能一起設(shè)計(jì)出的新年新衣。

當(dāng)天,拿到新衣服孩子們非常高興,他們歡呼雀躍著,將衣服拋向高空又緊緊抱住,穿上新衣服的他們,不僅開(kāi)心地圍成圈跳起了彝族達(dá)體舞,還頭一次真切地感受到了科技所帶來(lái)的神奇和溫度。
那么,這件由“AI”編織的新衣,究竟有何特別之處?在這背后,華為云和時(shí)諦智能的小伙伴們又付出了哪些努力呢?
這件新年新衣有點(diǎn)“小特別”
“這件衣服呀,有點(diǎn)小特別,它是人工智能和人類設(shè)計(jì)師共同設(shè)計(jì)的?!比稳涡钦n堂上告訴孩子們。
確實(shí)如此,不久前,任星在接到其朋友同時(shí)也是采紅村曉明愛(ài)心小學(xué)校長(zhǎng)喬丹的電話,喬丹此次來(lái)電是希望華為云能為學(xué)校的71名學(xué)生帶去一堂AI科普課,此外盡管孩子們已經(jīng)“不愁吃,不愁穿”,但大涼山的冬天氣溫較低,加上孩子們平時(shí)活潑好動(dòng),長(zhǎng)得快,對(duì)于溫暖結(jié)實(shí)的新衣依然有著很大的需求。
“時(shí)間緊,任務(wù)重”——為了能夠保證在新年前為孩子們送上新衣,正在從事華為云盤(pán)古大模型研發(fā)工作的任星和他的同事們,很快就想到了快速解決這一問(wèn)題的辦法,那就是可以基于華為云盤(pán)古多模態(tài)大模型中的“以文生圖”能力,為孩子們?cè)O(shè)計(jì)新年新衣,為此他們第一時(shí)間還聯(lián)合了時(shí)諦智能,希望能夠借助時(shí)諦智能的在線協(xié)同設(shè)計(jì)、實(shí)時(shí)渲染技術(shù)以及完整的產(chǎn)業(yè)鏈協(xié)同能力,在短時(shí)間內(nèi)完成新衣的設(shè)計(jì)、制作。

為此,雙方選定“派克服”作為新年新衣的版型設(shè)計(jì),這種版型設(shè)計(jì)更加保暖、耐磨、耐臟,且能夠一衣四穿;同時(shí)新衣還巧妙地融入了彝族窗格紋、羊角紋、馬纓花紋等民族服飾元素,更兼顧了實(shí)用和美觀。
更為關(guān)鍵的是,這件有點(diǎn)“小特別”的新年新衣,居然在不到一周時(shí)間內(nèi)就設(shè)計(jì)完成了,這打破了傳統(tǒng)上需要三周的設(shè)計(jì)周期限制,要知道傳統(tǒng)的服裝打樣方式通常需要經(jīng)歷企劃、設(shè)計(jì)款式圖、確認(rèn)平面版型、備料配料、制作樣衣、修改樣衣、拍照、定樣、核價(jià)、出工藝單等一系列步驟,開(kāi)發(fā)周期通常需要17—30天;其中,設(shè)計(jì)師搜集素材的時(shí)間往往占整個(gè)制作周期的70%以上,真正花在設(shè)計(jì)上的時(shí)間僅為30%。
但是,這次在這件新衣的設(shè)計(jì)過(guò)程中,借助華為云盤(pán)古多模態(tài)大模型的“以文生圖”能力,時(shí)諦智能的設(shè)計(jì)師們?cè)谄髣濍A段就能夠獲得數(shù)百?gòu)埛项A(yù)期、可二次設(shè)計(jì)的服裝圖片,大幅節(jié)省了在尋找資料和淘汰款式環(huán)節(jié)所耗費(fèi)的時(shí)間。此外,通過(guò)華為云提供的數(shù)據(jù)和算力加持,時(shí)諦智能的設(shè)計(jì)師們將盤(pán)古大模型給到的“派克服”參考版式,用線稿的方式快速繪制出,隨后將服裝線稿、花紋等導(dǎo)入時(shí)諦智能AI服裝設(shè)計(jì)系統(tǒng),進(jìn)行在線材料、顏色、圖案的搭配。在此過(guò)程中,時(shí)諦智能的實(shí)時(shí)渲染技術(shù),在線生成3D樣衣供設(shè)計(jì)師選擇。
隨后,時(shí)諦智能調(diào)動(dòng)其時(shí)尚產(chǎn)業(yè)不同領(lǐng)域的豐富供應(yīng)鏈資源,對(duì)確定的3D樣衣進(jìn)行快速生成以及二次花紋燙印,將設(shè)計(jì)、生產(chǎn)時(shí)間壓縮到了短短的兩周。

最終,在出發(fā)之前,任星非常從容地帶上了這批新年新衣,圓滿的完成了喬丹校長(zhǎng)給他交代的“特別任務(wù)”,而坐在教室中的大涼山的孩子們,聽(tīng)著任星給他們介紹這件衣服是如何做出來(lái)的時(shí),既懵懂,又興奮。黑板屏幕上,盤(pán)古大模型演示著快速批量生成羽絨服、派克服等衣服樣式,而孩子們輪番上臺(tái)按自己的喜好在時(shí)諦智能設(shè)計(jì)軟件上,切換面料、顏色和圖案……
可以說(shuō),這件有點(diǎn)“小特別”的新年新衣,不僅點(diǎn)亮了大涼山孩子們的科技?jí)?,更帶去了科技的溫暖和溫度?/p>
當(dāng)時(shí)尚設(shè)計(jì)師加持了“盤(pán)古”
事實(shí)上,這次為大涼山的孩子們?cè)O(shè)計(jì)新年新衣,僅僅只是華為云盤(pán)古多模態(tài)大模型的一次“牛刀小試”,為了更好的的助時(shí)尚設(shè)計(jì)師、時(shí)尚和服務(wù)企業(yè)展開(kāi)工作,華為云盤(pán)古多模態(tài)大模型基于億億級(jí)然圖像進(jìn)行預(yù)訓(xùn)練,并在十萬(wàn)級(jí)時(shí)尚產(chǎn)業(yè)數(shù)據(jù)上進(jìn)行微調(diào)和優(yōu)化,從而得到了非常適合應(yīng)用于時(shí)尚和服裝行業(yè)的盤(pán)古時(shí)尚多模態(tài)大模型。
也正因此,今后時(shí)尚設(shè)計(jì)師們就能夠借助華為云盤(pán)古多模態(tài)大模型提供的強(qiáng)大能力,更好地完成設(shè)計(jì)創(chuàng)作工作,而時(shí)尚和服務(wù)企業(yè)也可以籍此在快速變化的市場(chǎng)中,挖掘到更多的商機(jī),具體而言:

首先,是可以幫助設(shè)計(jì)師洞察流行趨勢(shì)。盤(pán)古多模態(tài)大模型可對(duì)十萬(wàn)級(jí)時(shí)尚產(chǎn)業(yè)數(shù)據(jù)的顏色、版型、圖案等元素進(jìn)行分析后,批量生成與流行趨勢(shì)接近的服飾,將當(dāng)下流行的時(shí)尚元素視覺(jué)化地提煉并呈現(xiàn)給設(shè)計(jì)師,幫助時(shí)尚企業(yè)與行業(yè)洞察用戶的消費(fèi)意向,預(yù)判行業(yè)流行趨勢(shì)。
其次,是支持生成多樣化的服飾。盤(pán)古多模態(tài)大模型基于億級(jí)自然圖像和十萬(wàn)級(jí)時(shí)尚產(chǎn)業(yè)數(shù)據(jù),支持以文生圖,向設(shè)計(jì)師推薦風(fēng)格多樣、款式多樣的服飾圖片,包括派克服、羽絨服、開(kāi)衫等款式,這樣就可以減少設(shè)計(jì)師搜集素材的時(shí)間,讓設(shè)計(jì)師能夠在創(chuàng)作前期根據(jù)不同的推薦結(jié)果快速積累靈感,快速地進(jìn)入二次創(chuàng)作。
第三,是幫助批量生成符合要求的服飾圖片。傳統(tǒng)設(shè)計(jì)過(guò)程中,設(shè)計(jì)師在搜索引擎尋找參考時(shí),通常會(huì)遇到信息冗雜、搜索結(jié)果不精確等問(wèn)題,從而需要花費(fèi)大量時(shí)間反復(fù)搜索、反復(fù)收集,而應(yīng)用盤(pán)古時(shí)尚多模態(tài)大模型后,設(shè)計(jì)師僅需輸入目標(biāo)款式的對(duì)應(yīng)文本描述,如“條紋開(kāi)衫”,就可以快速獲得與文本描述相匹配的服裝圖片,縮短創(chuàng)作構(gòu)思過(guò)程。不僅如此,盤(pán)古多模態(tài)大模型經(jīng)過(guò)一系列量化等工程優(yōu)化方案,還能夠有效降低模型推理顯存占用量,從而提升單次推理生成的圖片數(shù)量,當(dāng)前可支撐“一站式”批量呈現(xiàn)128張推理生成的服飾圖片。
最后,是具備分鐘級(jí)設(shè)計(jì)推理能力。面向億級(jí)數(shù)據(jù)的訓(xùn)練,假設(shè)僅僅利用單節(jié)點(diǎn)8卡V100來(lái)訓(xùn)練盤(pán)古大模型,耗費(fèi)的時(shí)間往往需要以年計(jì)算。為了應(yīng)對(duì)并行處理海量數(shù)據(jù)的挑戰(zhàn)、提高模型預(yù)訓(xùn)練的效率,盤(pán)古團(tuán)隊(duì)融合了多個(gè)先進(jìn)的優(yōu)化策略,如模型并行、數(shù)據(jù)并行、混合精度運(yùn)算、稀疏訓(xùn)練等。同時(shí),基于華為云高效的節(jié)點(diǎn)并行調(diào)度算法,盤(pán)古多模態(tài)大模型最終能夠以天級(jí)為單位訓(xùn)練完成,而盤(pán)古時(shí)尚多模態(tài)大模型,更利用了Attention Cache等技術(shù)加快推理速度,在華為云提供的單卡V100支持上,目前就實(shí)現(xiàn)了支撐分鐘級(jí)推理速度,由此大大提升了時(shí)尚設(shè)計(jì)師和服裝企業(yè)的設(shè)計(jì)開(kāi)發(fā)效率。
據(jù)介紹,目前面向時(shí)尚行業(yè)的盤(pán)古多模態(tài)大模型已具備跨模態(tài)檢索、圖文生成、時(shí)裝輔助設(shè)計(jì)、文案生成等相關(guān)能力,并在多項(xiàng)數(shù)據(jù)集上實(shí)現(xiàn)領(lǐng)先性能,如在COCO以文搜圖的零樣本任務(wù)中,盤(pán)古多模態(tài)大模型就已經(jīng)超過(guò)了業(yè)界標(biāo)桿算法CLIP、ALIGN,達(dá)到業(yè)界最佳精度。
在此基礎(chǔ)上,華為云也正在將盤(pán)古多模態(tài)大模型接口開(kāi)放給多家時(shí)尚設(shè)計(jì)公司調(diào)用,希望能更好的賦能時(shí)尚設(shè)計(jì)產(chǎn)業(yè)。例如,作為一家集數(shù)字創(chuàng)意與智能互聯(lián)的新型科技公司,時(shí)諦智能目前就正在基于盤(pán)古大模型的技術(shù)和時(shí)諦智能的在線協(xié)同設(shè)計(jì)、實(shí)時(shí)渲染以及完整的產(chǎn)業(yè)鏈協(xié)同能力,讓服裝設(shè)計(jì)周期從三周縮短至3-5天,由此能夠更好地化解中國(guó)時(shí)尚設(shè)計(jì)產(chǎn)業(yè)中過(guò)去常常面臨的開(kāi)發(fā)設(shè)計(jì)周期長(zhǎng)、生產(chǎn)成本高等一系列的難題。
客觀地說(shuō),今天的中國(guó)已成為全球第二大消費(fèi)市場(chǎng)、第一大貿(mào)易大國(guó)。以中國(guó)服裝市場(chǎng)為例,服裝市場(chǎng)在過(guò)去的幾十年中一直保持著兩位數(shù)的增長(zhǎng),如今更是已趕超美國(guó)成為全球最大的市場(chǎng),規(guī)模近3000億美元。從這個(gè)角度來(lái)看,盤(pán)古時(shí)尚多模態(tài)大模型的“應(yīng)運(yùn)而生”,對(duì)于整個(gè)服裝產(chǎn)業(yè)和時(shí)尚設(shè)計(jì)領(lǐng)域無(wú)疑有著非常重要的意義。
一方面,時(shí)尚設(shè)計(jì)某種意義上也是一種新的生產(chǎn)力,隨著盤(pán)古時(shí)尚多模態(tài)大模型的“入場(chǎng)”,對(duì)于那些缺乏設(shè)計(jì)團(tuán)隊(duì)的中小企業(yè)或者代工企業(yè)而言,將會(huì)提供一種強(qiáng)有力支撐,這是因?yàn)檫@些企業(yè)可以利用AI來(lái)創(chuàng)作生產(chǎn)所需的圖案紋樣,從而彌補(bǔ)設(shè)計(jì)團(tuán)隊(duì)人力資源的不足,由此進(jìn)一步強(qiáng)化中國(guó)服裝產(chǎn)業(yè)的市場(chǎng)競(jìng)爭(zhēng)力;另一方面,它還能夠?yàn)楦嗟臅r(shí)尚設(shè)計(jì)師們提供源源不斷的創(chuàng)意和靈感,極大地提升中國(guó)時(shí)尚設(shè)計(jì)產(chǎn)業(yè)的的原創(chuàng)力和原創(chuàng)量,進(jìn)而加快整個(gè)服裝和時(shí)尚設(shè)計(jì)產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型升級(jí)。
盤(pán)古大模型的“七十二變”
回頭來(lái)看,自今年4月份華為云盤(pán)古系列超大規(guī)模預(yù)訓(xùn)練模型發(fā)布以來(lái),就以超強(qiáng)的實(shí)力“震撼”了業(yè)界。盤(pán)古系列超大預(yù)訓(xùn)練模型包括了中文語(yǔ)言(NLP)、視覺(jué)(CV)大模型,多模態(tài)大模型、科學(xué)計(jì)算大模型。這其中,盤(pán)古NLP大模型是業(yè)界首個(gè)千億級(jí)生成與理解中文NLP大模型;華為云在視覺(jué)領(lǐng)域打造的包含超過(guò)30億參數(shù)的CV大模型,也在不斷突破行業(yè)的極限。

華為云人工智能領(lǐng)域首席科學(xué)家、國(guó)際歐亞科學(xué)院院士、IEEE Fellow田奇表示,下一階段,盤(pán)古研發(fā)團(tuán)隊(duì)將繼續(xù)對(duì)盤(pán)古多模態(tài)大模型進(jìn)行迭代演進(jìn),持續(xù)開(kāi)發(fā)上游通用能力;同時(shí)也會(huì)將把大模型拓展到更多的行業(yè)領(lǐng)域,讓盤(pán)古多模態(tài)大模型演化成諸多盤(pán)古行業(yè)多模態(tài)大模型,從而加速盤(pán)古系列預(yù)訓(xùn)練大模型的“上天”(通用能力打造)與“入地”(行業(yè)落地)步伐。
在“上天”方面,華為云目前就正在針對(duì)盤(pán)古大模型的預(yù)訓(xùn)練技術(shù)、大模型的微調(diào)技術(shù)以及大模型的應(yīng)用技術(shù),展開(kāi)了持續(xù)的探索與創(chuàng)新。
一是,在盤(pán)古大模型的預(yù)訓(xùn)練技術(shù)領(lǐng)域,華為云的目標(biāo)是希望能夠以更低的成本得到更大的模型,并且能夠快速地遷移到不同的行業(yè),適配不同的語(yǔ)言。為此,在預(yù)訓(xùn)練技術(shù)的結(jié)構(gòu)、初始化和訓(xùn)練方面盤(pán)古大模型也都展開(kāi)了新的實(shí)踐。以結(jié)構(gòu)環(huán)節(jié)為例,盤(pán)古大模型就基于同網(wǎng)絡(luò)的多模型融合技術(shù),以更少的GPU卡,更少的訓(xùn)練時(shí)間,來(lái)訓(xùn)練更大更優(yōu)的模型;初始化環(huán)節(jié)方面,華為云通過(guò)自適應(yīng)網(wǎng)絡(luò)參數(shù)遷移等創(chuàng)新方案,也大幅度降低了模型的訓(xùn)練難度,提升了訓(xùn)練的速度;在訓(xùn)練環(huán)節(jié),華為云也正通過(guò)模型融合技術(shù)、領(lǐng)域融合技術(shù)以及跨語(yǔ)言映射技術(shù)等,實(shí)現(xiàn)了更快更穩(wěn)地訓(xùn)練。
二是,在盤(pán)古大模型的微調(diào)技術(shù)領(lǐng)域,華為云的目標(biāo)是希望在大模型的基礎(chǔ)上,用更少的樣本、更短的選擇時(shí)間來(lái)得到更好的微調(diào)的結(jié)果。為此,華為云通過(guò)多任務(wù)微調(diào)技術(shù)、知識(shí)積累技術(shù)、零樣本推理技術(shù)等,有效地降低了微調(diào)過(guò)程中所需要的樣本訓(xùn)練數(shù)量和訓(xùn)練時(shí)間。此外,在模型參數(shù)微調(diào)方面,華為云也正通過(guò)數(shù)據(jù)降本、樣本主動(dòng)標(biāo)注、樣本能力挖掘等技術(shù),實(shí)現(xiàn)微調(diào)方面的改進(jìn)和優(yōu)化。
三是,在盤(pán)古大模型的應(yīng)用技術(shù)領(lǐng)域,華為云重點(diǎn)關(guān)注生成、搜索、翻譯等領(lǐng)域的技術(shù)創(chuàng)新。以“生成”為例,華為云希望通過(guò)大模型助力文學(xué)的創(chuàng)作、對(duì)話、問(wèn)答;“搜索”方面,華為云的目標(biāo)是讓盤(pán)古大模型能夠更好地支撐文本、圖片、視頻、音頻等不同模態(tài)的搜索,在搜索領(lǐng)域更好的發(fā)揮出大模型的價(jià)值;而“在翻譯”方面,華為云主要基于不同語(yǔ)言的大模型來(lái)支持多種語(yǔ)言之間的相互翻譯等等。
“入地”方面,盤(pán)古大模型同樣也成為了整個(gè)AI產(chǎn)業(yè)發(fā)展的關(guān)鍵底座,正在千行百業(yè)中發(fā)揮越來(lái)越重要的價(jià)值,除了上文中提到的時(shí)尚設(shè)計(jì)產(chǎn)業(yè),華為云盤(pán)古大模型還在超過(guò)100個(gè)實(shí)際場(chǎng)景中取得應(yīng)用,覆蓋金融、醫(yī)療、工業(yè)、氣象、電力、零售、政務(wù)等多個(gè)領(lǐng)域。
比如,盤(pán)古CV大模型目前已經(jīng)在醫(yī)學(xué)影像、金融、工業(yè)質(zhì)檢等100余項(xiàng)實(shí)際任務(wù)中得到了驗(yàn)證,平均縮短開(kāi)發(fā)時(shí)間80%以上,極大地提升了開(kāi)發(fā)效率以及模型性能。再比如,盤(pán)古NLP大模型具備廣泛的運(yùn)用場(chǎng)景,在金融領(lǐng)域,可以輔助識(shí)別企業(yè)風(fēng)險(xiǎn),助力企業(yè)盡調(diào)和項(xiàng)目審核。
在制藥行業(yè),盤(pán)古大模型還學(xué)習(xí)了17億個(gè)藥物小分子的化學(xué)結(jié)構(gòu)。因此,在藥物生成方面,就能夠?qū)π》肿踊衔锏莫?dú)特信息的深度表征、對(duì)靶點(diǎn)蛋白質(zhì)的計(jì)算與匹配,以及對(duì)新分子生化屬性的預(yù)測(cè),從而高效生成藥物新分子;在藥物優(yōu)化方面,盤(pán)古大模型也可以對(duì)藥物的藥性進(jìn)行判斷,如針對(duì)毒性、溶解性、蛋白質(zhì)靶點(diǎn)的預(yù)測(cè),由此實(shí)現(xiàn)了對(duì)篩選后的先導(dǎo)藥進(jìn)行定向優(yōu)化等等。
而展望未來(lái),除了賦能千行百業(yè)之外,華為云也正在聯(lián)合更多的行業(yè)伙伴構(gòu)建全新的行業(yè)生態(tài),在標(biāo)準(zhǔn)制定、中小微企業(yè)模型算力方面持續(xù)努力,讓盤(pán)古大模型實(shí)現(xiàn)更快的落地和扎根,最終通過(guò)降低AI開(kāi)發(fā)和使用門(mén)檻,更好地推動(dòng)人工智能規(guī)模化的商用,由此開(kāi)啟AI的千億、萬(wàn)億市場(chǎng),將人工智能帶入全新的時(shí)代。
全文總結(jié),在大涼山深處,孩子們穿上了華為云盤(pán)古大模型“編織”的新年新衣,感受到了AI帶來(lái)的溫度;而越來(lái)越多的企業(yè)和行業(yè),也正在借助華為云盤(pán)古大模型的“七十二變”能力,感受到了AI帶來(lái)的創(chuàng)新速度和高度,相信在不久的將來(lái),華為云盤(pán)古大模型也必將開(kāi)啟新一輪的AI應(yīng)用浪潮,在千行百業(yè)中爆發(fā)出更多的價(jià)值。