國內(nèi)高校最大的云上科研智算平臺CFFF上線
作者:范昕茹 來源:IT時報
6月27日,國內(nèi)高校最大的云上科研智算平臺CFFF(Computing for the Future at Fudan)在復(fù)旦大學(xué)正式上線。這臺為發(fā)現(xiàn)和解決復(fù)雜科學(xué)問題而建的科研“超級計算機(jī)”由復(fù)旦大學(xué)與阿里云、中國電信共同打造,以公共云模式提供超千卡并行智能計算,支持千億參數(shù)的大模型訓(xùn)練,在國內(nèi)高校中尚屬首例,也走在了斯坦福大學(xué)等國際知名高校的前面。

同時,復(fù)旦大學(xué)與阿里巴巴集團(tuán)宣布雙方達(dá)成全面戰(zhàn)略合作,未來將在科研融合創(chuàng)新、科研合作、人才培養(yǎng)等領(lǐng)域展開深入合作,共同促進(jìn)AI for Science從原始創(chuàng)新到應(yīng)用落地的全鏈路發(fā)展。
真正意義上的“超級計算機(jī)”
CFFF智算平臺全稱Computing for the Future at Fudan ,以復(fù)旦大學(xué)“博學(xué)而篤志,切問而近思”的校訓(xùn)為靈感,是國內(nèi)高校最大的云上科研智算平臺 。在中國工程院院士、阿里云創(chuàng)始人王堅(jiān)的解讀中,CFFF有“計算,因?yàn)樵趶?fù)旦而創(chuàng)造了未來”之意 。
活動現(xiàn)場,王堅(jiān)回憶起2008年剛創(chuàng)立阿里云,回學(xué)校演講時所說過的話:“我說為什么要做云計算,是希望每個同學(xué)都能夠用得起超算。”在他看來,云計算的意義在于讓每個人在計算面前變得平等,每個人都可以用計算來創(chuàng)造他應(yīng)該創(chuàng)造的價值。而讓學(xué)生用上更普惠的算力,意味著給科研帶來更多可能。
“高校和企業(yè)其實(shí)可以創(chuàng)造出很多很美妙的東西?!蓖鯃?jiān)舉了個例子,IBM和哥倫比亞大學(xué)的合作,誕生了計算機(jī)專業(yè)。而當(dāng)年MIT跟貝爾實(shí)驗(yàn)室的合作,才有了今天幾乎每個大學(xué)工學(xué)院都有的通信專業(yè)。 “正是這些合作,創(chuàng)造出一個新領(lǐng)域,一個新機(jī)會?!盋FFF平臺的上線,于他而言,是一個圓夢時刻。

據(jù)介紹,CFFF平臺由面向多學(xué)科融合創(chuàng)新的AI for Science智能計算集群“切問”一號和面向高精尖研究的專用高性能計算集群“近思”一號兩部分組成。借助阿里云全球領(lǐng)先的大規(guī)模異構(gòu)算力融合調(diào)度技術(shù)、分級存儲技術(shù)、AI與大數(shù)據(jù)一體化技術(shù),“切問”和“近思”連成了一臺真正意義上的“超級計算機(jī)”。這使得復(fù)旦四校區(qū)的所有實(shí)驗(yàn)設(shè)備都能高速接入,做到異構(gòu)算力統(tǒng)一管理,計算任務(wù)統(tǒng)一調(diào)度,滿足不同應(yīng)用場景下的科學(xué)智能研究與應(yīng)用需求。
CFFF平臺還擁有國內(nèi)高校最大規(guī)模的多級數(shù)據(jù)冷熱分層存儲集群,解決了海量科研數(shù)據(jù)無法長期備份的痛點(diǎn),并支持云上高速傳輸。以往PB級科研數(shù)據(jù)從復(fù)旦校內(nèi)傳到西部數(shù)據(jù)中心需要兩周,如今當(dāng)天就能完成,真正實(shí)現(xiàn)了“東數(shù)西算”。
目前,CFFF平臺上的第一個科研成果已經(jīng)誕生。復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院李昊團(tuán)隊(duì)近期發(fā)布了45億參數(shù)量的中短期天氣預(yù)報大模型,預(yù)測效果在公開數(shù)據(jù)集上首次達(dá)到了業(yè)界公認(rèn)的ECMWF(歐洲中期天氣預(yù)報中心)集合平均水平,將預(yù)測速度從原來的小時級縮短到了3秒內(nèi)。
復(fù)旦大學(xué)校長、中國科學(xué)院院士金力表示,在數(shù)據(jù)和智能技術(shù)驅(qū)動的“大科學(xué)時代”,如何在日新月異的科技創(chuàng)新環(huán)境中贏得主動,在關(guān)鍵領(lǐng)域取得創(chuàng)新突破,是時代給予高校的命題。以CFFF平臺為代表的智算平臺作為一種新興的科研超算架構(gòu),將成為科研的重要支撐力量,極大提升科研效率、降低科研成本,加速科學(xué)原理發(fā)現(xiàn)和技術(shù)突破,并有力推動科學(xué)大模型的落地。
金力也希望,基于CFFF平臺,在復(fù)旦建成一批具有世界級影響力的科學(xué)大模型,例如生命科學(xué)大模型、材料科學(xué)大模型、大氣科學(xué)大模型、集成電路大模型等。
首屆世界科學(xué)智能大賽正式啟動
作為CFFF智算平臺走出國門,服務(wù)科研的第一步,在CFFF智算平臺發(fā)布的同時,首屆世界科學(xué)智能大賽正式面向全球科研人員啟動。

復(fù)旦大學(xué)浩清教授、人工智能創(chuàng)新與產(chǎn)業(yè)研究院院長漆遠(yuǎn)介紹說,大賽將聚焦生命科學(xué)、大氣科學(xué)、材料科學(xué)、流體力學(xué)、量子化學(xué)等五大前沿?zé)衢T領(lǐng)域,面向全球100多個國家和地區(qū)的創(chuàng)新企業(yè)、知名高校、科研院所發(fā)出邀請。大賽期間,CFFF平臺將為參賽隊(duì)伍提供免費(fèi)訓(xùn)練算力,并以更普惠的算力長期支持部分科研項(xiàng)目。
“在今天的大模型時代,我們怎么能夠把這種千卡并行計算的能力對科研開放出來,是一個關(guān)鍵問題?!痹谄徇h(yuǎn)看來,大賽的初衷就在于讓更多的學(xué)生培養(yǎng)出這種能力,共同解決關(guān)鍵性的科學(xué)問題。
在賽題的設(shè)置上,大賽也緊扣各大賽道中的關(guān)鍵性問題。在生命科學(xué)賽道,大賽就以生物學(xué)年齡評價與老年病風(fēng)險預(yù)測為賽題,要求參賽者通過測量和分析生物體內(nèi)特定指標(biāo)或生理過程的狀態(tài),評估個體的生理年齡和健康狀況。為了幫助參賽者更好地基于甲基化測量對健康個體的年齡進(jìn)行預(yù)測,大賽為參賽者開放了近萬樣本的個體甲基化數(shù)據(jù)以及其年齡、性別及老年病患病信息。
而在材料科學(xué)賽道,大賽則要求參賽者以MOF材料的預(yù)測合成為切入點(diǎn),探求計算成本更低、更高效、更精確的求解方法。大賽將為參賽者提供1500種MOF材料的合成條件數(shù)據(jù)集,以便選手更好地建立預(yù)測模型,對MOF材料的合成條件做出更準(zhǔn)確的預(yù)測。
首屆世界科學(xué)智能大賽的組織和評審陣容也十分豪華。除了主辦方復(fù)旦大學(xué),大賽還聯(lián)合了阿里云天池平臺、中國電信、中國信通院云大所等力量,分別邀請了五位院士作為各大賽道的評審。大賽獎金池高達(dá)100萬元,各賽道的優(yōu)勝選手還將獲得復(fù)旦大學(xué)CFFF平臺算力支持、與復(fù)旦大學(xué)人工智能創(chuàng)新與產(chǎn)業(yè)研究院及各基礎(chǔ)學(xué)科開展科研合作的機(jī)會。阿里云也將為參賽選手提供了機(jī)器學(xué)習(xí)平臺PAI等免費(fèi)試用等算力產(chǎn)品計算資源,助力選手入圍晉級。
賽程方面,大賽初賽將于7月25日開啟,9月底各賽道分批開啟復(fù)賽,經(jīng)過線上賽程遴選出的優(yōu)秀隊(duì)伍將在11月進(jìn)行線下答辯,角逐出最終名次?!跋M蠹夷苡萌斯ぶ悄艿耐h(yuǎn)鏡一起來探索基礎(chǔ)科研的星辰大海,”漆遠(yuǎn)說,“用科學(xué)智能智算未來?!?/p>