人民網(wǎng)
人民網(wǎng)

國家超算互聯(lián)網(wǎng)平臺正式上線,連接10余個算力中心,提供超3200款商品

打通算力服務(wù)“最后一公里”

本報記者 谷業(yè)凱
2024年05月06日14:12 | 來源:人民網(wǎng)-《人民日報》
小字號

  成都超算中心科研人員在巡檢機房設(shè)備。
  新華社記者 劉 坤攝

  今年《政府工作報告》提出:“適度超前建設(shè)數(shù)字基礎(chǔ)設(shè)施,加快形成全國一體化算力體系,培育算力產(chǎn)業(yè)生態(tài)?!苯眨瑖页慊ヂ?lián)網(wǎng)平臺正式上線。國家超算互聯(lián)網(wǎng)可將全國眾多超算中心連接起來,構(gòu)建一體化的超算算力網(wǎng)絡(luò)和服務(wù)平臺。目前,國家超算互聯(lián)網(wǎng)平臺已經(jīng)連接了10余個算力中心,已有超過200家應(yīng)用、數(shù)據(jù)、模型等服務(wù)商入駐,并提供超3200款商品,這些商品覆蓋科學(xué)計算、工業(yè)仿真、人工智能模型訓(xùn)練等前沿數(shù)字化創(chuàng)新領(lǐng)域,滿足經(jīng)濟社會發(fā)展對先進計算服務(wù)的需求。

  為何要建設(shè)國家超算互聯(lián)網(wǎng)?國家超算互聯(lián)網(wǎng)如何實現(xiàn)算力資源統(tǒng)籌調(diào)度、賦能產(chǎn)業(yè)創(chuàng)新?

  通過市場化的運營和服務(wù)體系,實現(xiàn)算力資源統(tǒng)籌調(diào)度

  打開國家超算互聯(lián)網(wǎng)“商品廣場”,由復(fù)旦大學(xué)類腦智能科學(xué)與技術(shù)研究院開發(fā)的“數(shù)字孿生腦平臺”顯示在售。這個平臺整合了多模態(tài)的生物數(shù)據(jù)和先驗知識,利用超算集群計算資源,將相關(guān)數(shù)據(jù)與算法集成為一個數(shù)字孿生的腦模擬平臺,為腦科學(xué)與類腦智能研究提供服務(wù)支撐。用戶在國家超算互聯(lián)網(wǎng)上填寫使用申請表后,即可申請試用“數(shù)字孿生腦平臺”。詳情頁上,“商品說明”“服務(wù)與支持”“客戶案例”“商品評價”等信息一目了然。

  在國家超算互聯(lián)網(wǎng)平臺上,科研人員、仿真工程師、人工智能研發(fā)人員可以像網(wǎng)絡(luò)購物一樣方便地購買和使用算力基礎(chǔ)資源、應(yīng)用軟件、應(yīng)用平臺、數(shù)據(jù)資產(chǎn)等,并按照軟件類型、算力、時長等付費。

  超算,即超級計算或高性能計算,經(jīng)常應(yīng)用于高精尖科研領(lǐng)域,被視為科技突破的“發(fā)動機”。如何更好地發(fā)揮超算的性能、高效求解各類應(yīng)用中的科學(xué)問題,是超算發(fā)展的關(guān)鍵。

  近年來,隨著超算與人工智能、大數(shù)據(jù)等新技術(shù)持續(xù)融合,超算應(yīng)用場景日益豐富,服務(wù)科學(xué)研究、產(chǎn)業(yè)發(fā)展的方方面面,成為科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新的重要驅(qū)動力。另一方面,算力已從單純以性能比拼,過渡到服務(wù)能力、計算應(yīng)用、綠色低碳等新優(yōu)勢的比拼,對超算環(huán)境和應(yīng)用提出了更高的要求。

  在此背景下,2023年4月,國家超算互聯(lián)網(wǎng)正式啟動建設(shè),目標(biāo)是突破現(xiàn)有單體超算中心運營模式,緊密連接供需方,通過市場化的運營和服務(wù)體系,實現(xiàn)算力資源統(tǒng)籌調(diào)度,以應(yīng)對算力設(shè)施分布不均衡、接口不統(tǒng)一、應(yīng)用軟件自主研發(fā)和推廣不足等問題,有效支撐原始科學(xué)創(chuàng)新、重大工程突破、經(jīng)濟高質(zhì)量發(fā)展等目標(biāo),成為支撐數(shù)字中國建設(shè)的“高速路”。

  國家超算互聯(lián)網(wǎng)依托一體化的算力調(diào)度、數(shù)據(jù)傳輸、生態(tài)協(xié)作體系,實現(xiàn)算力供給、軟件開發(fā)、數(shù)據(jù)交易、模型服務(wù)等產(chǎn)業(yè)鏈各主體的緊密連接,構(gòu)建市場化、互聯(lián)網(wǎng)化、服務(wù)化、標(biāo)準(zhǔn)化的高性能計算服務(wù)環(huán)境。經(jīng)過近一年建設(shè),國家超算互聯(lián)網(wǎng)工作取得了突破性進展,并完成了首階段的建設(shè)目標(biāo)。

  從“提供算力”向“提供服務(wù)”轉(zhuǎn)變,國家超算互聯(lián)網(wǎng)有望促使超算應(yīng)用模式轉(zhuǎn)變。中國科學(xué)院院士、超算互聯(lián)網(wǎng)總體專家組組長錢德沛解釋道:“狹義上,國家超算互聯(lián)網(wǎng)通過高速網(wǎng)絡(luò)將全國眾多的超算中心連接起來,構(gòu)建統(tǒng)一使用、對外服務(wù)的基礎(chǔ)設(shè)施。廣義上,則是通過互聯(lián)網(wǎng)的形式,方便更多用戶獲取資源。同時,軟件和服務(wù)也可以給更多人使用,實現(xiàn)計算資源、軟件資源、應(yīng)用解決方案資源的深度整合,從根本上提高超算的應(yīng)用水平。”

  在超算互聯(lián)網(wǎng)總體專家組副組長、上海交通大學(xué)教授管海兵看來,我國超算發(fā)展經(jīng)歷了硬件積累、軟件創(chuàng)新到高性能計算環(huán)境建設(shè)的發(fā)展階段,以互聯(lián)網(wǎng)思維來運營超算算力,把相關(guān)軟硬件、從業(yè)者和計算能力連接起來,能夠更好發(fā)揮超算作用,為經(jīng)濟社會發(fā)展服務(wù)。

  已迭代100多個版本,建立了大型的基礎(chǔ)服務(wù)平臺

  超算中心與智算中心、云計算中心的應(yīng)用場景有明顯差異。云計算中心即傳統(tǒng)數(shù)據(jù)中心,主要提供通用算力、大數(shù)據(jù)分析等服務(wù),在數(shù)據(jù)存儲和虛擬化等方面具備優(yōu)勢;智算中心則主要應(yīng)用于人工智能、機器學(xué)習(xí)、圖像處理、語音識別等領(lǐng)域,這些應(yīng)用需要快速迭代和優(yōu)化模型,對計算效率要求較高;超算中心通常由大量的計算節(jié)點和高速互聯(lián)網(wǎng)絡(luò)組成,可同時進行大量并行計算任務(wù),應(yīng)用于大規(guī)模科學(xué)計算、工程仿真、氣象預(yù)報等。

  “很多的科學(xué)計算里面需要人工智能技術(shù),很多人工智能應(yīng)用也需要高精度、混合精度的計算。未來,單一精度的計算會變少,混合精度的計算會成為主流。多元融合、超智融合將是算力基礎(chǔ)設(shè)施發(fā)展的重要趨勢?!眹腋咝阅苡嬎銠C工程技術(shù)研究中心副主任曹振南說。

  中國信息通信研究院副院長王志勤認為,過去的通用算力正逐漸向超算、智算、通用算力三種類型方向發(fā)展,“因此,分散化的算力如何通過更好的機制實現(xiàn)互聯(lián)互通,亟須一些新技術(shù)、新模式的探索?!?/p>

  曹振南介紹,架構(gòu)上,國家超算互聯(lián)網(wǎng)可分為3層。最底層是匯聚各個不同算力中心的異構(gòu)算力資源;中間通過一體化服務(wù)與調(diào)度平臺,進行分布式異構(gòu)算力資源調(diào)度,與應(yīng)用服務(wù)化封裝、發(fā)布、管理,包括面向不同用戶、不同資源的各類管理、交易、作業(yè)等;最上層則建立了算力應(yīng)用商店,為用戶提供各種算力、軟件、數(shù)據(jù)、模型、源碼、技術(shù)等。

  國家超算互聯(lián)網(wǎng)建設(shè)過程中,多家國家/區(qū)域超算中心、應(yīng)用軟件單位、支撐單位,以及從事超算相關(guān)領(lǐng)域的企業(yè)和高校院所等組織成立了超算互聯(lián)網(wǎng)聯(lián)合體。成員單位從成立時的22家擴展到現(xiàn)在的128家。聯(lián)合體還成立了工作組和研發(fā)團隊,開展相關(guān)設(shè)計研發(fā)工作。

  “同時,我們也希望用互聯(lián)網(wǎng)的模式‘共創(chuàng)’整個國家超算互聯(lián)網(wǎng)。在研發(fā)過程中,有500多個共創(chuàng)者參與進來,進行軟件打包、適配、軟件應(yīng)用設(shè)計等工作,來自各個行業(yè)的1000多位‘體驗官’給我們提出了很多寶貴意見。一年來,國家超算互聯(lián)網(wǎng)平臺已迭代100多個版本,形成10個主要模塊和100萬行以上的源代碼,建立了大型的基礎(chǔ)服務(wù)平臺?!辈苷衲险f。

  曹振南表示,面向未來,國家超算互聯(lián)網(wǎng)要建立更多元的算力服務(wù)模式和更多樣的資源部署模式?!拔覀兿M麨橛脩籼峁稽c接入、隨取隨用’的服務(wù)。用戶無需關(guān)注算力類型、地理位置、軟件歸屬,甚至不需要知道誰在為你服務(wù)?!?/p>

  建立良好的商業(yè)模式,使更多行業(yè)和領(lǐng)域受益于超算

  近年來,我國在超算互聯(lián)網(wǎng)領(lǐng)域已經(jīng)開展了一些探索和實踐。

  比如,國家超算無錫中心聯(lián)合國家超算廣州中心等超算中心,以及清華大學(xué)、之江實驗室等應(yīng)用單位開展了超算互聯(lián)網(wǎng)技術(shù)體系和應(yīng)用模式研究;山東上線超算互聯(lián)網(wǎng)工程,以實現(xiàn)數(shù)據(jù)和算力的互聯(lián)互通,打造“山東算網(wǎng)”。2023年10月,工業(yè)和信息化部等6部門印發(fā)了《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》,提出“探索構(gòu)建布局合理、泛在連接、靈活高效的算力互聯(lián)網(wǎng)”。

  中國科學(xué)院院士鄂維南認為,國家超算互聯(lián)網(wǎng)應(yīng)用生態(tài)的打造,有利于降低超算應(yīng)用門檻,加快科學(xué)計算和人工智能等技術(shù)的發(fā)展。華大生命科學(xué)研究院生物信息首席科學(xué)家黎宇翔表示,有了國家超算互聯(lián)網(wǎng),相當(dāng)于打通了算力服務(wù)的“最后一公里”,可以基于自己的平臺跟國家超算互聯(lián)網(wǎng)結(jié)合,進行跨區(qū)域的數(shù)據(jù)傳輸和計算,選擇最合適的算力類型,適配具體的應(yīng)用。

  在國家超算天津中心黨組書記、應(yīng)用研發(fā)首席科學(xué)家孟祥飛看來,經(jīng)過多年發(fā)展,我國超算研制和建設(shè)已經(jīng)規(guī)?;?,形成了廣泛的超算算力布局能力。“從算力供給側(cè)來說,超算‘微—宏’架構(gòu)差異越來越大,可擴展性、可靠性、可編程性等方面也面臨巨大的挑戰(zhàn)。新的數(shù)據(jù)范式的發(fā)展,使得超級計算機要兼顧數(shù)值計算、數(shù)據(jù)處理等各方面的應(yīng)用需求,它的支撐能力也面臨著巨大的挑戰(zhàn)。從需求側(cè)來說,重大科學(xué)與工程領(lǐng)域面臨巨大的多元化算力需求,而多學(xué)科交叉、多領(lǐng)域團隊協(xié)同的系統(tǒng)性創(chuàng)新,底層需要有一個綜合能力的信息化載體、算力載體來支撐?!?/p>

  中國工程院院士、清華大學(xué)教授鄭緯民認為,推動國家超算互聯(lián)網(wǎng)平臺再上新臺階,一是要提升平臺的互聯(lián)帶寬,二是要將超算節(jié)點之間的互通做好,統(tǒng)一編程框架,使一個程序可以在不同機器上運行,三是要進一步挖掘超算互聯(lián)網(wǎng)平臺的新應(yīng)用。

  錢德沛說:“構(gòu)建支撐應(yīng)用的國家超算互聯(lián)網(wǎng),不單要做網(wǎng)絡(luò),更重要的是建立超算互聯(lián)網(wǎng)平臺上各角色之間良好的商業(yè)模型,鼓勵更多的力量投入超算應(yīng)用事業(yè),使更多行業(yè)和領(lǐng)域受益于超算,讓超算資源得到充分應(yīng)用,成為支撐國家創(chuàng)新發(fā)展的基礎(chǔ)設(shè)施?!?/p>

  《 人民日報 》( 2024年05月06日 19 版)

(責(zé)編:樸馨語、張永生)

分享讓更多人看到

返回頂部