當(dāng)前,算力正以前所未有的姿態(tài)重塑著世界。
在上海臨港片區(qū)的中國(guó)電信“臨港智算谷”(以下簡(jiǎn)稱“智算谷”)內(nèi),一場(chǎng)數(shù)字革命正悄然上演??萍紩r(shí)代,如何高效擁抱“數(shù)字”浪潮?從千卡到萬(wàn)卡,十萬(wàn)卡、百萬(wàn)卡,這個(gè)趨勢(shì)是可持續(xù)的嗎?算力能為企業(yè)帶來(lái)哪些效能?在這里,能尋覓到答案。
步入智算谷機(jī)房,映入眼簾的是井然有序的機(jī)房景象,上千臺(tái)服務(wù)器整齊排列,猶如科技矩陣,在風(fēng)冷與液冷技術(shù)的雙重守護(hù)下高效運(yùn)行,為各類前沿科技應(yīng)用提供著源源不斷的動(dòng)力。
2023年9月,智算谷在行業(yè)期待中正式啟動(dòng),這不僅是上海臨港新片區(qū)發(fā)展歷程中的一個(gè)里程碑時(shí)刻,更是上海區(qū)域數(shù)字經(jīng)濟(jì)發(fā)展的強(qiáng)勁脈搏。尤為矚目的是,智算谷打造了中國(guó)電信“兩彈一優(yōu)”高標(biāo)準(zhǔn)AIDC示范基地,即彈性供電、彈性供冷與優(yōu)化氣流組織。2024年1月,上海電信重磅發(fā)布了全國(guó)首個(gè)單體萬(wàn)卡液冷智算集群,作為長(zhǎng)三角最大規(guī)模的運(yùn)營(yíng)商級(jí)算力資源,創(chuàng)新性的“魔方”式布局實(shí)現(xiàn)了單體超萬(wàn)卡的極致集群能力,能夠支持萬(wàn)億參數(shù)大模型訓(xùn)練。
數(shù)字推動(dòng)經(jīng)濟(jì)變革,算力解鎖未來(lái)潛能。作為臨港新區(qū)數(shù)字化轉(zhuǎn)型的“橋頭堡”,臨港智算谷不僅肩負(fù)著推動(dòng)科技創(chuàng)新和產(chǎn)業(yè)升級(jí)的重任,更承載著構(gòu)建可持續(xù)發(fā)展社會(huì)的愿景。
首個(gè)國(guó)產(chǎn)液冷萬(wàn)卡算力池已啟用
站在一塵不染的2號(hào)樓機(jī)房?jī)?nèi),冷風(fēng)在耳邊呼嘯,風(fēng)冷和液冷兩套系統(tǒng)同時(shí)運(yùn)轉(zhuǎn),要將萬(wàn)卡算力池運(yùn)行所散發(fā)出的熱量轉(zhuǎn)移至另外一個(gè)空間,柜機(jī)上儀表盤顯示的數(shù)字表明機(jī)房正處于20攝氏度左右的標(biāo)準(zhǔn)溫度值區(qū)間?!叭珖?guó)首個(gè)國(guó)產(chǎn)液冷萬(wàn)卡集群就在我們眼前,目前在運(yùn)行的已有6000卡,預(yù)計(jì)今年底前將實(shí)現(xiàn)萬(wàn)卡?!迸R港算力(上海)科技有限公司市場(chǎng)部經(jīng)理曹春說。
為了打通單池萬(wàn)卡算力集群,而非將千卡池“拼”在一起,智算谷創(chuàng)新性的“魔方”式布局實(shí)現(xiàn)了單體超萬(wàn)卡的集群能力。
如同魔都繁華地段的高架橋,上下層疊,左右延伸,似經(jīng)絡(luò)般貫穿城市肌理,“魔方”三層立體架構(gòu)便依靠核心交換機(jī)在中間樓層的巧妙布局,實(shí)現(xiàn)了Spine網(wǎng)絡(luò)層的近距離全鏈接,巧妙繞過了IB網(wǎng)絡(luò)50米傳輸?shù)木窒?。每層樓單?dú)能承載10000張算力卡,為萬(wàn)卡級(jí)別的超級(jí)集群開辟了新天地。
服務(wù)器內(nèi)部GPU總線帶寬飆至T比特級(jí),令數(shù)據(jù)飛馳無(wú)阻。對(duì)外,每臺(tái)服務(wù)器如同擁有八車道的超級(jí)入口,提供400Gbps的高速接入。網(wǎng)絡(luò)構(gòu)建上,無(wú)論是追求速度的IB網(wǎng)絡(luò),還是兼顧效率與穩(wěn)定的ROCE無(wú)損以太網(wǎng),都能確保數(shù)據(jù)傳輸時(shí)延極低,前者不到1微秒,后者則需10微秒,真正實(shí)現(xiàn)數(shù)據(jù)交流的“零等待”,為高性能計(jì)算和人工智能的飛速發(fā)展鋪設(shè)了堅(jiān)實(shí)的數(shù)字跑道。
“誕生”不到一年時(shí)間,臨港智算谷已為中國(guó)電信千億參數(shù)“星辰”大模型產(chǎn)品的運(yùn)行奠定了堅(jiān)實(shí)基礎(chǔ)。其中,星辰政務(wù)大模型已于2023年率先在上海12345市民熱線實(shí)現(xiàn)應(yīng)用落地。未來(lái),還將為智慧城市、醫(yī)療、自動(dòng)駕駛、金融等領(lǐng)域添光增彩。
如今,臨港智算谷既滿足了人工智能大模型訓(xùn)練高速網(wǎng)絡(luò)和算力需求,又保障超大集群內(nèi)部的高帶寬、低延遲、零丟包需求,為推動(dòng)人工智能研究與應(yīng)用的邊界拓展提供了強(qiáng)大的基礎(chǔ)設(shè)施支持。
在這里,千卡、萬(wàn)卡已經(jīng)實(shí)現(xiàn)。“只要技術(shù)持續(xù)進(jìn)步,智能計(jì)算卡的性能將繼續(xù)提升,算力規(guī)模也會(huì)持續(xù)擴(kuò)大。”曹春表示。
“兩彈一優(yōu)”顯現(xiàn)創(chuàng)新能力
隨著GPU算力不斷攀升,對(duì)智算中心的供電、散熱等基礎(chǔ)條件提出了更高挑戰(zhàn)。
中國(guó)電信領(lǐng)先一步,采用創(chuàng)新的彈性模塊化設(shè)計(jì)方案,讓先進(jìn)的風(fēng)冷與高效的液冷機(jī)柜能在同一機(jī)房和諧共存,液冷機(jī)柜能輕松應(yīng)對(duì)48千瓦的高功率需求,而風(fēng)冷機(jī)柜則在25千瓦以內(nèi)靈活調(diào)節(jié)。這種設(shè)計(jì)不僅高效還節(jié)能環(huán)保,為中國(guó)電信打造了“兩彈一優(yōu)”的超前數(shù)據(jù)中心示范點(diǎn)。
這里,“兩彈一優(yōu)”意味著供電和供冷都能隨需應(yīng)變。
想象一下,電力像水流一樣,在“水管”中自如流通,無(wú)論跨越樓層還是機(jī)房,都能快速、彈性地分配到每一臺(tái)服務(wù)器。而站在一列供冷系統(tǒng)面前,則能體驗(yàn)到數(shù)臺(tái)智能空調(diào)開到最大風(fēng)力的感受,根據(jù)服務(wù)器的發(fā)熱情況進(jìn)行自動(dòng)調(diào)節(jié),確保每個(gè)機(jī)架都“涼爽”適宜。加上利用人工智能優(yōu)化的氣流管理,讓數(shù)據(jù)中心的冷空氣運(yùn)用得恰到好處,既節(jié)約能源,又提升效率,為數(shù)字世界的綠色發(fā)展樹立了新標(biāo)桿。
液冷技術(shù)相較于傳統(tǒng)風(fēng)冷模式,能顯著降低數(shù)據(jù)中心的PUE(電源使用效率)值。智算谷的一般PUE值可達(dá)到國(guó)家新建數(shù)據(jù)中心1.25的標(biāo)準(zhǔn),部分區(qū)域更是達(dá)到1.08,接近理想水平。
盡管液冷系統(tǒng)的初期投資成本較高,大約比傳統(tǒng)系統(tǒng)高出20%~30%,但其帶來(lái)的長(zhǎng)期節(jié)能效益與穩(wěn)定性優(yōu)勢(shì),使它成為目前高性能計(jì)算服務(wù)器的優(yōu)選方案。
算力背后 節(jié)能更重要
在當(dāng)今科技日新月異的浪潮中,中國(guó)算力產(chǎn)業(yè)正以破竹之勢(shì)飛速前行。
截至2023年底,我國(guó)算力服務(wù)的在用機(jī)架總量已突破810萬(wàn)個(gè),穩(wěn)居全球第二。伴隨算力需求的激增,電力供應(yīng)面臨前所未有的挑戰(zhàn),全球數(shù)據(jù)中心的電力消耗預(yù)計(jì)將在四年間翻番,達(dá)到1050太瓦時(shí),中國(guó)亦不例外,數(shù)據(jù)中心耗電量占全社會(huì)用電量的比例逐年上升,2022年已達(dá)到約3%。
在這一背景下,綠色算力成為緩解“比特與瓦特”這對(duì)“最強(qiáng)能源CP”供需矛盾的關(guān)鍵解法。
早在幾年前,中國(guó)電信便開始在青浦區(qū)和臨港新片區(qū)前瞻布局“東西兩翼”智算中心,支撐人工智能產(chǎn)業(yè)發(fā)展,加大智算基礎(chǔ)設(shè)施投入。2021年成立的臨港算力(上海)科技有限公司,建設(shè)運(yùn)營(yíng)中國(guó)電信臨港園區(qū)智算基礎(chǔ)設(shè)施建設(shè)項(xiàng)目,并將項(xiàng)目打造成中國(guó)電信臨港智算中心。
臨港智算谷率先落地實(shí)施應(yīng)用,整體占地300畝,分三期建設(shè),目前一期規(guī)劃10萬(wàn)張卡,包括訓(xùn)練、推理、渲染等各類算力集群。在“碳中和、碳達(dá)峰”的大背景下,智算谷在設(shè)計(jì)之初就融入了綠色低碳的理念,風(fēng)能、光伏等設(shè)施均在園區(qū)內(nèi)可落座的區(qū)域搭建,與自然環(huán)境和諧共生,液冷技術(shù)的應(yīng)用不僅大幅提升了能源利用效率,更是大大降低了運(yùn)營(yíng)成本。
作為該地區(qū)首個(gè)實(shí)現(xiàn)220千伏直供園區(qū)的項(xiàng)目,其電力供應(yīng)系統(tǒng)的可靠性與應(yīng)急準(zhǔn)備的周密性可見一斑。變電站與柴油發(fā)電機(jī)的配置,不僅確保了電力供應(yīng)的不間斷,也為應(yīng)對(duì)突發(fā)情況提供了堅(jiān)實(shí)保障。
在2號(hào)樓的供電監(jiān)控室內(nèi),一面壯觀的模擬控制面板引人注目。各式表盤與指示燈交織,紅綠藍(lán)三色光點(diǎn)交織閃爍,如同精心編排的燈光秀,實(shí)則是園區(qū)電網(wǎng)健康狀況的直觀反映。數(shù)十根線條在面板上交錯(cuò)縱橫,每一條線路都承載著智算谷服務(wù)器的正常運(yùn)轉(zhuǎn)和輸出?!斑@里的供電設(shè)備可以負(fù)載智算谷一期全部電力,目前的負(fù)載率占總電力的10%?!惫ぷ魅藛T介紹道。
當(dāng)下,臨港智算中心正積極探索綠電應(yīng)用,與多方合作引入光伏等可再生能源。通過虛擬電廠等創(chuàng)新模式,提高能源使用效率,并有望參與電力市場(chǎng)交易,為數(shù)據(jù)中心運(yùn)營(yíng)帶來(lái)更多經(jīng)濟(jì)效益,同時(shí)減輕社會(huì)能源負(fù)擔(dān),尤其是在用電高峰期。
隨著數(shù)據(jù)洪流的不斷涌動(dòng),算力作為支撐人工智能、大數(shù)據(jù)、云計(jì)算等高新技術(shù)的基石,正以前所未有的姿態(tài)重塑著世界。
文/毛宇
攝影/徐大偉
關(guān)鍵詞: