當前,火熱的大模型技術和面向行業場景化的創新AI研發,都離不開算力資源的有力支撐。進入大模型時代,算力需求日益復雜,不僅要求算力資源更加充沛和靈活,還要求算力基礎設施向智能化和一體化的方向發展,以更高效率和性能來支持更大規模計算。
如何解決智算資源供給矛盾?如何提高算力利用效率?如何讓“計算”更綠色低碳?中國電信天翼云給出了答案。
今天,一起走進中國電信京津冀智能算力中心萬卡池,看中國電信天翼云如何擁抱人工智能技術趨勢,通過豐富的智算資源供給和一體化的平臺服務能力,助力千行百業向智發展,為數字經濟發展注入新動能。
“智能計算”夯實算力底座
走進中國電信京津冀智能算力中心,十幾棟黑白相間的建筑整齊排列,機房、冷卻車間、應急發電設備分布其中。來到機房里,一排排機柜鱗次櫛比,五顏六色的數據線整齊有序,信號燈不斷閃爍……大量數據信息在這里傳遞、計算和存儲。
適應人工智能發展趨勢,中國電信規劃并建設全國“2+3+7+X”公共智算資源池,在京津冀、長三角地區建設兩大國產液冷單集群萬卡智算池。“中國電信京津冀智能算力中心是業內領先的全國產化訓推一體、基于自研架構的液冷高性能公共智算中心,可以承載千億到萬億參數的大模型訓練業務。”中國電信京津冀智能算力中心副主任專家趙夢麟介紹。
京津冀智能算力中心依托中國電信“2(2)+4+31+X+O”梯次化云資源布局、空天一體的衛星網絡、全球最大的全光算力網絡,具備以京津冀為中心、全國可達的超低時延圈網絡優勢,北京、天津算力用戶可1ms“一跳入算”接入京津冀智算中心,滿足多場景下科研創新算力和大模型訓練所需的高并發算力需求。中國電信京津冀智能算力中心重點滿足京津冀及周邊省份的智算業務發展需求,將服務AI大模型、車聯網、互聯網、生物醫藥等高新企業,并為政府、企業、高校等提供公共算力、應用創新孵化、產業聚合發展、科研創新和人才培養等平臺服務。
緊隨人工智能、大模型等產業發展方向,中國電信京津冀智能算力中心持續提升智能算力承載能力,建設了國產自主智能算力萬卡資源池,滿足萬億參數大模型預訓練部署要求。“這個萬卡資源池是京津冀地區目前唯一的擁有萬卡國產芯片的智能算力中心,能夠為整個京津冀地區的大模型客戶提供充沛的算力供給。”趙夢麟介紹。
據了解,萬卡資源池依托天翼云自主研發的“息壤”一體化智算服務平臺,實現萬卡資源納管和萬卡規模并行訓練。“息壤”能夠提供單集群萬卡國產化全功能預訓練服務,采用自適應并行策略,多項技術突破實現萬卡長效穩定訓練,MFU達到國內領先水平,能夠滿足各種算力應用場景及各種不同客戶的算力需求,適用于千億/萬億級參數規模大語言模型訓練,如Llama 3、Qwen等超大規模語言模型,以及多模態模型開發、虛擬現實與元宇宙等。
萬卡資源池將為廣大企業提供高效、穩定、安全的一站式智算服務,支持企業數字化轉型和智能化升級。國產算力資源將賦能智慧城市建設、公共服務優化等應用場景,提高政府治理能力和公共服務水平。
未來,根據業務發展需要,中國電信京津冀智算能力中心將持續提升一體化智算服務平臺整體效能,不斷培育完善國產化智算生態系統,賦能更多行業、企業,助力實體經濟與數字經濟深度融合。
“綠色計算”助力可持續發展
數據中心是耗能大戶,也是節能降碳的核心發力領域之一。據國網能源研究院預測,到2030年,我國數據中心用電量會突破4000億千瓦時,占全社會用電量的比重達3.7%。為了解決數據中心高能耗以及算力需求激增的矛盾,“綠色計算”是大勢所趨。
作為京津冀地區最大的綠色算力中心,中國電信京津冀智能算力中心在探索綠色發展模式的過程中做了哪些努力呢?
走進京津冀智能算力中心的冷站,首先映入眼簾的是色彩分明的供水管路。通過這些黃色、綠色、紅色、藍色的管道,空調用水實現了高效循環,服務器運行過程中產生的熱量通過精心設計的水冷系統得到釋放,從而保障服務器平穩運轉。
“滿足高密度、高功率的智算服務器的供冷需求,是智能算力中心建設過程中的一個難點。”來到智能算力彈性方艙,趙夢麟介紹了目前天翼云萬卡資源池所采用的冷板式液冷技術。冷板式液冷是通過冷板(通常為銅鋁等導熱金屬構成的封閉腔體)將發熱器件的熱量間接傳遞給封閉在循環管路中的冷卻液體,通過冷卻液體將熱量帶走的一種實現形式,它可以精準定位CPU、GPU的發熱點進行冷卻,實現高效散熱。冷板式液冷通過冷卻塔進行換熱,能夠冷卻70%~80%的服務器發熱量,剩余20%~30%的發熱量通過冷凍水補冷方式冷卻。由于液冷系統不需要使用風扇等機械設備進行散熱,因此能夠顯著降低噪聲,并減少服務器的能耗,有助于實現數據中心的綠色轉型,降低運營成本。
“冷板式液冷技術的應用不僅提升了算力規模,還提高了算力服務的質量。通過降低服務器的運行溫度和散熱噪聲,改善了算力中心的工作環境,提高了工作人員的舒適度和工作效率。”趙夢麟介紹,根據估算,采用冷板式液冷技術,年節約用電量可達億千瓦時,減少的二氧化碳排放量也相當可觀。“經計算,采用冷板式液冷技術的萬卡資源池全年PUE值為1.15,單位算力能耗為1.5kW/P。”
智能的算力,綠色的算力。面向云智融合的時代趨勢,作為云服務國家隊的天翼云勇擔時代重任,打造多層次的算力布局,將通過豐富的智算資源供給,充分發揮“息壤”一體化智算服務平臺作用,提供綠色、高效的智算服務,持續為全社會的智能化轉型升級增添動能。
中國電信京津冀智能算力中心。
中國電信京津冀智能算力中心萬卡池機房。
中國電信京津冀智能算力中心冷站。