焦點報導

首頁> 焦點報導清單> 資料中心節能技術趨勢

資料中心節能技術趨勢

陳霈;殷正華;古慧雯/ 發布日期:2024/10/22/ 瀏覽次數:104

一、資料中心的能源需求與消耗
隨著雲端運算和AI應用的推動,資料中心的規模逐漸擴大,全球與地方的電力供應面臨巨大壓力,這將對電網的穩定性和永續發展構成挑戰。根據統計,從2017年到2021年,Meta、Amazon AWS、Google Cloud 和 Microsoft Azure等主要雲端服務提供商的電力消耗已增長超過一倍。預計到2030年,美國資料中心的電力消耗可能占美國總發電量的4.6%至9.1%。

生成式AI模型(如ChatGPT)的廣泛應用,顯著推動了資料中心的能源需求,如圖一。每次ChatGPT查詢約耗電2.9 Wh,約為傳統Google查詢的十倍。如果Google全面導入AI技術,預計每次查詢的耗電量將增加至6.9至8.9Wh。特別是影像、音樂和影片生成等計算密集型AI應用,將進一步提升能源消耗。再者,AI模型訓練的能源足跡約占總能耗的30%,遠高於傳統的資料處理活動。

根據Frost & Sullivan 1預測,資料中心冷卻市場受到超大規模(hyperscale)數據中心和雲端服務提供商投資的驅動,預計在2023年至2032年之間將以9.3%的年均成長率快速擴展。亞太地區(APAC)因資料中心大量建設以及氣候炎熱等因素,資料中心的冷卻需求大幅度增加,帶動市場成長,預計在2032年市場占比高達48.7%。伴隨5G、人工智慧(AI)和機器學習(ML)技術的發展,資料中心需要更多先進的節能解決方案。

二、創新節能解決方案
大量的運算推動資料中心對電力的需求,為因應新一代資料中心高耗能的挑戰,迫切需要創新的節能解決方案,以下簡述關鍵節能技術:

(一) 節能硬體技術(Energy-Efficient Hardware Technologies):隨著資料中心能耗的快速增長,硬體技術的創新在降低能耗方面發揮了重要作用。現今,資料中心採用之運算設備正從傳統的中央處理器(CPU)逐漸轉向針對特定計算任務的專用硬體,從而提升運算效能並節省能源。

1. 張量處理器Tensor Processing Units (TPU):TPU 是專門為加速機器學習(ML)任務設計的處理器,能顯著提升性能並增強能源效率。例如,Google 的 Cloud TPUv4 相較於 TPUv3,運算效能提升了10倍,同時能效也提升了2%到3%。

2. 現場可程式化邏輯閘陣列(Field-Programmable Gate Arrays, FPGA):FPGA 是一種可重新程式設計的處理器,根據特定任務進行編程,從而提高運算性能並降低每單位計算所需的能耗。在AI推理與特定資料處理任務中(如FPGA常被許多AI晶片公司拿來驗證ASIC晶片)2 ,FPGA的記憶體和頻寬使用量可減少高達75%。

3. 用電控制Power Capping3 :這是一種將處理器(如GPU)運行在較低功耗模式的技術,能夠直接減少約10%的電力消耗,並同時降低冷卻系統的需求,能有效降低高效運算過程中的整體能耗。

(二) 先進冷卻技術(Energy-Efficient Cooling Technologies):資料中心的冷卻系統是主要的能源消耗來源之一,此技術旨在減少資料中心因散熱需求所消耗的電力,並提高營運效率。

1. 液體冷卻(liquid cooling):相比傳統的空氣冷卻系統,液體冷卻使用液體來吸收與散熱,能顯著減少能源消耗,尤其適用於高密度伺服器和AI運算伺服器。許多大型數據中心(如Microsoft、Amazon、Alphabet等)已積極投入次世代液體冷卻技術4 。近期研究顯示,將100%空氣冷卻轉為75%液體冷卻和25%空氣冷卻的混合系統,可減少約15.5%的總能耗,並顯著改善資料中心的PUE(電力使用效率)。

2. 創新冷卻技術與技術成熟度:
 (1) 空氣輔助液體冷卻(Air-Assisted Liquid Cooling, TRL 9):相比傳統的空氣冷卻技術,可節省高達50%的能源,並將PUE降低到1.1以下。

(2) 浸沒式冷卻(immersion cooling, TRL 8):是目前最具潛力的技術之一,可節省50%到95%的能耗,兩相浸沒式液體冷卻(TRL 7)宣稱能節省41%的能耗。

(3) 微對流液體冷卻(Microconvective Liquid Cooling, TRL 6):這是一種新興技術,能節省18%的能源,並將PUE降低至1.02,同時用水量也減少了90%。

(4) 輻射冷卻(Radiative Cooling, TRL 6):可提升達50%到70%的能效,零耗水且維護成本低。

3. 節能器(economizer):節能器根據外界的溫度和濕度,使用外部空氣來輔助冷卻,減少對機械冷卻系統的依賴。2015年的研究結果顯示,節能器能使冷卻系統能耗減少47.5%到67.2%。

4. 熱回收再利用 5:資料中心在運作過程中會產生大量的廢熱,這些熱量可以透過熱回收技術轉化為可利用的資源,尤其適合寒冷地區,為鄰近的建築物提供熱能,進一步節省冷卻系統的能源需求。以亞馬遜的Doppler大樓為例,自2016年以來,該大樓每年從附近的資料中心回收約3200 MWh的廢熱,透過再利用達到節能效果,並降低整體能耗。

此外,許多工業和商業設施需要使用碳密集的燃料來產生熱水或供暖,這些過程會產生大量的溫室氣體排放。若能將資料中心產生的廢熱進行回收並加以利用,不僅可以降低資料中心的冷卻需求,還能幫助其他行業減少使用碳密集燃料,實現節能與減碳的雙重效益。潛在受益的行業包括大型商業建築、製藥、食品飲料、酒店、醫療實驗室、醫院、生物乙醇工廠和水處理設施等。

目前,全球多個國家正積極推動資料中心的熱回收再利用政策。例如,英國政府補助了5個資料中心的餘熱再利用計畫;美國華盛頓州則通過產業共生計畫,推動不同產業共享工業廢熱;紐約州通過了熱能網路法案,推動多棟建築共享熱能;法國則提供稅收減免以支持廢熱回收。這些政策措施表明,資料中心的廢熱不再是負擔,而是一項可創造價值的資產。

(三) AI節能技術:
人工智慧除了帶來直接能源消耗外,也是優化能源使用的動力。在資料中心節能的應用主要透過對能源需求的即時監控和預測,以及提高模型開發的效率,降低能源消耗。
1. AI訓練算法的節能優化:
在人工智慧發展初期,訓練算法主要關注如何提高準確性與性能。然而,隨著演算法效能提高,電腦運算需求的急速成長,因此發展重點轉向如何提高模型開發的能源效率。主要技術包含Pruning(修剪)、Quantization(量化)、Knowledge Distillation(知識蒸餾),透過減少或移除神經網路中不必要的元素,降低運算精度,或利用更小且更簡化的模型來模仿大型模型的功能,從而減少計算複雜度和資源需求,達到節能效果。

2. 伺服器管理優化:傳統資料中心經常面臨伺服器利用率不足的問題,高達30%的伺服器消耗了電力卻無法發揮全部運算能力。透過AI技術的引入,如先進調度系統和動態資源分配,資料中心可以有效地調整伺服器資源,使其利用率大幅提升,目標是將閒置率降至10%以下。此外,AI技術還能支援虛擬化(virtualization)與容器化(containerization),允許單一伺服器處理更多工作負載,提升伺服器的效率高達45%,未來十年內還可望將每單位計算的能耗降低約20%。

3. 彈性運算策略:
AI能優化資料中心的運算配置,可根據電力供應情況、碳排放強度以及其他因素靈活調整。透過在低電價時段進行運算,資料中心可節省多達15%的成本,並降低高峰期間的電網負荷。隨著技術和法規進步,這些策略有望使資料中心參與電力市場,實現電力供應與需求的最佳化管理,提升能源使用效率。


三、結論
隨著人工智慧推動資料中心能源需求迅速增長,節能創新方案變得極為重要。未來應著重提升資料中心營運效率,並透過採用節能硬體與先進冷卻技術減少能源消耗。同時,智慧電網的發展使資料中心在應對電力需求波動時更加靈活。資料中心與電網的互動模式從目前的「被動式負載」(passive load)轉變為協作性的「共享能源經濟」(shared energy economy)。資料中心不僅依賴於潔淨能源發電,還能透過使用備用發電機為電網提供額外電力,從而提升電網的靈活性和可靠性。

此外,由於資料中心的負載增長速度快於電力基礎設施的擴展,精確的電力需求預測對電力公司提前佈署基礎設施極為重要,以確保未來能應對資料中心及AI技術帶來的能源挑戰。

註:
電力使用效率(Power Usage Effectiveness, PUE):資料中心效率的衡量指標之一,透過設施總用電量除以IT設備用電量所產生的比值,來量化資料中心的能源效率。PUE越低表示效率越高。

[1] Frost & Sullivan(2024.01). Global Data Center Cooling Growth Opportunities.

[2] 電腦與通訊 (2021.12.15),人工智慧晶片設計開發解決方案。https://ictjournal.itri.org.tw/xcdoc/cont?xsmsid=0M236556470056558161&sid=0M257517551422955985

[3] Power Capping翻譯名稱參考Digtimes. https://www.digitimes.com.tw/tech/dt/n/shwnws.asp?id=0000258708_KMB61Y0R14PYFR74YYV3M

[4] Frost & Sullivan(2024.01). Global Data Center Cooling Growth Opportunities.

[5] Open Compute Project Foundation (2024.02). Policies to Accelerate Data Center Heat Reuse: Achieving Economic and Climate Change Goals.


 

延伸閱讀
資料來源