電源變壓器在算力服務(wù)器中的應(yīng)用
在算力服務(wù)器這行干久了就知道,電源變壓器真不是參數(shù)表上那幾行數(shù)字能說清的講明白的。多少還有有些門道的,全是在工地上、機(jī)房里摸爬滾打,一點(diǎn)點(diǎn)攢下的實(shí)底兒。
就說去年吧,我們接了個(gè) AI 數(shù)據(jù)中心的活兒。那兒的機(jī)架邪乎,單個(gè)就得扛 120kW 的負(fù)載,里面塞了八臺(tái)訓(xùn)練服務(wù)器。電網(wǎng)拉過來的 380V 交流電,服務(wù)器主板上的 CPU、內(nèi)存根本用不了 ,它們只認(rèn) 12V、5V 的低壓電。這時(shí)候變壓器就得先把高壓往下壓,再通過整流模塊轉(zhuǎn)成直流。
剛開始我們上的是普通工頻變壓器,結(jié)果機(jī)架里的溫度總比設(shè)計(jì)值高 5 度,手往機(jī)架門上一摸,能明顯感覺到熱氣往外冒。后來換成高頻隔離變壓器,嘿,轉(zhuǎn)換效率從 89% 漲到 94% 不說,摸變壓器外殼,就只有點(diǎn)溫乎氣兒。這事兒讓我琢磨明白,高密度算力的地方,變壓器自己耗多少電、散多少熱,真能牽著整個(gè)機(jī)房的散熱節(jié)奏走。
這些年,我們?cè)谶@方面踩過不少坑。前兩年,有一個(gè)金融算力集群,服務(wù)器總是在半夜宕機(jī)。我們查了三天,才發(fā)現(xiàn)是變壓器的動(dòng)態(tài)響應(yīng)跟不上。那些高頻交易服務(wù)器,算力峰值能一下子沖到額定功率的 1.5 倍。而老款變壓器的磁芯飽和速度太慢,電壓一下降,就會(huì)觸發(fā)保護(hù)機(jī)制。后來,我們換成了帶納米晶合金鐵芯的變壓器。這種變壓器的響應(yīng)速度快了十倍,之后就再也沒出過錯(cuò)。這說明,在算力場(chǎng)景中,變壓器不光要考慮功率,瞬態(tài)性能也很關(guān)鍵。
選擇變壓器時(shí),不能只看參數(shù)表。大家常說,240V 直流配電方案不錯(cuò),效率比交流方案高 3 個(gè)點(diǎn)。但這種方案有個(gè)前提,就是服務(wù)器集群的規(guī)模要達(dá)到上千臺(tái)。上次,我們給一個(gè)中小型邊緣計(jì)算中心做推薦。對(duì)方核算成本后發(fā)現(xiàn),定制 DC-DC 變壓器的費(fèi)用太高,承擔(dān)不起。后面他們還是用了常規(guī)的 AC-DC 方案。所以,選擇變壓器要選合適的。這得看機(jī)房的規(guī)模、負(fù)載特性,甚至還要考慮未來三年的擴(kuò)容計(jì)劃。
安裝調(diào)試的時(shí)候,老工程師的一些經(jīng)驗(yàn)之談很有用。接線端子一定要用扭矩扳手?jǐn)Q到規(guī)定的數(shù)值。上次有個(gè)機(jī)房,就因?yàn)槎鄶Q了半圈,導(dǎo)致接觸電阻變大。半年后,變壓器的端子就燒黑了。接地線纜的截面積也不能省,尤其是在雷雨多的地區(qū)。去年,南方有個(gè)數(shù)據(jù)中心,因?yàn)榻拥貨]做好,雷擊的時(shí)候,變壓器的浪涌保護(hù)器直接炸了,還連帶燒壞了三臺(tái)服務(wù)器。這些細(xì)節(jié)看起來小,但出了問題就會(huì)造成麻煩。
現(xiàn)在做液冷服務(wù)器方案,對(duì)變壓器的要求又有了變化。在浸沒式液冷的機(jī)箱里,油溫能達(dá)到 35 度,普通的絕緣材料根本承受不住。我們嘗試把變壓器的鐵芯換成耐高溫的硅鋼片,線圈用聚酰亞胺漆包線。這樣一來,成本上漲了 15%,但變壓器在滿負(fù)載運(yùn)行時(shí),溫度能穩(wěn)定控制在 60 度以內(nèi)。這也是從實(shí)踐中摸索出來的經(jīng)驗(yàn),技術(shù)參數(shù)要跟著應(yīng)用場(chǎng)景變化。