服務(wù)熱線
現(xiàn)在英偉達(dá)GB200的交付已經(jīng)進(jìn)入穩(wěn)定交付期,根據(jù)英偉達(dá)財(cái)報(bào)電話會(huì)上的說法,現(xiàn)在已經(jīng)滿負(fù)荷生成,NVL72每周可生成約1000個(gè)機(jī)架,隨著產(chǎn)能爬坡,三季度還將進(jìn)一步加速。而且GB300的交付也會(huì)慢慢上量,那GB300中各個(gè)重要組件的價(jià)值量拆解對(duì)投資者來說就非常關(guān)鍵了,這篇文章我們先來拆解NVL72中的液冷價(jià)值量,看下GB300相比GB200,液冷的設(shè)計(jì)有哪些變化?哪部分的價(jià)值量增加最多?
液冷服務(wù)器機(jī)架
先看下液冷服務(wù)器都需要包含哪些東西。

服務(wù)器:
IT Rack:里面安裝有多臺(tái) Server(服務(wù)器),服務(wù)器在運(yùn)行時(shí)會(huì)產(chǎn)生大量熱量,需要液冷系統(tǒng)進(jìn)行散熱。 Left Manifold(左側(cè)集流管):負(fù)責(zé)將冷卻液體輸送到各個(gè)服務(wù)器,為服務(wù)器提供冷卻介質(zhì)。 Right Manifold(右側(cè)集流管):用于收集經(jīng)過服務(wù)器、吸收了熱量的冷卻液體。
這里的manifold可以翻譯成集流管,或者是歧管,冷卻液就是在這里面流。
CDU
CDU是Cooling Distribution Unit的縮寫,即冷卻分配單元 ,主要負(fù)責(zé)在液冷系統(tǒng)中分配和管理冷卻液體。
Pump(泵):用于為冷卻液體的循環(huán)提供動(dòng)力,推動(dòng)液體在系統(tǒng)內(nèi)流動(dòng)。 Water Tank(水箱):儲(chǔ)存冷卻液體,保證系統(tǒng)有足夠的液體進(jìn)行循環(huán)冷卻。 Plate Heat Exchanger(板式換熱器):用于將吸收了服務(wù)器熱量的冷卻液體與其他冷卻介質(zhì)進(jìn)行熱量交換,使冷卻液體降溫,以便再次循環(huán)使用。
Cooling Tower
Cooling Tower(冷卻塔)是通過與外界空氣等進(jìn)行熱交換,將從板式換熱器傳來的熱量散發(fā)出去,從而使用于交換的冷卻介質(zhì)降溫,以便再次回到板式換熱器參與熱量交換。
下面的圖是一個(gè)GB200 NVL72機(jī)架的簡(jiǎn)易示圖,可以看到Manifold左右兩側(cè)的顏色是不一樣的,藍(lán)色表示里面的冷側(cè)歧管,也就是上面圖中的Left Manifold,來自CDU的低溫冷卻液在此分路,送往各服務(wù)器的冷板;紅色表示熱側(cè)歧管,也就是上面圖中的Right Manifold,服務(wù)器冷板流出的高溫冷卻液在此匯總,回流至CDU。

對(duì)于服務(wù)器機(jī)架中液冷的拆解,查了很久沒有查到NVL72的很好的圖,下面這個(gè)圖是參考的ZOMI大神的一個(gè)圖,這個(gè)是華為的服務(wù)器的拆解,但機(jī)架其實(shí)差不太多,也可以供大家參考,了解在Rack層面,哪些是跟液冷相關(guān)的。

服務(wù)器托盤
下面從各個(gè)tray的視角來拆解一下液冷。下面這個(gè)圖是一個(gè)GB200的compute tray的拆解。

我們星球的云盤數(shù)據(jù)庫(kù)中,專門整理過GB200的架構(gòu)圖,包含18個(gè)compute tray和9個(gè)Switch tray。

每個(gè)compute tray是包含4個(gè)GB200,也就是兩個(gè)Bianca 板卡,每塊 Bianca 板卡配備 1 顆 Grace CPU 和 2 塊 Blackwell GPU。下圖中cold plate也就是冷板覆蓋的就是一個(gè) Bianca 板卡。所以在GB200中,1個(gè)CPU及2個(gè)GPU對(duì)應(yīng)一個(gè)大冷板。而GB300中,則是每個(gè)芯片對(duì)應(yīng)一個(gè)小冷板。
下圖中的QDs就是快接頭Quick Disconnects,同樣藍(lán)色軟管中流入的低溫冷卻液,紅色軟管中流出的高溫冷卻液。

需要多提一點(diǎn),快接頭也是一個(gè)很重要的零件,不僅僅是在單個(gè)tray中使用,在rack層面,也會(huì)使用很多,具體數(shù)據(jù)我們都會(huì)在下面章節(jié)中講。

價(jià)值量拆解
上面講了這么多,主要是為了先讓大家理解GB200的架構(gòu),這樣再來看價(jià)值量拆解就會(huì)比較容易理解,不看直接看這個(gè)章節(jié)的內(nèi)容,會(huì)一頭霧水。
冷板數(shù)量
關(guān)于GB200 與 GB300 在方案設(shè)計(jì)的區(qū)別,我們上面也提過了,兩者都借助托盤來安放芯片及對(duì)應(yīng)的冷板,不過 GB200 是 1 個(gè) CPU 搭配 2 個(gè) GPU** 對(duì)應(yīng)一塊大冷板;GB300 則是每個(gè)芯片對(duì)應(yīng)一塊小冷板**。
另外,在 Switch 部分,二者都有 18 個(gè) ASIC 芯片,且都是兩個(gè)芯片對(duì)應(yīng)一塊冷板。據(jù)此計(jì)算,GB200 對(duì)冷板的需求是 36 塊加 9 塊,總共 45 塊大冷板;GB300 則需要 108 塊小冷板加上 9 塊大冷板。
從價(jià)值量來看,GB200 的大冷板單塊價(jià)值為 650 美金,GB300 的小冷板單塊價(jià)值為 240 美金。
冷板供應(yīng)商體系
1、GB200 冷板供應(yīng)
GB200 的液冷板市場(chǎng)主要由 AVC 主導(dǎo),市場(chǎng)份額超過 55%,雙鴻以 25%-30% 的份額位居第二,Cooler master 作為第三供應(yīng)商補(bǔ)充市場(chǎng)供給。交付模式上,液冷板以裸板形式提供給廣達(dá)、鴻海等下游廠商,連接工序由 IT 側(cè)完成,流程較為簡(jiǎn)單。
2、GB300 冷板供應(yīng)與生產(chǎn)調(diào)整
GB300 的供應(yīng)商體系發(fā)生顯著變化,Cooler master 成為主要供應(yīng)商,占據(jù)超過55% 的市場(chǎng)份額,AVC 退居第二,雙鴻的份額大幅下降至不足 5%。生產(chǎn)流程上,GB300 的液冷板需先進(jìn)行小集成,包括連接軟管、安裝快接頭并完成密閉性測(cè)試,隨后將集成好的模組交付給廣達(dá)、鴻海進(jìn)行簡(jiǎn)單封裝。由于生產(chǎn)工作量較大,Cooler master 與英維克、川環(huán)等大陸廠商合作代工液冷板,生產(chǎn)完成后由 Cooler master 進(jìn)行集成,英維克還提供快速插頭等部件。
軟管與 Manifold 的價(jià)值量對(duì)比
GB200 和 GB300 的軟管價(jià)格存在明顯差距。GB200 的軟管價(jià)格為 1200 美元/柜,而 GB300 的價(jià)格上漲至 1800-2000 美元/柜。
相比之下,GB200 和 GB300 的 Manifold 價(jià)格差異不大,均維持在 28000-30000 美元/柜的水平,保持相對(duì)穩(wěn)定。
快接頭的數(shù)量與價(jià)值量
GB200 和 GB300 的快接頭需求因產(chǎn)品設(shè)計(jì)不同而有所差異。GB200 包含 126 個(gè)計(jì)算部分快接頭和 18 個(gè) Switch 部分快接頭;GB300 的計(jì)算部分快接頭數(shù)量翻倍至 252 個(gè),Switch 部分仍為 18 個(gè),總量明顯高于 GB200。
在價(jià)格方面,GB200 的快接頭價(jià)格為 45 美元/對(duì),而 GB300 的價(jià)格略升至 55 美元/對(duì)。
快插頭供應(yīng)商與技術(shù)升級(jí)
GB200 的快插頭完全由歐美企業(yè)供應(yīng),采用 UQD 方案。
GB300 的快插頭方案升級(jí)為 NVUQD,供應(yīng)商體系發(fā)生重大變化,歐美企業(yè)的份額大幅減少,Cooler master、AVC、富士達(dá)等廠商成為主要供應(yīng)商。由于產(chǎn)能限制,Cooler master 還聯(lián)合英維克參與快插頭供應(yīng),以補(bǔ)充產(chǎn)能需求。
CDU 供應(yīng)商模式變化
GB200 的 CDU 采用授權(quán)認(rèn)證模式,維諦是唯一獲得認(rèn)證的供應(yīng)商。
GB300 取消了授權(quán)認(rèn)證機(jī)制,改為以方案設(shè)計(jì)為核心的合作模式,供應(yīng)商體系更加分散,臺(tái)達(dá)、寶德、Cooler master、維諦等廠商均參與 CDU 供應(yīng),共同滿足市場(chǎng)需求。
最后提一下關(guān)于液冷產(chǎn)品的毛利率,CDU的毛利率大概在50%以上,冷板、Manifold和快接頭這些,基本都是在30%以上。
免責(zé)聲明:本文采摘自“半導(dǎo)體綜研”,本文僅代表作者個(gè)人觀點(diǎn),不代表薩科微及行業(yè)觀點(diǎn),只為轉(zhuǎn)載與分享,支持保護(hù)知識(shí)產(chǎn)權(quán),轉(zhuǎn)載請(qǐng)注明原出處及作者,如有侵權(quán)請(qǐng)聯(lián)系我們刪除。




粵公網(wǎng)安備44030002007346號(hào)