Uppkomsten av flytande kylningslösningar i AI-servrar: En TrendForce-analys

Oct 03, 2024

Lämna ett meddelande

 

Ⅰ Introduktion

 

Enligt den senaste undersökningen av TrendForce förväntas penetrationshastigheten för vätskekylningslösningar öka, drivet av den förväntade leveransen av NVIDIA Blackwell-plattformen under fjärde kvartalet 2024. Denna hastighet förväntas öka från cirka 10 % 2024 till över 20 % 2025. Den växande globala medvetenheten om miljö-, sociala och styrningsfaktorer (ESG) tillsammans med den accelererade konstruktionen av AI-servrar av molntjänsteleverantörer (CSP) banar väg för en betydande förändring från traditionell luftkylning till avancerade flytande kyllösningar.

 

Vätskekylning erbjuder flera fördelar jämfört med luftkylning, inklusive förbättrad termisk hantering, minskade ljudnivåer och ökad energieffektivitet. När efterfrågan på AI-kapacitet ökar, särskilt i dataintensiva applikationer, blir övergången till vätskekylningssystem allt mer kritisk för att upprätthålla optimal serverprestanda.

 

A liquid cooling system installed in an AI server environment, showcasing the advanced cooling technology

▲ Vätskekylningssystem som används i AI-servermiljöer

 

 

Ⅱ NVIDIAs dominans på AI-servermarknaden

 

På den globala AI-servermarknaden fortsätter NVIDIA att regera och har en marknadsandel på nära 90 % i GPU AI-serversegmentet från och med 2024. AMD släpar efter betydligt med cirka 8 % marknadsandel. Denna dominans beror till stor del på NVIDIAs banbrytande teknologi och dess robusta ekosystem, som stöder ett brett utbud av applikationer inom AI, maskininlärning och dataanalys.

 

TrendForce noterar att leveransskalan för NVIDIA Blackwell i år är relativt liten. Detta beror främst på att plattformen genomgår slutliga test- och valideringsprocesser inom försörjningskedjan, som kräver kontinuerlig optimering inom områden som höghastighetsdataöverföring och kyldesign. Blackwell-plattformens ökade energiförbrukning, särskilt i GB200-racklösningen, kräver överlägsen kylningseffektivitet, vilket ytterligare påskyndar införandet av vätskekylningslösningar.

 

NVIDIA Blackwell platform designed for high-performance AI server applications

▲ NVIDIA Blackwell-plattform för AI-servrar

 

Trots fördelarna med vätskekylning visar det nuvarande serverekosystemet fortfarande en låg användningsgrad av denna teknik. Original Design Manufacturers (ODMs) måste navigera i en inlärningskurva för att hantera utmaningar relaterade till läckage och kylningseffektivitet. Eftersom andelen avancerade GPU:er på Blackwell-plattformen förväntas överstiga 80 % till 2025, kommer detta att tända konkurrensen bland strömförsörjningstillverkare och kylindustrin på den framväxande AI-vätskekylningsmarknaden, vilket leder till ett nytt konkurrenskraftigt landskap.

 

 

 

Ⅲ Accelererad distribution av stora CSP:er

 

Stora molntjänstleverantörer, inklusive Google, AWS och Microsoft, har snabbt accelererat sina AI-serverdistributioner under de senaste åren, huvudsakligen med hjälp av NVIDIA GPU:er och egenutvecklade ASIC:er. Den termiska designeffekten (TDP) för NVIDIAs GB200 NVL72-skåp är cirka 140 kW, vilket understryker det akuta behovet av vätskekylningslösningar för att effektivt hantera värmeavledning. Liquid-to-Air (L2A) kylningsmetoder förväntas bli det vanliga tillvägagångssättet i detta sammanhang.

 

AI server deployment in modern data centers, highlighting the use of advanced cooling solutions

▲ AI-serverdistribution i datacenter

 

Medan NVIDIAs GPU:er dominerar, har Google också varit proaktiva i att utforska lösningar för flytande kylning för sina Tensor Processing Units (TPU). Googles engagemang för den här tekniken positionerar det som det mest framsynta amerikanska företaget inom vätskekylning. BOYD och Cooler Master är de primära leverantörerna av Googles kallplattor, som är avgörande för att upprätthålla optimala temperaturer i högpresterande datormiljöer.

 

På Kinas fastland expanderar Alibaba aggressivt sina datacenter för vätskekylning, vilket ytterligare betonar det globala skiftet mot denna avancerade kylningsteknik. Andra molntjänsteleverantörer fortsätter i första hand att förlita sig på luftkylningslösningar för sina egenutvecklade AI ASIC, vilket kan hindra prestanda jämfört med vätskekylda system.

 

 

Ⅳ Nyckelleverantörer och komponentbeteckning

 

När övergången till vätskekylning tar fart, utser molntjänstleverantörer nyckelkomponentleverantörer för GB200-skåpets lösningar för vätskekylning. För närvarande är Qihong och Cooler Master ledande leverantörer av kallplattor, medan grenrörskomponenter kommer från Cooler Master och Shuanghong. Kylmedelsdistributionsenheter (CDU) tillhandahålls av branschledare som Vertiv och Delta.

 

För viktiga läckageförebyggande komponenter som snabbkopplingar (QD) är tillverkare som CPC, Parker Hannifin, Danfoss och Staubli starkt involverade i upphandling. När ytterligare leverantörer som Jiazhe och Fushida går in i valideringsstadiet kommer de att ha möjligheter att leverera komponenter för snabb frånkoppling under första halvåret 2025, vilket hjälper till att mildra den nuvarande obalansen mellan utbud och efterfrågan.

 

Various suppliers involved in the liquid cooling component supply chain for AI servers.

▲ Nyckelleverantörer för vätskekylningskomponenter

 

 

Ⅴ Fördelarna med flytande kylning

 

Förbättrad kylningseffektivitet

Vätskekylsystem är utformade för att ta bort värme mer effektivt än luftkylningssystem. Detta är särskilt viktigt i AI-applikationer där processorer kan generera betydande värme på grund av höga beräkningskrav. Genom att använda vätska för att absorbera och överföra värme från komponenter kan servrar arbeta vid lägre temperaturer, vilket minskar risken för termisk strypning och förbättrar prestandan.

 

Rymdoptimering

Vätskekylningssystem tar ofta mindre utrymme än traditionella luftkylningslösningar, vilket möjliggör en effektivare design av datacenter. Detta utrymmesbesparande attribut är särskilt fördelaktigt för organisationer som vill maximera sin serverkapacitet utan att utöka sitt fysiska fotavtryck.

 

Energieffektivitet

Med ökande fokus på hållbarhet och energieffektivitet kan lösningar för flytande kylning bidra till att minska den totala energiförbrukningen i datacenter. Genom att minimera beroendet av fläktar och luftkonditioneringsenheter kan flytande kylning sänka energikostnaderna och koldioxidavtrycken, i linje med de ESG-mål som många företag strävar efter att uppnå.

 

Brusreducering

Vätskekylningssystem fungerar tystare än traditionella luftkylda system, vilket leder till en trevligare arbetsmiljö i datacenter. Denna bullerreducering är en viktig faktor för anläggningar belägna nära befolkade områden eller inom kontorsbyggnader.

 

 

Ⅵ Ta itu med vanliga utmaningar

 

Trots fördelarna kommer övergången till flytande kylning med utmaningar. Dessa inkluderar:

 

Initiala kostnader

Förskottsinvesteringen för vätskekylningssystem kan vara högre än traditionella luftkylningslösningar. Organisationer måste väga dessa kostnader mot de långsiktiga fördelarna och besparingarna i energieffektivitet och underhåll.

 

Läckageproblem

En av de viktigaste utmaningarna i samband med vätskekylning är risken för läckage. Korrekt design, materialval och underhållsprotokoll är avgörande för att minska denna risk och säkerställa systemets tillförlitlighet.

 

Underhållskomplexitet

Vätskekylsystem kräver mer komplext underhåll jämfört med luftkylda system. Organisationer måste utbilda sin personal eller anlita specialiserade tjänsteleverantörer för att säkerställa att vätskekylningslösningar förblir effektiva och problemfria.

 

 

Ⅶ Framtida trender inom flytande kylning

 

När efterfrågan på AI-datorer fortsätter att öka, förväntas flera framtida trender forma landskapet för vätskekylning:

 

Antagande av hybridlösningar

Hybridkylsystem som kombinerar både luft- och vätskekylningstekniker kommer sannolikt att få dragkraft. Dessa system kan ge flexibilitet och effektivitet, anpassa sig till olika arbetsbelastningar och operativa behov.

 

Avancerat material

Utvecklingen av avancerade material för vätskekylningskomponenter kan förbättra prestanda och tillförlitlighet. Innovationer inom materialvetenskap kan leda till lättare, mer hållbara och effektivare kyllösningar.

 

Integration med AI och IoT

Integreringen av AI- och IoT-tekniker i kylsystem kan optimera prestandan genom att möjliggöra realtidsövervakning och automatiserade justeringar baserat på miljöförhållanden och serverns arbetsbelastning.

 

Hållbarhetsfokus

I takt med att företag i allt högre grad prioriterar hållbarhet, kommer flytande kyllösningar med miljövänliga kylmedel och material att bli allt vanligare. Branschen kan se en förändring mot slutna system för att minimera avfall och miljöpåverkan.

 

 Future trends in liquid cooling technology

▲ Framtida trender inom vätskekylningsteknik

 

 

 

Ⅷ Slutsats

 

Övergången från luft- till vätskekylningslösningar i AI-servrar representerar en betydande utveckling i branschen, driven av framsteg inom teknik och den ökande efterfrågan på effektiv värmehantering. Med NVIDIA som ledande på AI-servermarknaden och stora molntjänstleverantörer som Google aktivt utforskar alternativ för flytande kylning, förändras landskapet snabbt.

 

Genom att förstå fördelarna och utmaningarna med vätskekylning, såväl som nyckelaktörerna som är involverade i dess implementering, kan organisationer bättre positionera sig för att utnyttja denna teknik för förbättrad prestanda, hållbarhet och konkurrenskraft i AI-landskapet. När branschen går framåt kommer vätskekylningslösningar att spela en avgörande roll för att forma framtiden för datacenter, för att säkerställa att de kan möta kraven från nästa generations AI-applikationer.

 

 

 

 

Skicka förfrågan