Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

NVIDIA modyfikuje projekt racków serwerowych z superchipami GB200. Powodem jest przegrzewanie się układów

Łukasz Stefaniak | 18-11-2024 12:00 |

NVIDIA modyfikuje projekt racków serwerowych z superchipami GB200. Powodem jest przegrzewanie się układówPierwsze dostawy serwerów z superchipami NVIDIA GB200 miały nastąpić w grudniu bieżącego roku. Choć wciąż może tak się stać, to pojawiły się obawy, czy ten termin będzie dotrzymany. Przyczyną są doniesienia o przegrzewaniu się akceleratorów w serwerach NVL72, które będą podstawą infrastruktury sieciowej dużych firm technologicznych. Sprawa jest na tyle poważna, że NVIDIA postanowiła wdrożyć poprawki do projektu racków.

Nie można wykluczyć opóźnienia dostawy pierwszej partii serwerów NVL72. Firma NVIDIA została zmuszona wprowadzić poprawki do ich projektu, gdy okazało się, że obecne w nich akceleratory Blackwell przegrzewają się.

NVIDIA modyfikuje projekt racków serwerowych z superchipami GB200. Powodem jest przegrzewanie się układów [1]

NVIDIA GB200 - serwery wykorzystujące nowe superchipy trafią do klientów w grudniu. Wiemy, kto będzie odbiorcą pierwszej partii

Należy przypomnieć, że choć właściwa dostawa pierwszej partii serwerów NVL72 dopiero przed nami, to niektóre podmioty otrzymały już racki testowe. Microsoft przykładowo wpiął już jeden z nich do swojej infrastruktury napędzającej usługi chmurowe. Problem przegrzewania się dotyczy racków z 72 układami Blackwell (36 superchipów GB200). Uwagę zwróciły na to prawdopodobnie podmioty, które otrzymały już pierwsze NVL72 do testów. Pojedynczy rack przy pełnym obciążeniu cechuje się poborem mocy na poziomie 120 kW, zatem odpowiednie chłodzenie jest w tym przypadku kluczowe. Jego brak może bowiem doprowadzić do obniżenia wydajności sprzętu, a nawet do jego uszkodzenia.

NVIDIA modyfikuje projekt racków serwerowych z superchipami GB200. Powodem jest przegrzewanie się układów [2]

NVIDIA bierze pełną odpowiedzialność za problemy z uzyskiem przy wczesnej produkcji akceleratorów Blackwell

Problemy ze zbytnim nagrzewaniem się układów Blackwell skłoniły NVIDIĘ do wprowadzenia kilku modyfikacji w projekcie serwerów NVL72. Odpowiednie instrukcje zostały już wydane firmom Foxconn i Quanta, które odpowiadają za składanie racków. Wywołało to jednak obawy dotyczące potencjalnego opóźnienia dostaw, a co za tym idzie także wdrożenia tych serwerów. To zaś mogłoby przesunąć termin debiutu nowych usług, które będą bazowały na tej infrastrukturze. Ostatecznie trzeba jednak zauważyć, że dostawy testowych racków mają pomóc wyeliminować podobne problemy. Rzadko bowiem wdrażanie na taką skalę nowego sprzętu przebiega bez żadnych trudności.

Źródło: The Information, Tom's Hardware
Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Liczba komentarzy: 50

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.