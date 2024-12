Podczas konferencji re:Invent w Las Vegas, Amazon Web Services (AWS) dokonało szeregu ogłoszeń, z których wiele dotyczy generatywnej sztucznej inteligencji i tego, w jaki sposób może być ona wykorzystywana przez firmy do modernizacji usług i zwiększenia wydajności. AWS zaprezentowało też chipy nowej generacji dla szerokiej gamy zadań opartych na chmurze i modelach szkoleniowych AI, obiecując lepszą wydajność i wyższą efektywność energetyczną.

Jednym z nowych chipów jest Trainium2, który jest przeznaczony do szkolenia modeli sztucznej inteligencji i ma zapewnić do 4x lepszą wydajność i 2x efektywność energetyczną w porównaniu do swojego poprzednika. Oczekuje się również, że zaoferuje 3x większą pojemność pamięci niż chipy Trainium pierwszej generacji. W komunikacie prasowym Amazon stwierdził, że Trainium2 jest specjalnie zaprojektowany do wysokowydajnego szkolenia modeli fundamentalnych (FM) i dużych modeli językowych (LLM) z bilionami parametrów.

Firma twierdzi również, że Trainium2 będzie superszybki, umożliwiając programistom trenowanie modeli w ułamku czasu wymaganego przez chipy Trainium pierwszej generacji. Według Amazona, Trainium2 dostarczy do 65 eksaflopów mocy obliczeniowej, oferując "wydajność klasy superkomputera" i umożliwiając klientom trenowanie LLM o 300 miliardach parametrów w ciągu tygodni, a nie miesięcy. Wspierana przez Amazon firma AI o nazwie Anthropic ogłosiła już plany wykorzystania Trainium2 do trenowania swoich modeli.

Kolejnym nowym układem jest Graviton4 oparty na architekturze Arm, który według Amazona jest "najpotężniejszym i najbardziej energooszczędnym procesorem AWS do tej pory". Został on zaprojektowany z myślą o szerokiej gamie aplikacji działających na Ultraclusterach Amazon Elastic Compute Cloud (EC2) i ma oferować do 30% lepszą wydajność obliczeniową, 50% więcej rdzeni i 75% większą przepustowość pamięci niż Graviton3. Amazon zacznie oferować chipy Trainium2 w przyszłym roku, podczas gdy instancje R8g napędzane przez Graviton4 są już dostępne w wersji zapoznawczej, a ogólna dostępność spodziewana jest w nadchodzących miesiącach. Nowe chipy zwiększą konkurencję w sektorze sprzętu AI, który jest obecnie zdominowany przez NVIDIĘ. Ponieważ Microsoft również podniósł temperaturę, ogłaszając niedawno swój chip Azure Maia 100 i procesor Azure Cobalt, ciekawie będzie obserwować, jak walka ta prezentować się będzie w nadchodzących miesiącach i latach.

Źródło: Techspot