Moore Threads MTT S4000 – nowy chiński układ graficzny z 48 GB pamięci GDDR6. Jego zastosowaniem będą zadania związane z AI

93

Coraz bardziej znany na innych rynkach chiński producent układów graficznych Moore Threads zaprezentował kolejny model, który tym razem bardziej skierowany jest w stronę obliczeń związanych ze sztuczną inteligencją, a dokładniej dużymi modelami językowymi.

Pod względem wydajności tytułowy Moore Threads MTT S4000 jest sporo lepszy od poprzedniej generacji. Nadal oparty jest na architekturze MUSA, ale może skorzystać z aż 48 GB pamięci VRAM.

Chiński producent Moore Threads oficjalnie zaprezentował nową generację układów graficznych o oznaczeniu MTT S4000. Jednostka ma się wyróżniać swoją wydajnością w zakresie obliczeń związanych ze sztuczną inteligencją.

Więcej od autora
1 z 169

Coraz więcej producentów skupia swoją uwagę na obecnej dziedzinie „sztucznej inteligencji”, więc nie dziwi fakt, że nowe produkty są tworzone w taki sposób, aby mogły ją wspierać. Moore Threads MTT S4000 będzie dostępny na rynku konsumenckim, choć producent najbardziej wyróżnił jego możliwości w zakresie wspomnianych obliczeń AI. Pod względem wydajności w grach nie wiadomo zbyt wiele, choć można wspomnieć, że poprzednie układy graficzne miały się okazać bardzo dobre w tym aspekcie, a ostatecznie… praktycznie żadne oczekiwania nie zostały spełnione. Obecna generacja oparta jest na architekturze MUSA trzeciej generacji, jednak zabrakło informacji dotyczących liczby rdzeni, czy też jednostek Tensor.

 Moore Threads MTT S3000Moore Threads MTT S4000
ArchitekturaMUSA (2. generacji)MUSA (3. generacji)
Rdzenia MUSA4096?
Jednostki Tensor128?
Taktowanie Boost1,9 GHz?
Moc obliczeniowa FP3215,2 TFLOPS25 TFLOPS
Moc obliczeniowa TF32?50 TFLOPS
Moc obliczeniowa FP16/BF16?100 TFLOPS
Moc obliczeniowa INT857,6 TOPS200 TOPS
Pamięć VRAM32 GB GDDR648 GB GDDR6
Przepustowość pamięci448 GB/s768 GB/s
PCIeGen5 x16Gen5 x16
Porty wideo2 x DisplayPort 1.44 x DisplayPort
Wymiary268,6 x 110,96 x 38,7 mm?

Natomiast w kwestii mocy obliczeniowej FP32 widać zauważalny wzrost względem wcześniejszej generacji (MTT S3000). Warto wspomnieć, że Moore Threads MTT S4000 wyprzedza w tym aspekcie nawet układ NVIDIA A100 (19,5 TFLOPS dla FP32), aczkolwiek przegrywa pod kątem mocy obliczeniowej INT8 (Tensor, analogicznie 200 vs 624 TOPS). Na pokładzie znalazło się aż 48 GB pamięci VRAM w standardzie GDDR6, która ma pomóc w obsłudze dużych modeli językowych (LLM). Układ graficzny wspiera magistralę PCIe Gen5 x16, a sama przepustowość pamięci sięga tu 768 GB/s. Wykorzystywanym gniazdem zasilania jest 12VHPWR. Na więcej informacji dotyczących choćby realnej wydajności przyjdzie nam nieco poczekać. Co ciekawe, tysiąc pierwszych układów graficznych zostanie umieszczonych w chińskich serwerach obliczeniowych – właśnie do sprostania obecnemu zapotrzebowaniu na usługi związane z AI. Moore Threads MTT S4000 ponoć bez problemu radzi sobie z LLM o 130 mld parametrów. 

Komentarz