Wielki sukces Chin na rynku superkomputerów

| Technologia
Jack Dongarra

Nowy chiński superkomputer, Sunway TaihuLight, znalazł się na czele najnowszej listy TOP500. Wydajność maszyny w teście Linpack wyniosła 93 petaflopsy, jest więc trzykrotnie większa od dotychczasowego lidera, również chińskiego Tianhe-2. Jednak tym, o czym należy przede wszystkim wspomnieć, jest fakt, że Sunway TaihuLight to w pełni chińska konstrukcja. Najnowszy superkomputer korzysta z procesorów ShenWei i chińskich łączy. Jego twórcy rozwiali więc wszelkie wątpliwości dotyczące kwestii chińskiego uzależnienia od zachodnich technologii na rynku superkomputerów.

TaihuLight pracuje w Narodowym Centrum Superkomputerowym w Wuxi. Jego przeznaczeniem są obliczenia z dziedziny klimatologii, meteorologii, modelowania systemów biologicznych, analizy danych oraz z pomoc przy opracowywaniu zaawansowanych systemów inżynieryjnych. Jako pierwszy w pełni chiński superkomputer, który trafił na pierwsze miejsce najpotężniejszych maszyn świata, system Sunway TaihuLight to dowód olbrzymiego postępu, jaki poczyniły Chiny w dziedzinie projektowania i wytwarzania olbrzymich systemów komputerowych - powiedział profesor Guangwen Yang, dyrektor Centrum Superkomputerowego w Wuxi.

Twórcą TaihuLight jest Narodowe Centrum Badawcze Inżynierii i Technologii Obliczeń Równoległych (NRCPC). To właśnie ta organizacja opracowała procesor SW26010, będący mózgiem superkomputera. Układ ten to 260-rdzeniowy chip o wydajności nieco ponad 3 teraflopsów. TaihuLight składa się z 40 960 węzłów, z których każdy posiada jeden procesor. Szczytowa wydajność takiej konfiguracji to 125 petaflopsów.

Procesor ShenWei dorównuje więc wydajnością intelowskiemu Xeonowi Phi z rdzeniem Knights Landing. Co ciekawe, to właśnie amerykańskie embargo, które uniemożliwiło Chinom importowanie highendowych procesorów, przyczyniło się do zwycięstwa TaihuLight na TOP500. Najprawdopodobniej bowiem twórcy Tianhe-2 planowali wyposażyć swój superkomputer w najnowsze procesory Intela, dzięki czemu osiągnąłby on wydajność rzędu 100 PFlops na długo przed superkomputerem z Wuxi.

Procesor ShenWei to 64-bitowy układ RISC z zestawem instrukcji SIMD z wykonywaniem poza kolejnością (out-of-order execution). Szczegółowe dane na temat jego architektury nie zostały upublicznione, jednak prawdopodobnie została ona wykonana na wzór DEC Alpha. Procesor podzielony jest na cztery grupy rdzeni. W skład każdej z nich wchodzą 64 rdzenie obliczeniowe (CPE) i jeden zarządzający (MPE). Każda grupa rdzeni posiada własny kontroler pamięci o przepustowości 136,5 GB/s. Całość współpracuje z zegarem 1,45 GHz i obsługuje jeden wątek na rdzeń. Nie wiadomo, w jakiej technologii wykonano procesor.

Każdy z węzłów ma do dyspozycji 32 gigabajty pamięci, w sumie cały superkomputer dysponuje 1,3 PB. Tylko pozornie jest to dużo. Większość superkomputerów charakteryzuje się znacznie lepszym stosunkiem pamięci do wydajności. Ponadto TaihuLight korzysta z kości DDR3, które są wolniejsze i zużywają więcej energii niż DDR4.

Superkomputer dysponuje też niewielką ilością pamięci podręcznej. Nie jest ona podzielona na poziomu. Każdy z rdzeni ma do dyspozycji 12 kB pamięci na instrukcje oraz 64 kB pamięci notatnikowej, w której przechowuje wyniki obliczeń.

O ile podsystem pamięci nie jest mocną stroną superkomputera, to można go pochwalić za energooszczędność. TaihuLight potrzebuje do pracy 15,3 MW, podczas gdy trzykrotnie mniej wydajny pobiera 17,8 MW. Dzięki takim osiągom TaihuLight z pewnością trafi na listę Green500, gdyż jego wydajność na wat wynosi aż 6 gigaflopsów. Trzeba jednak wspomnieć, że gdyby maszyna dysponowała większą ilością pamięci, pobierałaby znacznie więcej mocy.

Połączenia pomiędzy poszczególnymi węzłami superkomputera również są rodzimego autorstwa. Bazują one na technologii PCIe 3.0, co zapewnia przepustowość rzędu 16 GB pomiędzy węzłami, a opóźnienia wynoszą 1 mikrosekundę.

System operacyjny maszyny to Sunway Raise OS. Wykorzystuje on standardową dystrybucję Linuksa, do której wprowadzono zmiany niezbędne, by system działał na specyficznej architekturze superkomputera.

Dla porządku wspomnimy, że na drugim miejscu najnowszej TOP500 znalazł się chiński Tianhe-2 (33,8 PFlops), następny jest amerykański Titan (17,6 PFlops), na czwartej pozycji ulokował się również amerykański Sequoia (17,2 PFlops). Kolejne miejsca zajmują K Computer (10,5 PFLops, Japonia), Mira (8,6 PFlops, USA), Trinity (8,1 PFlops, USA), Piz Daint (6,3 PFlops, Szwajcaria), Hazel Hen (5,7 PFlops, Niemcy) oraz Shaheen II (5,6 Pflops, Arabia Saudyjska).

Na liście znajdziemy też 6 superkomputerów z Polski. Są to Prometheus (48. pozycja, 1,7 PFlops), Hetman (90. pozycja, 1 PFlops), Okeanos (107. pozycja, 0,9 PFlops), BEM (147. pozycja, 0,7 PFlops), Tryton (209. pozycja, 0,5 PFlops) oraz maszyna z Centrum Komputerowego w Świerku (292. pozycja, 0,4 PFlops).

TaihuLight superkomputer Chiny TOP500