Cały Internet w komputerze IBM-a?

| Technologia
IBM

Redaktorzy serwisu The Register twierdzą, że dotarli do dokumentów IBM-a, w których Błękitny Gigant mówi o możliwości stworzenia systemu komputerowego tak potężnego, że byłby w stanie „hostować cały Internet jako aplikację”. System miałby być wersją superkomputera BlueGene.

Inżynierowie IBM-a proponują takie przerobienie systemu operacyjnego BlueGene’a, by mógł on uruchomić większość wykorzystywanych w Sieci programów – Linuksa, Apache’a, MySQL czy Ruby on Rails.

W swoich dokumentach IBM zwraca uwagę na to, że o ile wielkie systemy SMP (summetric multi-processing) jak i klastry mają swoje zalety, to klienci preferują klastry. Pozwalają one bowiem na tanie uzyskanie dużych mocy obliczeniowych. Potężne klastry dorównują lub przewyższają mocą wielkie systemy SMP.

Stąd też giganci tacy jak Amazon, Google, Microsoft czy Sun korzystają z klastrów, oferując swoim klientom oprogramowanie, moce obliczeniowe czy miejsce do przechowywania danych. Klastry łatwo jest rozbudowywać, w miarę, jak rośnie zapotrzebowanie na moc obliczeniową. Tutaj jednak pojawia się problem rosnącego zużycia energii (a więc kosztów eksploatacyjnych) oraz rosnącego zapotrzebowania na przestrzeń.

IBM uważa, że rozwiązaniem problemu są systemy klasy BlueGene/P, które w wypadku wyjątkowo wymagających zastosować są tańsze i bardziej efektywne niż tradycyjne klastry. Błękitny Gigant już testuje nowe aplikacje dla BlueGene’a i twierdzi, że mogą być one równie wydajne jak klastry.

BlueGene/L autorstwa IBM-a to najpotężniejszy superkomputer na świecie. Aż 4 z 10 najpotęzniejszych maszyn tego typu korzysta z wyjątkowej architektury tego systemu.
BlueGene wykorzystuje tysiące średnio wydajnych procesorów. Zwykle są to 850-megahercowe układy PowerPC. Cztery procesory z wbudowaną pamięcią oraz kontrolerami naśladują one model SoC (system-on-chip) i tworzą pojedynczy węzeł. Na pojedynczej karcie rozszerzeń umieszczone są 32 takie węzły. Z kolei 16 kart umieszczanych jest na płycie głównej. Dwie takie płyty tworzą pojedynczy moduł BlueGene’a. Jak łatwo obliczyć w skład pojedynczego modułu wchodzą 1024 węzły, które składają się z 4096 procesorów i 2 terabajtów pamięci.

Architektura BlueGene pozwala na stworzenie maszyny składającej się z 16 384 modułów. Daje to gigantyczną liczbę ponad 67 milionów procesorów i 32 petabajtów pamięci.
Każdy z modułów korzysta ponadto z interfejsów I/O o przepustowości 640 Gb/s. Teoretyczna maszyna mogłaby więc charakteryzować się przepustowością danych rzędu 10,4 Pb/s.

Największą siłą BlueGene’a jest hybrydowa konstrukcja, która korzysta z tego, co najlepsze w systemach SMP i klastrach. Każdy z modułów może pracować jako osobny komputer (ma procesor, pamięć i interfejsy I/O), ale może również przyczyniać się do zwiększenia mocy obliczeniowej systemu jako całości.

Obecnie maszyny z rodziny BlueGene są wykorzystywane do zadań typowych dla superkomputerów – rozwiązywania pojedynczych problemów.

Z dokumentów, do których dotarł The Register, wynika jednak, że IBM pracuje nad stworzeniem znacznie bardziej elastycznego systemu. Inżynierowie eksperymentują już z typowym „internetowym” zestawem programów. Do pojedynczego węzła załadowali zestaw LAMP (Linux, Apache, MySQL, PHP) i uruchomili na nim typowe biznesowe aplikacje oraz serwer Apache. Wydajność węzła była przy takiej konfiguracji programowej niezależna od wydajności całego systemu. IBM zauważa, że takie rozwiązanie idealnie nadaje się w obecnych zastosowaniach sieciowych.

Przykład serwisu Nasza Klasa pokazuje, co dzieje się w przypadku, gdy popularność witryny nagle wzrasta i gwałtownie zwiększa się zapotrzebowanie na moc obliczeniową. Przy tradycyjnym podejściu do skalowania sprzętu kończy się to poważnymi problemami w dostępie do witryny oraz koniecznością długotrwałej integracji sprzętu.

Architektura BlueGene została stworzona właśnie z myślą o wykorzystaniu dodatkowych zasobów. Każdy z modułów jest zbudowany tak, by działał jako całość składająca się z 1024 węzłów lub też by każdy z węzłów pracował samodzielnie. Gwałtowny przyrost mocy obliczeniowej powoduje więc tylko włączania do pracy kolejnych węzłów i przebiega niezauważalnie.

The Register zwraca uwagę na jedną, dość istotną niedogodność proponowanego przez IBM-a rozwiązania. Najpopularniejszą architekturą wśród procesorów jest x86 i większość programów powstaje właśnie na nie. BlueGene korzysta z systemu opartego na Unix/Linux oraz architektury PPC. Pozostaje więc problem zachęcenia szerokich rzesz opensource’owych developerów do tworzenia programów dla PPC.

IBM BlueGene Internet LAMP