Grid - CERN ulepsza Internet

sbisson

Początków sieci komputerowych można doszukiwać się w wojskowym Arpanecie. To właśnie on był pierwszą siecią rozproszoną, czyli taką, w której zniszczenie kilku węzłów nie powodowało przerwania pracy całej sieci. W latach 1967-1972 sieć działała jako tajny projekt wojskowy, a po ujawnieniu wykorzystywanego przez nią protokołu TCP/IP zaczęła szybko się rozrastać i obejmowała coraz liczniejsze podsieci cywilne.

Arpanet dał początek sieciom, jednak twórcą WWW, czyli tego, co stanowi podstawę Internetu, jest Timothy Berners-Lee, pracownik Europejskiego Ośrodka Badań Jądrowych (CERN) w Genewie.
To właśnie on w 1989 roku zaproponował ogólnoświatowy projekt oparty na hipertekście, stworzył pierwszy serwer HTTP oraz pierwszą przeglądarkę i edytor hipertekstu. Tim Berners-Lee jest też twórcą pierwszej strony WWW. Nadał można ją oglądać pod adresem info.cern.ch. Współpracownikiem Bernersa-Lee i pierwszym internautą był Robert Cailliau.

Od pewnego czasu coraz częściej pojawiają się głosy specjalistów, którzy ostrzegają, że Internet w obecnym kształcie przestaje radzić sobie z coraz większą ilością danych przesyłanych pomiędzy użytkownikami. Jeśli nic się nie zmieni, to za kilka lat możemy być świadkami poważnych problemów z uzyskaniem dostępu do informacji, które są nam właśnie potrzebne. Coraz bardziej popularne usługi audio i wideo powoli zatykają Sieć.

Rozwiązaniem tego problemu może być projekt Grid, który działa w CERNIE. To dzięki niemu ma powstać Internet przyszłości.

Gridy


Musimy tutaj zauważyć, że samo pojęcie grid oznacza pewien rodzaj technologii i architektury sieciowej. Grid traktuje całą sieć jako jeden wielki, wirtualny komputer. Pierwszym gridem był projekt SETI@home, który korzysta z połączonych komputerów tysięcy ochotników. Te komputery są wykorzystywane do przetwarzania danych z radioteleskopu w Aracibo i analizowania ich w nadziej znalezienia sygnału wysłanego przez obcą cywilizację.

Z gridów korzysta wiele instytucji, jednak ten używany przez CERN jest wyjątkowy. Ze względu na swoją wielkość, wydajność oraz znaczenie CERN-u dla nauki i powstania Internetu, to właśnie o nim mówi się, że jest zaczątkiem przyszłego Internetu.

Wielki Zderzacz Hadronów

W czerwcu 2008 roku w CERN-ie zacznie działać wyjątkowe urządzenie badawcze -Wielki Zderzacz Hadronów (Large Hadron Collider - LHC). To największy akcelerator na świecie, a jednym z jego głównych zadań jest znalezienie bozonu Higgsa, zwanego też boską cząstką.
LHC będzie produkował około 15 petabajtów danych w ciągu roku. To około 1500 razy więcej, niż informacje zawarte we wszystkich książkach, jakie są przez rok drukowane na naszej planecie. Te 15 petabajtów to mniej więcej 1,5% całej informacji, jaką rocznie produkuje ludzkość. To tak wielka ilość danych, że CERN nie jest w stanie jej przechować i przetworzyć. Profesor Tomy Doyle, dyrektor techniczny Grida stwierdził, że gdyby nawet CERN zakupił i zainstalował odpowiednią liczbę serwerów, to nie byłby w stanie zapewnić im wystarczającej ilości energii. Jedynym wyjściem jest więc wykorzystanie mocy obliczeniowych i dysków twardych innych centrów naukowych.

Grid

CERN-owski Grid będzie korzystał z już istniejących superwydajnych sieci akademickich. Jedną z nich jest sieć GEANT, której szkielet charakteryzuje się wydajnością rzędu 10 gigabitów na sekundę. Poszczególne węzły łączą się z siecią szkieletową z prędkością 1 gigabita na sekundę, a z kolei poszczególne pecety mają do dyspozycji łącze o przepustowości od 10 do 100 megabitów.
Na potrzeby Grida powstał też ciągle rozwijany zestaw narzędzi o nazwie Globus Toolkit. To pakiet oprogramowania, które odpowiada za działanie sieci, zarządzanie jej zasobami, przydzielaniem praw dostępu i za bezpieczeństwo.

W jego skład wchodzą m.in. GRAM (Globus Resource Allocation Manager) - przeprowadza konwersję komend pomiędzy serwerami przechowującymi zasoby, a pecetami starającymi się o dostęp do nich; GSI (Grid Security Infrastructure) - uwierzytelnia użytkowników i sprawdza ich prawa dostępu; MDS (Monitoring and Discovery Service) - zbiera informacje o dostępnych zasobach, takich jak wydajność maszyn, wydajność łącza, typ pamięci masowej itp; GRIS (Grid Resource Information Service) - odpytuje zasoby i ich aktualną konfigurację; GridFTP (Grid File Transfer Protocol) - odpowiada za wydajne i bezpieczne przesyłanie danych. Twórcy Globusa pomyśleli też o tworzeniu kopii zapasowych wygranych danych czy specjalnych narzędziach do zarządzania nimi.

CERN Internet Timothy Berners-Lee Arpanet