Ludzki genom dla każdego

| Ciekawostki
National Human Genome Research Institute, PD

Amerykańskie Narodowe Instytuty Zdrowia (NIH) udostępniły online największą na świecie bazę danych na temat ludzkiego genomu. Baza 1000 Genomes Project jest przechowywana w chmurze Amazona, Amazon Web Services (AWS).

W inicjatywie Big Data początkowo weźmie udział co najmniej sześć amerykańskich federalnych agend rządowych, w tym NIH, Narodowa Fundacja Nauki (NSF) oraz Departamenty Obrony i Energii. W sumie przeznaczą one 200 milionów dolarów na stworzenie technologii potrzebnych naukowcom do zarządzania olbrzymimi zestawami danych. 1000 Genomes Project był od 2008 roku stopniowo udostępniany uczonym. Teraz z 200 terabajtów danych może korzystać każdy.

Udostępnienie tak olbrzymiej ilości informacji nie byłoby możliwe bez udziału Amazona. Nieliczni naukowcy dysponują sprzętem pozwalającym na efektywne wykorzystanie tak wielkiego zestawu danych. Amazon zaoferował bezpłatnie miejsce w swojej chmurze. Dostęp do nich jest możliwy za pośrednictwem usług Amazon Elastic Compute Cloud oraz Amazon Elastic MapReduce. Specjaliści, zainteresowani przetwarzaniem tych danych zapłacą tylko za dodatkowe moce obliczeniowe, jeśli będą potrzebowali ich do pogłębionej analizy.

1000 Genome Projects to międzynarodowy program publiczno-prywatny, nad którym prace rozpoczęto w 2008 roku. Jego celem jest stworzenie najbardziej szczegółowej mapy ludzkiego genomu. Obecnie znajdują się tam genomy ponad 1700 osób z 26 populacji na całym świecie. Jeszcze w bieżącym roku trafią tam informacje na temat genomów kolejnych 900 osób.

Zsekwencjonowanie pierwszego ludzkiego genomu trwało 10 lat i kosztowało miliardy dolarów. Postęp naukowy w tej dziedzinie umożliwił tworzenie takich inicjatyw jak 1000 Genomes Project i zbieranie danych znacznie szybciej. To z kolei spowodowało, że pojawiła się potrzeba wykorzystania potężnej i łatwo dostępnej infrastruktury, pozwalającej na analizę danych. Jesteśmy zadowoleni, że możemy pomóc naukowcom w dostępie do tych ważnych informacji poprzez umożliwienie każdemu korzystania z nich przez internet. To oznacza, że naukowcy i instytucje naukowe, niezależnie od swojej wielkości i posiadanego budżetu, mają dostęp do kompletnej bazy danych 1000 Genomes Project i mogą natychmiast rozpocząć analizę tych danych bez konieczności inwestowania w sprzęt, infrastrukturę i personel, które normalnie byłyby do tego potrzebne. Naukowcy mogą skupić się na poszerzaniu naszej wiedzy, a nie na zdobywaniu zasobów potrzebnych do prowadzenia badań - powiedział Deepak Singh, menedżer Amazon Web Services.

Wśród uczestników 1000 Genomes Project znajdziemy prywatne firmy i instytucje publiczne z USA, Chin, Niemiec, Wielkiej Brytanii, Barbadosu, Peru, Bangladeszu, Gambii, Kolumbii, Danii, Szwajcarii, Hiszpanii, Pakistanu czy Wietnamu.

Dane 1000 Genomes Project są dostępne zarówno bezpośrednio w chmurze, jak i za pośrednictwem witryny projektu oraz witryny NIH-u i Data Coordination Center.

1000 Genomes Project chmura obliczeniowa Amazon Web Services genom