Wyszukiwanie macierzami przypadkowymi

| Technologia

Zdaniem Pedra Carpeny z uniwersytetu w Maladze, teorie matematyczne wykorzystywane do badania chaotycznych systemów kwantowych mogą przydać się do udoskonalenia wyszukiwarek internetowych.

Gdy w standardowej wyszukiwarce wpisujemy jakieś zapytanie, porównuje ona liczbę wystąpień interesującego nas terminu na różnych stronach. Im więcej wystąpień, za tym ważniejszy wyszukiwarka uznaje danych dokument.

Carpena proponuje metodę, która nie polega na badaniu częstotliwości występowania szukanej frazy i porównywaniu jej z częstotliwością występowania na innych witrynach. Jego zdaniem należy sprawdzać, gdzie w dokumencie występuje dana fraza. W ten sposób powinniśmy być w stanie zbadań właściwości książki bez porównywania jej z innymi książkami - mówi Hiszpan.

Carpena już wcześniej wykorzystywał teorię macierzy przypadkowych do analizowania systemów kwantowych. Teraz twierdzi, że tej samej techniki można użyć w analizie tekstu.

Jego zdaniem ważne słowa znajdują się zwykle obok siebie, podczas gdy te mniej ważne są rozrzucone przypadkowo po całym tekście. Fizyk przetestował swój pomysł na tekście "Relativity: The special and general theory" Alberta Einsteina. Za najważniejsze słowa zostały uznane: "wszechświat", "pole", "grawitacyjny", "energia". Co więcej, dobre rezultaty uzyskał nawet wówczas, gdy z tekstu usunął wszystkie spacje i kazał programowi odnaleźć ważne wyrazy o długości od 2 do 35 znaków. Innymi słowy, metoda Carpeny sprawdzi się nie tylko w przypadku słowa pisanego, ale również przyda się do badania bardziej abstrakcyjnych zestawów danych.

Obecnie Carpena i jego zespół próbują przystosować swoją technikę do analizy genomu. Chcą się przekonać, czy będą w stanie odnaleźć istotne informacje na jego temat.

Pedro Carpena wyszukiwarka genom tekts Albert Einstein teoria macierzy przypadkowych