Sposób na oczy dla komputera

| Technologia
| spoon |, Creative Commons

Naukowcy z Massachusetts Institute Technology próbują dowiedzieć się, jak to się dzieje, że potrafimy rozpoznawać obiekty. Ich prace mogą posłużyć do stworzenia maszyn widzących w sposób podobny jak ludzie.

Widzenie i rozpoznawanie przedmiotów to dla nas umiejętności tak oczywiste, że w ogóle się nad nimi nie zastanawiamy. Tymczasem są to bardzo skomplikowane mechanizmy. Wystarczy uświadomić sobie, że nigdy nie widzimy dwukrotnie tego samego obrazu. Przedmioty, ludzi i zwierzęta oglądamy w coraz to nowych sytuacjach, pod innym kątem, przy zmieniającym się oświetleniu. A mimo to potrafimy je rozpoznać.

Ta stabilność, niezmienność to podstawa umiejętności rozpoznawania obiektów - mówi James Di Carlo z McGovern Institute for Brain Research w MIT. Chcemy dowiedzieć się, w jaki sposób mózgowi udało się osiągnąć tę stabilność i jak możemy ją zaimplementować w systemach komputerowych - dodaje.

Jedno z możliwych wyjaśnień jest takie, że w ciągu sekundy następują trzy niewielkie ruchy gałek ocznych. Tymczasem obiekty fizyczne poruszają się dość wolno. Oczy rejestrują więc "klatki" z obrazami danego obiektu, a mózg uznaje, że seria następujących po sobie "zdjęć" przedstawia ten sam obiekt i dlatego potrafimy go rozpoznać.

Już wcześniej zespół DiCarlo przeprowadził ciekawy eksperyment, który potwierdziałby teorię "serii zdjęć". Badanym wyświetlano przedmiot peryferiach pola widzenia. Gdy oczy zaczynały się poruszać tak, żeby znalazł się on w centrum pola widzenia, przedmiot zamieniano na inny. Badani świadomie nie byli w stanie zarejestrować zmiany, jednak okazało się, że po pewnym czasie mylili oba przedmioty. Może to świadczyć o tym, że mózg, do którego trafiała "seria zdjęć" dwóch różnych przedmiotów, uznawał je za jeden.

Ostatnio profesor DiCarlo przeprowadził kolejny eksperyment, tym razem na małpach. Naukowcy zbierali sygnały dobiegające z dolnej kory skroniowej w której najprawdopodobniej znajduje się ośrodek "stałości wzrokowej". Neurony tej kory mają swoje preferencje i reagują na "ulubiony" przedmiot niezależnie od tego, w którym miejscu pola widzenia się on znajduje.

Najpierw zidentyfikowaliśmy obiekt, który neuron preferował - na przykład żaglówkę - oraz taki, który mniej 'lubił' - na przykład filiżankę herbaty - opowiada magistrant Nuo Li. Gdy w różnych miejscach pola widzenia wyświetlaliśmy żaglówkę, oczy małpy w naturalny sposób przemieszczały się tak, by znalazła się ona w centrum. Jedno z miejsc w polu widzenia wybraliśmy jako punkt, w którym będziemy małpę 'oszukiwać'. Najpierw wyświetlaliśmy tam żaglówkę, a gdy oczy zaczynały się poruszać, zmienialiśmy ją na filiżankę herbaty - mówi.

Badania wykazały, że po serii takich "oszustw" neurony małp zareagowały tak samo, jak neurony ludzi z poprzednich badań - straciły orientację co do przedmiotu. Neuron, który "lubił" żaglówki nadal je preferował we wszystkich punktach pola widzenia, z wyjątkiem tego jednego, w którym pokazywano mu filiżankę herbaty. Akurat w tym miejscu zaczął preferować filiżankę herbaty. Im dłużej trwały eksperymenty, tym silniejsza była zmieniona preferencja.

Co ważne, naukowcy w żaden sposób nie wpływali na preferencje małp. Zwierzęta mogły swobodnie wędrować wzrokiem po całym ekranie, na którym pokazywano obrazki.
Byliśmy zdumieni efektywnością uczenia się neuronów, szczególnie po 1- lub 2-godzinnym treningu - mówi DiCarlo. Wydaje się, że nawet u dorosłych system rozpoznawania obiektów bez przerwy się uczy na podstawie doświadczenia. Jeśli weźmiemy pod uwagę fakt, że w ciągu roku oczy człowieka wykonują około 100 milionów ruchów, to ten właśnie mechanizm może być podstawą naszych umiejętności łatwego rozpoznawania obiektów - dodaje profesor.

oczy wzrok widzenie komputer rozpoznawanie mózg dolna kora skroniowa