reCAPTCHA - nie marnuj czasu na CAPTCHA
Luis von Ahn i jego koledzy z Carnegie Mellon University chcą, by miliony internautów, którzy codziennie wpisują wyświetlane im na ekranie specjalne kody (tzw. CAPTCHA) pozwalające odróżnić człowieka od automatycznego programu, przestały marnować czas. Zamiast wpisywać przypadkowe ciągi znaków, możemy zamieniać stare teksty na postać cyfrową.
Nazwa CAPTCHA pochodzi od „completely automated public Turing tests to tell computers and humans apart”, czyli „całkowicie zautomatyzowane publiczne testy Turinga, odróżniające komputery od ludzi”. Są one coraz częściej stosowane przy logowaniu się do różnych serwisów. Ich celem jest uchronienie serwisu przed zalewem spamu ze strony automatycznych programów. Komputery nie są bowiem w stanie odczytać przedstawionych znaków, dlatego ich bezbłędne wpisanie jest gwarancją, że wpisującym jest człowiek.
Von Ahn chce wykorzystać fakt, że, jak się ocenia, każdego dnia internauci korzystają z CAPTCHA około 60 milionów razy. Każdy z nich spędza przy tym około 10 sekund, co oznacza, że każdego dnia na wypełnianie CAPTCHA ludzkość marnuje ponad 150 000 godzin – mówi Ahn.
Mężczyzna pracuje przy projekcie Internet Archive, którego zadaniem jest przełożenie na formę cyfrową dostępnej literatury. Każdego miesiąca skanowanych jest 12 000 książek. Następnie otrzymane obrazy są analizowane przez oprogramowanie OCR, które zamienia pliki graficzne w tekst. Jednak oprogramowanie nie jest doskonałe i, szczególnie w przypadku starych tekstów, których skany są złej jakości, nie jest w stanie poradzić sobie z jego odszyfrowaniem. Co miesiąc powstają więc setki tysięcy plików graficznych, które trzeba przepisywać ręcznie.
Von Ahn chce, by pliki te były automatycznie dzielone na poszczególne słowa i rozsyłane po Internecie, gdzie byłyby wykorzystywane w formie CAPTCHA. Następnie, jeśli dane słowo zostałoby identycznie odcyfrowane przez wystarczająco dużą liczbę osób, nadzorujący pracę serwer uznawałby odczyt za prawidłowy i w ten sposób składał cały tekst.
Projekt von Ahna, o nazwie reCAPTCHA, zyskał spore uznanie. Intel dostarczył von Ahnowi sprzęt, a prace badawcze są finansowane przez MacArthur Foundation. Już teraz każdy właściciel witryny WWW może przyłączyć się do projektu reCAPTCHA.
Komentarze (0)