Czołowy badacz SI ma pomysł na lepsze rozpoznawanie obrazów przez maszyny

6 listopada 2017, 11:43 | Technologia

Sądzę, że współczesne komputerowe systemy rozpoznawania obrazu są niewłaściwie zaprojektowane. Działają lepiej niż cokolwiek innego, ale to nie znaczy, że działają dobrze. Śmiałe stwierdzenie, ale gdy wypowiada je Geoff Hinton, jeden z twórców maszynowego głębokiego uczenia się, to warto się nad jego słowami zastanowić.

Współczesne systemy rozpoznawania obrazów korzystają z olbrzymich zbiorów danych, na podstawie których uczą się, jak wygląda dany przedmiot. Po przeanalizowaniu tysięcy, a czasem milionów zdjęć wykonanych w różnych warunkach, pod różnymi kątami, są w stanie stwierdzić, że obiekt na zdjęciu, z którym dotychczas nie miały do czynienia, to np. samochód. Oczywiście znalezienie odpowiedniej ilości danych nie jest obecnie żadnym problemem. Jednak za każdym razem gdy chcemy maszynę nauczyć rozpoznawania kolejnego obiektu, musimy zapewnić jej dostęp do odpowiedniej ilości danych, których przetworzenie wymaga z kolei olbrzymich farm obliczeniowych. Komputery działają więc znacznie gorzej niż np. ludzie, którzy po jednokrotnym obejrzeniu obiektu potrafią go później rozpoznać.

Hinton opublikował ostatnio dwa artykuły, w których postuluje stworzenie znacznie bardziej wydajnego systemu rozpoznawania obrazów. Jego największą zaletą jest fakt, że nie będzie on potrzebował tak wielkiej ilości danych jak systemy obecne.

Hinton postuluje stworzenie czegoś, co nazywa „sieciami kapsułowymi”. Każda z takich sieci składałaby się z grupy sztucznych neuronów zajmujących się tylko jednym z wielu elementów obrazu. System stworzony z połączenia takich kapsuł działałaby podobnie do tego, w jaki sposób ludzie przetwarzają i przechowują informacje wzrokowe. To zaś pozwoliłoby mu na zrozumienie, że ołówek odwrócony o 180 stopni nadal jest ołówkiem. I do wysunięcia takiego wniosku system nie potrzebowałby analizowania wcześniej tysięcy obrazów ołówka.

Autor: Mariusz Błoński

Źródło: Geek

uczenie się sztuczna inteligencja rozpoznawanie obrazów Geoff Hinton

Komentarze (5)

Ergo Sum, 6 listopada 2017, 13:31

No wreszcie - dokładnie taki system opisywałam około 6 lat temu. Oczywiście nikt mnie nie słuchał. Teraz ktoś "wymyślił". Nie chodzi o patent czy zyski - chodzi o to że wiele wartościowych pomysłów jest pomijanych bo wymyślił je "amator", a wiele bzdurnych zyskuje dlatego że jest szansa na tym zrobić karierę - niezależnie od skuteczności. 6 lat temu mówiłam że trzeba AI podzielać na małe podzespoły wyspecjalizowane z analizie różnych elementów, oraz w system łączenia i upraszczania wniosków z tych podzespołów

gooostaw, 6 listopada 2017, 14:23

Może warto wtedy było napisać trochę kodu, lub przekonać kogoś kto mógłby Ci w tym w tym pomóc. Jeśli próbowałeś to wielka szkoda że się nie udało. No tak, ktoś znany w tej dziedzinie może rzucić pomysłem i będzie pewien że ktoś go wykorzysta, ale chyba nie ma w tym nic złego

radar, 6 listopada 2017, 15:05

Sęk w tym, że w oryginale tego artykułu wspomina On dzieciach, które nie potrzebują milionów obrazów żeby się czegoś nauczyć. Niby tak, ale po pierwsze dzieci spędzają jednak kilka lat na nauce podstawowych czynności i rozpoznawaniu podstawowych obrazów. Po drugie, nikt nie wie jak mózg działa i koncepcja mimo, że wydaje się trafna (podział), to nikt nie wie "gdzie podzielić".

Jajcenty, 6 listopada 2017, 15:39

Niby tak, ale po pierwsze dzieci spędzają jednak kilka lat na nauce podstawowych czynności i rozpoznawaniu podstawowych obrazów. Po drugie, nikt nie wie jak mózg działa i koncepcja mimo, że wydaje się trafna (podział), to nikt nie wie "gdzie podzielić".

Coś w tym jest, musi być dostępna jakaś wiedza, żeby móc dokonać syntezy. Neurony widzą co trzeba koła, drzwi, małe detale, ale synteza jest trudniejsza: koła + drzwi + kształt + wielkość = samochód, ale nie barakowóz* i nie autobus.

Gdybym miał pisać własną AI chyba szedłbym właśnie w połączenie sieci neuronowych do analizy z grą w 20 pytań do syntezy. Czy to ma koła? Czy ma kierownice? Małe wysepki nueronów łatwo odpowiadają na proste pytania. Oczywiście w zbiorze odpowiedzi musi istnieć obiekt.

Tak więc Ergo Sum pomysł masz świetny, ale nie patentowalny Implementacja bije ideę implementacji.

*)współczesne dziecko chyba nie masz na wypowiedzenie słowa: barakowóz

MrVocabulary (WhizzKid), 6 listopada 2017, 17:25

No wreszcie - dokładnie taki system opisywałam około 6 lat temu. Oczywiście nikt mnie nie słuchał. Teraz ktoś "wymyślił". Nie chodzi o patent czy zyski - chodzi o to że wiele wartościowych pomysłów jest pomijanych bo wymyślił je "amator", a wiele bzdurnych zyskuje dlatego że jest szansa na tym zrobić karierę - niezależnie od skuteczności. 6 lat temu mówiłam że trzeba AI podzielać na małe podzespoły wyspecjalizowane z analizie różnych elementów, oraz w system łączenia i upraszczania wniosków z tych podzespołów

Ten gościu w wywiadzie powiedział, że miał na to pomysł od prawie 40 lat, ale nie udało mu się pewnych problemów aż do teraz rozwiązać

dodaj komentarz

Czołowy badacz SI ma pomysł na lepsze rozpoznawanie obrazów przez maszyny

Komentarze (5)

Zostań Patronem

Najnowsze wiadomości

Najnowsze komentarze