Automatyczny tłumacz dorównał człowiekowi
Badacze z Microsoftu poinformowali na oficjalnym blogu o stworzeniu pierwszego automatycznego tłumacza, który przekłada tekst chiński na angielski równie szybko i dokładnie co człowiek. Stworzenie maszynowego systemu tłumaczącego, który będzie dorównywał człowiekowi to marzenie wielu ekspertów. Nie przypuszczaliśmy, że uda się je zrealizować tak szybko, mówi Xuedong Huang, jeden z badaczy Microsoftu.
Eksperci od dekad pracują nad maszynowym tłumaczeniem języków i przez większość tego czasu uważano, że maszyny nigdy nie osiągną takiej biegłości jak ludzie. Teraz wiadomo, że jest to możliwe. To jednak nie koniec prac nad systemami automatycznego tłumaczenia. Ming Zhou, dyrektor odpowiedzialny w Microsoft Research Asia za wydział przetwarzania języków naturalnych mówi, że do rozwiązania pozostało jeszcze wiele wiele problemów. Specjaliści mają zamiar m.in. przetestować swój system podczas tłumaczenia informacji prasowych w czasie rzeczywistym.
System automatycznego tłumaczenia sprawdzano za pomocą Newstest2014. To zestaw składający się z około 2000 przypadkowo wybranych zdań z różnych źródeł prasowych. Zdania te zostały wcześniej przetłumaczone przez ekspertów. Zautomatyzowany system poddano wielokrotnym testom, a do każdego z nich wybierano po kilkaset zdań. Microsoft zatrudnił też grupę dwujęzycznych osób, które porównywały tłumaczenia dokonane przez maszynę z tymi wykonanymi przez zawodowych tłumaczy.
Warto pamiętać, że tłumaczenie tekstu jest trudniejsze niż rozpoznawanie mowy. W przypadku rozpoznawania mowy oczekujemy, że maszyna da nam taki sam wynik jak człowiek. W przypadku tłumaczenia jest jednak inaczej. Istnieje wiele sposobów na powiedzenie tego samego, więc dwóch profesjonalnych tłumaczy może przełożyć to samo zdanie w inny sposób i obaj będą mieli rację. Tłumaczenie maszynowe jest znacznie bardziej złożone niż proste rozpoznawanie wzorców. Ludzie mogą użyć różnych słów na powiedzenie tego samego i nie będzie można stwierdzić, że tylko jeden z tych sposobów jest właściwy, wyjaśnia Zhou.
Komentarze (9)
rahl, 16 marca 2018, 20:35
Pewnie do czasu kiedy dorówna w przypadku języka Polskiego nie dożyją nawet nasze wnuki
nantaniel, 16 marca 2018, 21:43
Tłumaczenie pojedynczych zdań wyrwanych z kontekstu to bzdurny test, bo pozbawia wyzwanie tego, co w tłumaczeniu jest właśnie najtrudniejsze - kontekstu. Nic dziwnego, że automatyczny tłumacz dorównał ludziom.
Nawet niezbyt skomplikowany algorytm dobrze przetłumaczy pojedyncze zdanie typu "It was red" - tłumacz z braku kontekstu dałby po prostu "To było czerwone". Schody pojawiają się, gdy mamy kontekst ("I'd seen this car. It was red.") - człowiek przetłumaczy zdanie na "Było czerwone", a algorytm będzie miał problem.
No ale ja tu o kontekście, a przecież Microsoft chwali się tłumaczeniem z i na język pozbawiony fleksji :E
Z "Kali jeść, Kali pić" na "Jeść Kali, pić Kali"
thikim, 16 marca 2018, 22:19
No to jeśli chodzi o kontekst warto przypomnieć pojedynek w kwestii analizy prawniczych umów:
komputer - ludzie.
Amerykańskie uczelnie wytypowały swoich jak mniemam najlepszych prawników.
Komputer był prawie o 10 % lepszy od najlepszego z prawników i około 200 razy szybszy niż przeciętnie człowiek
Ludzie nie mieli żadnej nawet najmniejszej szansy na wygraną
Liczba czynności w których komputer wygrywa rośnie nieubłaganie.
I dobrze
nantaniel, 16 marca 2018, 23:01
Wiesz - tam i tu maszyna wykazała się w rozwiązywaniu pewnego bardzo okrojonego i uproszczonego problemu, a zrobiono z tego wielkie halo. Do używalności dużo jeszcze tym algorytmom brakuje.
thikim, 17 marca 2018, 13:03
To prawda. Ale w fabrykach maszyny też realizują pewne uproszczone ciągi czynności. I wyparły ludzi Bo złożone problemy i czynności można zazwyczaj podzielić na proste problemy i czynności.
Odważnie uważali
tempik, 18 marca 2018, 10:15
A skąd w mózgu bierze się kontekst? Od dziecka uczymy się języka i czasami nasza wypowiedź jest błędnie interpretowana lub my błędnie interpretujemy. Takie frazy wraz okolicznościami towarzyszącymi zapisujemy w pamięci. to bułka z masłem dla sztucznej sieci neuronowej. Algorytm może 24h/dobę czytać całą zawartość internetu i uczyć się ludzkiego kontekstu. Boty udające ludzi na chatach również mogą trenować swoje zdolności
Przemek Kobel, 19 marca 2018, 09:19
A ja kiedyś widziałem ciekawy wariant systemu SMT, po którym (ważne: jak dla mnie) dość łatwo się poprawiało i którego błędów można było się spodziewać w charakterystycznych miejscach. Inaczej niż w oficjalnej charakterystyce takiego czegoś: https://en.wikipedia.org/wiki/Statistical_machine_translation
Bo ci, co muszą pracować na tekstach częściowo tłumaczonych przez AI to mają przerąbane - taki system uczy się na robocie poprzednich tłumaczy (a ci rzadko kiedy są naprawdę dobrzy). Efekt jest taki, że w jego produktach mamy kumulację wszystkich wtop wszystkich poprzedników. Do tego dochodzi ta jego sztuczna "inteligencja" powodująca, że system próbuje robić "po człowiekowemu" odmiany i szyki zdań. Efekt końcowy jest taki, że trzeba to potem diabelnie długo poprawiać, żeby przypominało jakieś sensowne zdanie. I jest to robota za darmo, bo wg. maszyny np. 60% tłumaczenia już zrobiła.
Slavis, 19 marca 2018, 09:25
Gdy ludzie słyszą o maszynowym tłumaczeniu, mają dziwną wizję przed oczami bezproblemowego porozumiewania się na wakacjach. Do tego wystarczą rozmówki i nieco chęci wyrwania się z "polskiej strefy". Trochę nie o to chodzi.
Maszynowe tłumaczenia znajdują zastosowanie od lat. Na pewno będą coraz bardziej doskonałe a niektóre zawody nieuchronnie będą zanikać. Inną, wytłumaczalną wyłącznie lenistwem, kwestią jest rezygnacja z nauki języków obcych. To tak, jakbym widział Homera Simpsona, skaczącego z w górę uniesionymi rękoma "Hurra, nie trzeba się uczyć języków!". Czy o to Wam chodzi? nauka języków obcych to wspaniała przygoda i nie jest istotne, czy będą automatyczni tłumacze, czy nie.
Pozdrawiam lingwistów!
Michał
darekp, 19 marca 2018, 11:30
Hm, służę kontrprzykładem: ja w pracy jestem zawalony robotą, znam angielski, w domu rodzina itp. (i próby wyszukiwania czasu na samokształcenie z narzędzi programistycznych, których nie używamy w pracy, a mogą się kiedyś w przyszłości przydać). I chętnie nauczyłbym się chińskiego i czeskiego (co najmniej, jeszcze mnie czasem nachodzi ochota na hiszpański). Zdołam? A czeski taki prosty, wydawałoby się, wszystko podobne jak w polskim...
Z innymi opiniami zgoda.