Głos kobiecy trudniejszy do rozszyfrowania

| Technologia

Aplikacje rozpoznające mowę i przetwarzające ją na tekst pisany popełniają więcej błędów w przypadku głosów żeńskich. Naukowcy prowadzeni przez doktora Syeda Alego postanowili sprawdzić, jak zwiększyć dokładność przekładu i jakie czynniki niekorzystnie wpływają na rozpoznawanie mowy.

Dziesięciu rezydentów oddziału radiologii (5 kobiet i 5 mężczyzn) miało nagrać kilka standardowych raportów. Każdy składał się z 2.123 słów. Następnie podlegały one obróbce przez program transkrypcyjny. Potem porównywano tekst oryginalny z tekstem wyświetlanym na ekranie komputera i zliczano popełnione błędy. Odsetek błędów zdefiniowano jako sumę insercji (dostawiania dodatkowych liter czy sylab) i delecji (usunięcia) podzieloną przez ogólną liczbę słów.

W populacji męskiej wskaźnik ten wahał się w granicach 0,025-0,139, a w populacji żeńskiej od 0,015 do 0,206.

Dr Ali uważa, że większa liczba błędów przekładu u kobiet oznacza, że powinny one więcej ćwiczyć z urządzeniami wyposażonymi w tego typu aplikacje. Sugeruje, że panie mogłyby korzystać z makr czy zmienić styl dyktowania. W zawodzie lekarza błąd może oznaczać uszczerbek na zdrowiu lub nawet utratę życia, więc gra jest zdecydowanie warta świeczki.

Więcej na temat opisanego eksperymentu można przeczytać w relacji prasowej American Roentgen Ray Society.

głos kobiety mężczyźni transkrypcja makro program dr Syed Ali radiolog błąd dyktowanie