Głos prawie idealny

| Technologia
IBM

Specjaliści z IBM-owskiego centrum badawczego Thomasa J. Watsona opracowali technologię o skomplikowanej nazwie: "generowanie paralingwistycznych zjawisk poprzez znaczniki w syntezie tekstu w mowę". Kryje się pod nią technika, która do skomputeryzowanych głosów dodaje charakterystyczne dla prawdziwej mowy zawahania, mruknięcia, chrząknięcia.

W przyszłości telefoniczna informacja, tekst przekazywany przez samochodowe urządzenie do nawigacji czy wszelkie inne komunikaty głosowe staną się więc mniej sztuczne i monotonne. Andy Aaron, jeden z twórców systemu, mówi: Dźwięki te mogą być niezwykle subtelne, niemal niesłyszalne, ale mają olbrzymie znaczenie psychologiczne. To niezwykle ważne, by głos przyciągał uwagę. Jeśli kontaktujesz się przez telefon z automatycznym serwisem, za pomocą którego chcesz np. zawrzeć ubezpieczenie, to właśnie [te subtelne dźwięki - red.] czyni różnicę pomiędzy zadowolonym klientem, a kimś, kto odłoży słuchawkę i zrezygnuje.

Aaron mówi, że opracowana przez jego zespół technologia jest tak doskonała, iż sztuczny głos jest niemal nie do odróżnienia od głosu prawdziwego. Technologia IBM-a potrafi też zachowywać się odpowiednio do sytuacji. Gdy dzwoniący będzie np. mówił zbyt głośno lub przerywał wypowiedź, automat poprosi o przyciszenie głosu lub o umożliwienie mu dokończenia kwestii".

IBM głos synteza głosu