Teoria lingwistyczna udoskonalona po 75 latach

| Humanistyka
Windy Angels, CC

Steven Piantadosi, Harry Tily i Edward Gisbon z Wydziału Mózgu i Nauk Poznawczych MIT-u badają, w jaki sposób ludzie myślą i komunikują się ze sobą. Postanowili przetestować liczące sobie 75 lat językowe prawo Zipfa i zauważyli, że wymaga ona udoskonalenia. W roku 1935 lingwista George Kingsley Zipf stwierdził, że „wielkość słów ma tendencję, jako całość, do bycia odwrotnością, niekoniecznie proporcjonalną, częstości ich pojawiania się". Innymi słowy, częściej pojawiające się słowa są zwykle krótsze od tych rzadziej pojawiających się.

Jedną z najszerzej znanych i prawdopodobnie uniwersalnych właściwości ludzkiego jest ta, że często używane słowa są zwykle krótkie - napisali badacze z MIT-u. Jak wyjaśniał Zipf, ma to związek z ekonomią wypowiedzi. Angielski wyraz „of" jest tak krótki, gdyż używa się go wyjątkowo często. To czwarte pod względem popularności słowo. Najpopularniejszym słowem pisanym jest „the". Na liście 100 najczęściej używanych angielskich słów znajdziemy „be", „on", „have", „who" czy „some". To już było wiadomo za czasów Zipfa. Teraz naukowcy udoskonalili jego prawo stwierdzając, że wśród 10 badanych języków to, co człowiek mówi jest ważniejszym czynnikiem wpływającym na długość słowa od tego, jak często dane słowo wypowiada.

W czasie swoich badań uczeni chcieli porównać teorię Zipfa z własnym pomysłem, zgodnie z którym na długość słowa wpływa średnia ilość informacji, którą wnosi ona do wypowiedzi. Aby to sprawdzić użyli internetu i sprawdzili wszelkie możliwe kombinacje dwóch, trzech i czterech wyrazów występujących obok siebie. Dzięki temu mogli dowiedzieć się, na ile przewidywalne jest pojawienie się danego wyrazu.

Na przykład w kontekście „Monday night...." wystąpienie słowa „football" jest bardzo prawdopodobne, a co za tym idzie, niesie ono ze sobą niewiele informacji. Ale na przykład w kontekście „I ate...", słowo, którego brakuje, jest całkowicie nieprzewidywalne, dlatego też niesie ze sobą dużo informacji - mówi Piantadosi. Naukowcy przypuszczali, że średnia ilość informacji zawarta w sekwencji dwu-, trzy- lub czterowyrazowej powinna częściowo wpływać na długość wyrazów, albo pod względem liczby liter albo sylab. Sekwencja wyrazów jest zakodowana w języku tak, by komunikacja była jak najbardziej efektywna. A to oznacza, że sekwencja ta, to efektywny kod związany ze znaczeniem, który można wykazać w badaniach statystycznych. Takie właśnie przypuszczenie wysunęliśmy - dodaje Piantadosi.

Jeśli przyjrzymy się słowu miłość, to w różnych językach oznacza ono to samo i ma podobną długość (love, amour, liebe, amor, karlek). Jednak, jak uważają uczeni z MIT-u, na to, jak często konkretne słowo jest używane, decyduje nie jego długość, a słowa występujące po i przed nim.

Uczeni zbadali swoją teorię na przykładzie czeskiego, holenderskiego, francuskiego, angielskiego, niemieckiego, hiszpańskiego, włoskiego, portugalskiego, rumuńskiego i szwedzkiego. Okazało się, że odstępstwa od ich teorii można zauważyć tylko w niemieckim. Byłem zdumiony, że efekt ten występuje w tak wielu językach. Sądziłem, że różnice w morfologii czy strukturze wyrazów, zaburzy ten efekt w różnych językach, ale tak się nie stało - dodaje Piantadosi.

Badania z MIT-u mogą też dostarczać dodatkowych wyjaśnień, dlaczego najczęściej używane słowa są krótkie. Są bowiem przewidywalne, niosą zatem niewiele informacji. Ponadto liczne z nich to wyrazy funkcjonalne - takie jak „with", „from" czy „over" - których zadaniem jest łączenie innych słów. Krótkie wyrazy zwykle łączą się w często występujące związki frazeologiczne, a zatem takie, które wnoszą niewiele danych.

Naukowcy z MIT-u odkryli też, że ludzie komunikują się w niemal optymalny sposób. Zasób słownictwa nie jest dowolny, w tym sensie, że nie używamy go w całkowicie swobodny sposób. Jest on dobrze ustrkturyzowany pod kątem komunikacji, niosąc ze sobą pewne ciągi wyrazów, których ludzie zwykle używają - dodaje Piantadosi.

lingwistyka słowo ekonomia długość częśtość występowania