Teoria lingwistyczna udoskonalona po 75 latach
Steven Piantadosi, Harry Tily i Edward Gisbon z Wydziału Mózgu i Nauk Poznawczych MIT-u badają, w jaki sposób ludzie myślą i komunikują się ze sobą. Postanowili przetestować liczące sobie 75 lat językowe prawo Zipfa i zauważyli, że wymaga ona udoskonalenia. W roku 1935 lingwista George Kingsley Zipf stwierdził, że „wielkość słów ma tendencję, jako całość, do bycia odwrotnością, niekoniecznie proporcjonalną, częstości ich pojawiania się". Innymi słowy, częściej pojawiające się słowa są zwykle krótsze od tych rzadziej pojawiających się.
Jedną z najszerzej znanych i prawdopodobnie uniwersalnych właściwości ludzkiego jest ta, że często używane słowa są zwykle krótkie - napisali badacze z MIT-u. Jak wyjaśniał Zipf, ma to związek z ekonomią wypowiedzi. Angielski wyraz „of" jest tak krótki, gdyż używa się go wyjątkowo często. To czwarte pod względem popularności słowo. Najpopularniejszym słowem pisanym jest „the". Na liście 100 najczęściej używanych angielskich słów znajdziemy „be", „on", „have", „who" czy „some". To już było wiadomo za czasów Zipfa. Teraz naukowcy udoskonalili jego prawo stwierdzając, że wśród 10 badanych języków to, co człowiek mówi jest ważniejszym czynnikiem wpływającym na długość słowa od tego, jak często dane słowo wypowiada.
W czasie swoich badań uczeni chcieli porównać teorię Zipfa z własnym pomysłem, zgodnie z którym na długość słowa wpływa średnia ilość informacji, którą wnosi ona do wypowiedzi. Aby to sprawdzić użyli internetu i sprawdzili wszelkie możliwe kombinacje dwóch, trzech i czterech wyrazów występujących obok siebie. Dzięki temu mogli dowiedzieć się, na ile przewidywalne jest pojawienie się danego wyrazu.
Na przykład w kontekście „Monday night...." wystąpienie słowa „football" jest bardzo prawdopodobne, a co za tym idzie, niesie ono ze sobą niewiele informacji. Ale na przykład w kontekście „I ate...", słowo, którego brakuje, jest całkowicie nieprzewidywalne, dlatego też niesie ze sobą dużo informacji - mówi Piantadosi. Naukowcy przypuszczali, że średnia ilość informacji zawarta w sekwencji dwu-, trzy- lub czterowyrazowej powinna częściowo wpływać na długość wyrazów, albo pod względem liczby liter albo sylab. Sekwencja wyrazów jest zakodowana w języku tak, by komunikacja była jak najbardziej efektywna. A to oznacza, że sekwencja ta, to efektywny kod związany ze znaczeniem, który można wykazać w badaniach statystycznych. Takie właśnie przypuszczenie wysunęliśmy - dodaje Piantadosi.
Jeśli przyjrzymy się słowu miłość, to w różnych językach oznacza ono to samo i ma podobną długość (love, amour, liebe, amor, karlek). Jednak, jak uważają uczeni z MIT-u, na to, jak często konkretne słowo jest używane, decyduje nie jego długość, a słowa występujące po i przed nim.
Uczeni zbadali swoją teorię na przykładzie czeskiego, holenderskiego, francuskiego, angielskiego, niemieckiego, hiszpańskiego, włoskiego, portugalskiego, rumuńskiego i szwedzkiego. Okazało się, że odstępstwa od ich teorii można zauważyć tylko w niemieckim. Byłem zdumiony, że efekt ten występuje w tak wielu językach. Sądziłem, że różnice w morfologii czy strukturze wyrazów, zaburzy ten efekt w różnych językach, ale tak się nie stało - dodaje Piantadosi.
Badania z MIT-u mogą też dostarczać dodatkowych wyjaśnień, dlaczego najczęściej używane słowa są krótkie. Są bowiem przewidywalne, niosą zatem niewiele informacji. Ponadto liczne z nich to wyrazy funkcjonalne - takie jak „with", „from" czy „over" - których zadaniem jest łączenie innych słów. Krótkie wyrazy zwykle łączą się w często występujące związki frazeologiczne, a zatem takie, które wnoszą niewiele danych.
Naukowcy z MIT-u odkryli też, że ludzie komunikują się w niemal optymalny sposób. Zasób słownictwa nie jest dowolny, w tym sensie, że nie używamy go w całkowicie swobodny sposób. Jest on dobrze ustrkturyzowany pod kątem komunikacji, niosąc ze sobą pewne ciągi wyrazów, których ludzie zwykle używają - dodaje Piantadosi.
Komentarze (6)
juen, 21 czerwca 2011, 10:16
lingwisa George -> lingwista George
romero, 21 czerwca 2011, 15:33
Dla nas europejczyków jest to pojęcie zupełnie abstrakcyjne skojarzenie, począwszy nawet od rozumienia słowa "football" jako piłka nożna, a nie jakieś amerykańskie rugby, i u nas soboty czy nawet środy lub czwartki są w większości mecze piłkarskie, więc było dla tłumacza pole do popisu, jak z amerykańskiego na nasze przełożyć. Niestety
Amerykański - Nasz, wynik: 1 : 0
Mariusz Błoński, 21 czerwca 2011, 16:38
Dzięki, poprawione.
Mariusz Błoński, 21 czerwca 2011, 19:13
Celowo nie spolszczałem przykładów, bo badania nie dotyczyły naszego języka, więc spolszczenie może być całkowicie nietrafione . Np. w j. polskim prototypem (czyli rodzajem wzorca) ptaka jest wróbel. W USA wzorcem jest drozd. Pytanie zatem, jak należałoby przetłumaczyć tytuł znanej książki: "Zabić drozda" (tak, jak przetłumaczono) czy "Zabić wróbla"?
romero, 21 czerwca 2011, 20:45
Tak, nikt nie twierdzi, że tłumaczenie jest łatwe, ale w takim momencie trzeba w nawiasie podać chyba wytłumaczenie idiomów, jeśli nie da się przełożyć na polski w sposób oczywisty.
Bardzo mi się podoba "Ojcze Nasz" w języku innuitów. Z oczywistych względów jest sformułowanie "ryby naszej powszedniej" bo po co tłumaczyć eskimosom co to jest chleb, jak i tak zrozumieli by pewnie opacznie.
ps. teraz przetłumaczyli by młodzieżowo: "zabić leszcza"
Tolo, 22 czerwca 2011, 17:46
No dobra tylko be i have też mi się raczej kojarzą z konstrukcją językową coś jak nasz czas przyszły np będę szedł. I tak dalej.
A teraz zmierzać będę do konkluzji. Jak dla mnie te badania są o kant d*py rozbić bo nie koniecznie musi chodzić o częstotliwość występowania. I jakoś zupełnie mnie nie dziwi ze rodzajników we francuskim un une des le la l' les czy niemieckim der die das ein eine ein sa krótkie. Jak dla mnie powstały jako krótkie i są używanie bo wymusza tego konstrukcja językowa a jakąś magiczna korelacja długości i częstotliwości użycia. A ze względu na ekonomie mowy to są nieoptymalne.