Styl zdradzi autora

| Bezpieczenstwo IT
Garry Knight, CC-BY-SA

Lingwiści z Drexler University i George Mason University pokazali, że nawet 80% użytkowników podziemnych forów, na których spotykają się cyberprzestępcy, można zidentyfikować dzięki analizie stylu wypowiedzi. Użycie wyrazów funkcyjnych jest specyficzne dla każdego piszącego. Jeśli nawet jesteś autorem pracy doktorskiej, to zapewne używasz w niej wyrazów funkcyjnych w taki sam sposób, jak na forach i czatach - powiedziała Sadia Afroz podczas odbywającego się w Niemczech 29C3 Chaos Communication Congress.

Opracowana przez lingwistów technika może posłużyć do śledzenia konkretnych użytkowników na różnych forach i czatach, co w konsekwencji może doprowadzić do ujawnienia ich tożsamości. Pozwala ona też na porównanie wypowiedzi z internetu np. z pracami naukowymi, przez co umożliwia zidentyfikowanie uczonych angażujących się w nielegalną działalność. Lingwistyczne narzędzia można wykorzystać również do identyfikacji właścicieli botnetów czy twórców szkodliwego oprogramowania.

Wspomniana technika ma jednak poważne ograniczenie. Analizę można przeprowadzić tylko w przypadku osób, które w swoich wpisach użyły co najmniej 5000 wyrazów (narzędzia, które zaprezentowano przyjmują za dolną granicę 6500 wyrazów). Niewiele osób jest aż tak aktywnych na podziemnych forach. Ponadto, aby dokonać wstępnej analizy stylu wypowiedzi, narzędzia muszą otrzymać teksty podzielone wcześniej ze względu na tematykę. Wypowiedzi dotyczące np. technik włamań czy handlu ukradzionymi numerami kart płatniczych muszą być oddzielone od zwykłych wypowiedzi na codzienne tematy. Taki podział ułatwia maszynie uczenie się.

Obecnie najskuteczniejsza analiza jest przeprowadzana w języku angielskim. To tam można uzyskać 80% pewność identyfikacji. W innych językach uzyskano 66-procentową pewność. Można jednak wykorzystać automatyczne translatory.

Naukowcy sądzą, że w miarę udoskonalania narzędzia, identyfikacja będzie łatwiejsza i bardziej pewna.

Twórcy lingwistycznych narzędzi analitycznych podkreślają, że nie powstały one po to, by kogokolwiek łapać, a by pokazać, iż tego typu analiza jest możliwa. Dlatego też, mimo zainteresowania ich pracą ze strony rządów i organów ścigania, udostępnili dwa narzędzia, która pomagają w zmianie stylu pisania. Jedno z nich to Anonymouth, które na podstawie 500-wyrazowej próbki pokaże użytkownikowi cechy charakterystyczne dla jego stylu wypowiedzi, a drugie - JStylo - to silnik (engine), który wspomaga Anonymouth w nauce stylu użytkownika.

wypowiedź styl wyrazy funkcyjne analiza lingwistyczna anonimowość