Oamenii tind să creadă că suntem ființe imprevizibile, guvernate într-o anumită măsură de liberul arbitru, apărut cumva din procese fizice. Ei bine, iată ceva ciudat care să vă provoace o criză existențială bazată pe lingvistică: aproape toate limbile par să urmeze o ecuație cunoscută sub numele de legea lui Zipf, iar motivul rămâne un mister.
Cuvintele sunt folosite cu frecvențe variabile, așa cum v-ați aștepta. Avem mai multă nevoie de cuvântul „și” decât de „hermeneutică”. Însă analizând frecvența folosirii cuvintelor în texte mari, se observă că aproape toate limbile urmează o anumită lege statistică.
„Acum aproximativ 80 de ani, George Kingsley Zipf a raportat o observație conform căreia frecvența unui cuvânt pare să fie o funcție de tip lege a puterii în raport cu rangul său de frecvență, formulată ca f(r) ∝ 𝑟^𝛼, unde f reprezintă frecvența cuvântului, r este rangul frecvenței, iar 𝛼 este exponentul”, explică un studiu pe această temă.
Pe scurt, cel mai frecvent utilizat cuvânt dintr-o limbă, cum ar fi „și” în limba română sau „the” în limba engleză, este folosit de două ori mai des decât următorul cel mai frecvent cuvânt, de trei ori mai des decât al treilea și de patru ori mai des decât al patrulea, urmând această lege a puterii pentru o perioadă surprinzător de lungă.
Ați putea crede că este o particularitate a câtorva limbi, dar nu este așa. Legea lui Zipf pare să li se aplice aproape tuturor limbilor studiate. Fie că vorbești engleză, hindi, franceză, mandarină sau spaniolă, frecvența unui cuvânt scade proporțional cu rangul său de popularitate. Și mai ciudat este că această lege li se aplică chiar și limbilor pe care nu le-am descifrat încă. Până și cuvintele din misteriosul Manuscris al lui Voynich par să urmeze această lege.
Textele individuale, dacă sunt suficient de mari, respectă și ele aproximativ aceste reguli, cuvântul cel mai frecvent apărând de două ori mai des decât următorul, și tot așa. Nici măcar Darwin nu scapă de această regulă: o analiză a textului său „Originea speciilor” arată că se conformează destul de bine legii lui Zipf.
„Este demn de reflectat asupra particularității acestei legi. Este cu siguranță o proprietate neobișnuită a limbajului uman faptul că frecvența cuvintelor variază; ar fi fost rezonabil să ne așteptăm ca toate cuvintele să aibă frecvențe aproximativ egale. Dar, având în vedere că frecvențele variază, este neclar de ce ar urma o regulă matematică atât de precisă, una care nu are legătură cu semnificația cuvintelor”, se menționează într-un articol de sinteză.
Există multe explicații posibile, de la probleme statistice la constrângeri impuse de memoria și vocabularul uman. George Zipf însuși a propus că legea rezultă dintr-un echilibru între minimizarea efortului de către vorbitori, aceștia încercând să-și reducă efortul folosind cuvinte mai frecvente, și ascultătorii care caută claritate, pe care nu o dau cuvintele mai puțin utilizate.
O altă idee este că, pe măsură ce limbajul se răspândește și evoluează, cuvintele comune tind să devină tot mai populare, ceea ce duce la un fel de efect de bulgăre de zăpadă. Cu toate acestea, niciuna dintre aceste explicații nu este pe deplin acceptată, iar cauza rămâne un mister.
Dacă vreți cu adevărat să vă provocați o criză existențială bazată pe lingvistică, puteți introduce un text lung, un roman sau o lucrare proprie într-un calculator de distribuție și să vedeți dacă respectă legea lui Zipf. S-ar putea să nu vă placă cât de predictibil este limbajul, dar nu vă faceți griji: până și „Hamlet” al lui Shakespeare respectă această regulă, subliniază IFL Science.
Bette Graham, inventatoarea corectorului lichid de hârtie
O pictură celebră a lui Van Gogh respectă surprinzător de bine legile fizicii
Cum a ajuns Ion Creangă scriitor după ce a fost răspopit şi nevasta l-a părăsit pentru un călugăr