Dicționarul de frecvență al limbii ruse

A doua versiune a listei de frecvențe

Pe această pagină puteți obține listele cu cele mai frecvente cuvinte ale limbii ruse. Până acum, dicționarul de frecvență al limbii ruse, ed. LN Zasorina (1977) a fost cel mai adesea folosit ca sursă de informații despre frecvența cuvintelor rusești. Cu toate acestea, corpul, pe baza căruia a fost calculată frecvența cuvintelor din acest dicționar, este foarte mică conform standardelor moderne (aproximativ un milion de cuvinte). În plus, lista este în mod substanțial depășită: corespunde frecvenței utilizării cuvintelor în perioada anilor 20 și 60. Drept urmare, corpul cuprinde un număr mare de surse ideologice, de exemplu, lucrările lui Lenin și Kalinin, Materiale ale Congreselor 22 și 23 ale CPSU, ziare sovietice. Cuvintele sovietice și tovarăși intră în primele sute de cuvinte rusești, împreună cu cuvintele oficiale (se întâmplă mai des decât cuvintele în care, aici, ale voastră), cuvintele partid, revoluție, comunist se regăsesc mai des decât înapoi, mai bine, etc. În cele din urmă, lista de cuvinte din dicționarul Zasorina nu există în formă electronică.







O listă de cuvinte disponibile de pe această pagină conține aproximativ 35.000 de cuvinte cu o frecvență mai mare de 1 ipm (apariții pe milion de cuvinte, cazuri pe milion de cuvinte). Există, de asemenea, o listă mai scurtă cu cele mai frecvente 5 000 de cuvinte rusești. Listele utilizează codificarea chirilică Windows-1251 și sunt ambalate cu utilitarul WinZip (utilizatorii Linux sau Mac pot folosi StuffIt pentru despachetare).







Structura listelor corespunde formatului listelor lemmatizate de la British National Corpus (BNC). creat de Adam Kilgarif, și anume:
număr de ordine, frecvență (ipm), lemă, parte din vorbire (clasificarea BNC).

Cuvinte cu o frecvență mai mare de 1 ipm

  • lemma.al.zip - lemmas sortate în ordine alfabetică
  • lemma.num.zip - lemmele sortate după frecvență
  • words.num.zip - formulare de cuvinte sortate după frecvență

Lista celor 5000 de cuvinte cele mai frecvente

Unele statistici privind utilizarea cuvintelor rusești

Mai multe informații complete despre corespondența dintre frecvența cuvântului și acoperirea cazului sunt aici.

Există, de asemenea, liste de frecvențe separate pentru următoarele clase de cuvinte:

  1. frecvența lemmei corespunzătoare (luați, stați, supuneți ca un substantiv este extrem de puțin probabil, deci în aceste cazuri se alege verbul);
  2. Forma frecvență comparativă specifică (atât Ierna pentru oțel frecvență suficientă, dar în contrast cu verbul substantiv este adesea folosit în această formă, au timp pentru a forma un număr predicativă utilizat, în timp ce substantivul apare în toate celelalte forme ale sale).

Ca un dicționar Zasorin numele, prenumele și patronimicul au fost filtrate liste de frecvență lemmatizirovannyh, dar numele de locuri din stânga, deoarece este dificil de justificat de ce în dicționar Zasorin a părăsit Moscova sau american. dar nu și la Moscova și America. Lista de frecvență de forme de cuvinte nu a fost filtrat.







Articole similare

Trimiteți-le prietenilor: