Utilizarea cuvintelor cheie și a unui rubricator în indexarea documentelor

Utilizarea cuvintelor cheie și rubricatorului GASNTI în indexarea documentelor
(Din experiența departamentului de prelucrare științifică a documentelor)

Turinge Lyudmila Alexandrovna,






Head. departamentul de prelucrare
Biblioteca științifică
Universitatea de Stat din Kemerovo

Conform GOST 7.74-96, cuvântul cheie este un cuvânt informativ, dat în forma lexicografică standard și utilizat pentru indexarea coordonatelor. Coordonarea indexării este o indexare care implică o expresie multidimensională a conținutului semantic principal al unui document sau a conținutului semantic al unei interogări de informații printr-un set de cuvinte cheie. Setul de cuvinte cheie este imaginea de căutare a documentului (AML). Avantajul metodei de indexare a coordonatelor se manifestă atunci când este necesar să se caute informații despre un anumit subiect într-o manieră cu mai multe fațete. În același timp, cele mai importante criterii pentru o muncă optimă sunt caracterul complet al emiterii documentelor și relevanța acestora pentru solicitare.

Cuvintele și expresiile pentru înscrierea subiectului sunt compilate în conformitate cu anumite reguli. Cuvintele cheie sunt cele mai semnificative cuvinte din text. Acestea sunt:
- majoritatea substantivelor;
- substantive cu adjective;






- personalități;
- nume propriu;
- nume geografice;
- abreviere;
- cifre;
- sunt introduse sinonimele;
- se aplică forma plurală;
- caz nominativ;
- tipul de publicație;
- termeni care identifică procesele și activitățile;
- Conceptele care numesc ramura cunoașterii;
- Nu introduceți fraza împreună cu uniunea "și".

GASNTI este unul dintre IPA-urile la nivel de sistem. Rubricatorul este în comun cu UDC, BBK și alte IPP-uri și nu le anulează, ci este folosit simultan cu acestea. GASNTI este proiectat pentru sistemele STI automatizate. Se distinge prin adâncimea mică a ierarhiei (trei nivele), o mobilitate suficient de mare, vizibilitatea schemei de clasificare și capacitatea de a face schimbări rapide. Forța sa semantică este mult mai mică decât cea a altor IEI-uri. Volumul colecției include 6118 titluri.

Utilizare practică rubricator a identificat o serie de constrângeri care decurg din particularitățile structurii și scopul IRL: acesta este conceput pentru a reflecta cele mai importante aspecte ale documentelor și interogările și oferă împărțirea întregului flux de la blocuri mari, dar nu au mijloace suficiente pentru a reflecta documentele detaliate. Limbajul descrierii tematice Rubricatorul este un instrument de clasificare, complementar altor clasificări. Nu înlocuiește IPN tip descriptor, iar aplicarea lor comună are un efect semnificativ în căutarea automată a informațiilor.

Eforturile specialiștilor în indexarea profundă, completă și precisă vor fi plătite ca urmare a recunoștinței cititorilor.
Cum poate fi organizată căutarea în CE în cazul în care cititorul consideră dificil să formuleze cuvântul? Trebuie să existe un dialog între cititori și CE, de preferință în modul "întrebare-răspuns". Dacă există programe mai avansate, atunci este posibil să se dezvolte o căutare de dialog.







Trimiteți-le prietenilor: