Biblioteca electronică a tehnologiilor informaționale

Motorul de căutare. Limbă de căutare a informațiilor

Deoarece un sistem automatizat este un instrument folosit de o persoană în căutare. și nu intelectual pentru căutarea de informații (soluții gata pentru sarcinile principalei activități), eficiența utilizării acesteia depinde de cât de bine cunoaște o persoană natura obiectelor și proprietățile instrumentului prin care lucrează cu aceste obiecte.







Să oferim definiții legate de acest concept.

Limba de recuperare a informațiilor, un limbaj artificial destinat exprimării conținutului documentelor și informațiilor, a solicitat descrierea faptelor pentru a asigura căutarea sistemelor automatizate de informare (AIS), incl. - sisteme automatizate de informare și bibliotecă (AIBS) [91]. În completarea prima definiție, definiția precizează că informațiile limbile de regăsire - limbile artificiale concepute pentru formarea de caracteristici speciale (indici, descriptori, tezaure, cuvinte cheie etc.) de obiecte (documente, fapte etc.) stocate în baza de date pentru a oferi o căutare cu un rezultat care este relevant pentru solicitarea utilizatorului. Acestea sunt formate pe baza unor reguli speciale, inclusiv sistemele de notare gramatical (alfabetul), și altele În prezent, limbajul natural nu pot fi încă utilizate pe deplin în acest scop, din cauza complexității reprezentării sale în formă de mașină, precum și ambiguitatea, formală;. Unii legături între cuvinte și altele asemenea.

Luați în considerare tipurile de IPY.

Pe lângă cuvinte cheie, diferitele clasificări utilizate în mod obișnuit sub formă de tabele de clasificare sunt utilizate pe scară largă.

Sistemele de clasificare sunt reflectate în tabelele de clasificare, subdivizate în cele universale și cele ramificate.

Rubrica prezintă un tabel de clasificare ierarhică care conține o listă completă de clase incluse în sistem și destinată sistematizării fondurilor de informare, a rețelelor și a publicațiilor, precum și a căutării în ele.







Pentru a desemna sistemul de clasificare a conceptelor individuale, acesta folosește indexarea unui set de simboluri și reguli speciale pentru utilizarea lor.

Termenul de indexare este una sau mai multe unități lexicale asociate (LE), prezentate în imaginea de căutare a documentului (AML) și emise conform regulilor unui anumit IPY. În clasificarea IPY, se exprimă cu ajutorul unui indice complet de clasificare, în indexul de pre-clasificare, sub forma unui set de subiecte [98].

Tezaurul este un fel de dicționar explicativ "convertit". Dacă în dicționarul explicativ obișnuit cuvântul este găsit prin cuvântul său, atunci în tezaur, în funcție de valoarea înscrisă într-un anume fel, se găsește un cuvânt sau mai multe cuvinte care exprimă valoarea căutată.

Termenul "tezaur" a fost folosit pentru prima dată în secolul al XIII-lea de B. Latini în cartea "Cartea de comori". Primele tezaure nu erau legate de nevoile activității de informare. În sistemele de bibliotecă și informare, dezvoltarea tezaurului este reală numai pentru industriile individuale. Glosarul din IS poate fi perceput ca fiind conținutul său semantic. Bibliotecile universale utilizează clasificările ierarhice disponibile sau titlurile subiecților [90].

Descriptor (. Din limba engleză «pentru a descrie» - pentru a descrie), unitatea dicționar IRL a exprimat un cuvânt, o expresie sau cod, inclusiv echivalente sau similare, în sensul cuvintelor cheie folosite pentru a coordona indexarea documentelor și (sau) cererile de informații; unitatea lexicală a tezaurului de recuperare a informațiilor (IPT), care se referă la un cuvânt sau o expresie normalizată aleasă dintr-o varietate de cuvinte cheie sinonime sau similare.

Un descriptor este un termen, notație sau altă serie de simboluri care se referă la subiectul unei opere [65]. Descriptorul, ca termen pentru descrierea lipsită de ambiguitate a conceptelor, a fost introdus în 1950 de către matematicianul american K. Mars. De asemenea, el a propus să compună dicționare descriptor speciale pentru controlul vocabularului.

Criteriile de alegere a unuia dintre termeni ca descriptor sunt completitudinea expresiei semnificației, scurta, claritatea și frecvența apariției termenului în textele documentelor și solicitărilor. Unitatea lexicală a IPT, care face parte din clasa de echivalență a acestui descriptor, pe care o înlocuiește atunci când indexează documente și interogări, se numește ascriptor (neddescriptor). În acest caz, dicționarul descriptor reprezintă o listă alfabetică a descriptorilor și a ascriptorilor [82].

Tezaurul de recuperare a informațiilor este un soi de tezaur, lexa limbajului descriptiv de regăsire a informațiilor sau dicționarul normativ de descriptori și cuvinte cheie cu relații paradigmatice fixe între aceste unități. Acesta este destinat indexării în coordonate a documentelor și a cererilor de informații. Într-o formă simplificată, IPT este o listă de termeni, sinonime și link-uri [90].







Articole similare

Trimiteți-le prietenilor: