Rezumat pe tema căutării de informații pe Internet

Căutarea în rețelele de calculatoare devine o artă și necesită o cunoaștere foarte precisă pe care trebuie să o stăpânească o persoană modernă. Am ales acest subiect al eseului, deoarece cred că una dintre componentele muncii grafice pe Internet este abilitatea de a lucra într-o rețea globală. Și pentru a nu vă scufunda în toată abundența de informații, trebuie să învățați nu numai să o căutați, ci și să o găsiți.







Înainte de a începe căutarea trebuie să indicați în mod clar problema. Până la formularea sarcinii cu privire la succes și optimizarea căutării, nu poate fi nicio problemă. Cantitatea de informații de pe Internet este prea mare, și cum nicăieri nu se spune "Timpul este banii". Prin urmare, aici este imposibil să căutați pe un principiu "Du-te acolo, nu știu unde. Luați asta, nu știu ce. " În caz contrar, rezultatul va fi deplorabil.

Este probabil imposibil să oferiți o rețetă generală pentru o strategie eficientă de căutare a informațiilor pe internet. Există doar câteva principii care vă permit să petreceți mai puțin timp. Iată câteva dintre ele. De exemplu, trebuie să știți unde locuiește lene threelegged, este puțin probabil că va merge în catalogul alfabetic al bibliotecii. Poate veți găsi literatura de care aveți nevoie cu un catalog sistematic. Cu o probabilitate puțin mai mare - cu ajutorul subiectului. Dar, cel mai probabil, nici unul din cataloagele bibliotecii nu vă va ajuta. Dar merg la informații bibliografice și o bibliotecă mare de departament la bibliografie datoria bibliograf ar ajunge pe un animal sau o broșură similară din care și va găsi răspunsul la întrebarea ta. O astfel de strategie poate fi aplicată cu succes pe Internet. În rețelele IPS (rețele de regăsire a informațiilor) cu scop general, vă puteți îneca în mii de linkuri emise pentru dvs. pentru o interogare simplă. Scopul utilizării unui IPS cu scop general este de a căuta un IPS specializat dedicat subiectului dvs. de căutare. O astfel de IPS poate fi recunoscută prin prezența cuvintelor "informație", "document" etc. Dar, de multe ori specializate IRS ar putea ascunde pe serverul publicului, organizația profesională sau de specialitate, editori.

Al treilea element al strategiei: utilizați mai multe IPS. Dacă căutați cu regularitate informații despre un anumit subiect, marcați IRS. care sunt cele mai eficiente pentru dvs.


Prin principiul de organizare și utilizare a instrumentului de căutare pot fi împărțite în directoare (directoare, directoare) și motoare de căutare.

Internetul găzduiește noduri și alte directoare, dotate cu motoare de căutare, similare motoarelor de căutare Yahoo

Mai jos sunt câteva directoare de căutare:

  • Excite (www.excite.com);
  • Brahma (www.brama.com);
  • În fiecare zi (www.everyday.com.ua);
  • UP.RU (www.up.ru);
  • Elvisti (www.el.visti.net);
  • @Rus (www.atrus.ru);
  • List.ru (www.list.ru);
  • Weblist (www.weblist.ru);
  • Constellation (www.stars.ru);
  • Melcul (www.ulitka.ru);
  • Ivan Susanin (www.susanin.ru);
  • MavicaNet (www.mavikanet.ru).

Principalul dezavantaj al directoarelor de căutare a resurselor web este că motoarele lor de căutare recuperează un număr imens de documente care nu se potrivesc cu intrarea. De regulă, documentele care se află la sfârșitul listei conțin puține informații utile. Cuvintele cheie pot fi interpretate de sistemul de căutare într-un context complet diferit sau pot satisface câteva interpretări.

La primirea unei solicitări de la utilizator, motorul de căutare ia în considerare toate informațiile indexate și oferă o listă de documente corespunzătoare sarcinii de căutare. Documentele găsite sunt clasificate în funcție de localizarea cuvintelor cheie (în titlu, de la începutul textului, în primele paragrafe) și de frecvența apariției acestora în text.

În ciuda principiului similar al muncii, motoarele de căutare diferă în limbile de interogare, zonele de căutare, adâncimea de căutare în document, metodele de clasificare și prioritățile, astfel încât utilizarea diferitelor motoare de căutare oferă rezultate diferite.

În prezent, o mulțime de motoare de căutare operează în resurse interne. Există site-uri de marcă și chiar individuale care includ unele sau alte motoare de căutare. Elementele de căutare există pe aproape toate ziarele Internet și portalurile educaționale.

Cele mai frecvente dintre motoarele de căutare sunt următoarele:

  • Yandex (www.yandex.ru);
  • Aport (www.aport.ru);
  • META (www.meta-ukraine.com);
  • Rambler (www.rambler.ru);
  • UANET (www.uanet.com.ua);
  • EIVisti (www.el.visti.net);
  • CĂUTARE (www.search.kiev.ua);
  • Pathfinder (www.pups.kiev.ua);
  • Tela-căutare (www.tela.dux.ru);
  • Openweb (www.openweb.ru);
  • AU (www.au.ru).

Cu toate acestea, există posibilitatea de a interzice programabil înregistrarea întregului site sau a elementelor sale individuale, atât de către toate, cât și de anumite motoare de căutare. Pentru astfel de scopuri, există așa-numitele metaetichete sau meta-determinanți. Totuși, aceasta este o conversație separată, de către cine și în ce scop se face această interdicție.


O interogare de căutare poate consta într-unul sau mai multe cuvinte, pot exista semne de punctuație diferite. Cele mai simple interogări pot fi făcute fără a intra în subtilitățile limbii de interogare. Deci, dacă introduceți câteva cuvinte fără semne de punctuație și operatori logici în șirul de căutare, vor fi găsite documente care conțin toate aceste cuvinte și chiar dacă acestea se află la o distanță strict limitată unele de altele. O astfel de căutare cu o probabilitate destul de ridicată va avea ca rezultat un rezultat negativ. Și aici, despre conceptul de succes, nu poate fi nicio îndoială. Cunoașterea și aplicarea corectă a limbajului motorului de căutare vor contribui la rapiditatea și eficiența căutării.

În ceea ce privește registrul, în cazul general, valoarea nu înregistrează pentru a scrie cuvinte de căutare și operatori, adică, cuvântul „abstract“, „Abstract“, Abstracts, „REZUMAT“ și „Abstracts“ - toate vor fi percepute în mod egal. Acest lucru este valabil în întregime de alfabetul latin. Deci, „Yas“ și „da“, și chiar „da“, „da“ și „DA“ pentru a căuta toate acestea uniforme. Și uneori, pentru a îmbunătăți calitatea căutării, este luat în considerare registrul de interogări de căutare. În cazul în care cererea este dată cuvântul cu o majusculă, acesta va fi găsit doar cuvinte în această scriere, și dacă un pic - ambele opțiuni. În cazul în care cererea este alcătuită din două, trei sau patru cuvinte, fiecare dintre acestea fiind scrise cu majusculă, se presupune a căuta după numele lor proprii, cât și pentru schimbarea automată limitarea distanței dintre cuvintele de interogare din valoarea implicită la valoarea de (n-1) * 2, în cazul în care n este numărul de cuvinte din interogare. Acesta vă permite să găsiți un grup de cuvinte de interogare, în care nu există mai mult de un cuvinte „de prisos“ sau semne de punctuație, de exemplu: „Lermontov“, „Baden-Baden“, „Charles de Gaulle“, „Fiodor Dostoievski“, etc. .







Motoarele de căutare moderne folosesc operatorii pentru a căuta în rețele de calculatoare. Sub operator se înțelege instrucțiunea de căutare. Din acest motiv, o interogare care include mai multe cuvinte poate conține operatori. Căutarea anumitor operatori nu este efectuată în document. Acestea servesc doar ca un ghid al motorului de căutare. Din acest motiv, ei au propriul lor ortografie și sintaxă. Să le analizăm mai detaliat.

Fiecare dintre operatori are denumirea abreviată, corespondența acestora fiind prezentată în tabel.

În limbajul de interogare, de obicei, o pictogramă de operator indică acțiunea sa într-un paragraf și două într-un rând - în întregul text.

Între paranteze. Atunci când construim interogări, uneori devine necesar să combinăm cuvintele de interogare în grupuri care sunt argumente ale unui operator. Astfel de grupuri sunt închise în paranteze. De regulă, în majoritatea motoarelor de căutare sunt utilizate numai paranteze ale formularului (). O parte a interogării, cuprinsă în paranteze, este ea însăși o solicitare și toate regulile limbajului de interogare sunt distribuite acesteia. Utilizarea parantezelor vă permite să creați interogări imbricate și să le transmiteți operatorilor ca argumente și, de asemenea, să înlocuiți prioritățile declarațiilor acceptate în mod implicit.

Citate. Pentru a căuta ghilimele, puteți utiliza cotații standard (dublu), de tipul "sau". Cuvintele interogării anexate în ghilimele duble sunt căutate în documentele exact în formă și în ordinea în care au fost specificate în interogare. Aceasta este o modalitate foarte eficientă de căutare. Aplicarea sa asigură o rată de succes de peste 60%. Este important să se ia în considerare numai două puncte. Mai întâi, citarea ar trebui să fie exactă, adică fără a schimba după caz, număr și persoană, în al doilea rând, materialul pe care îl căutați ar trebui cel puțin să fie pe Internet. Dacă se face o eroare gramaticală cu această formă de căutare, căutarea va avea ca rezultat un rezultat negativ.

Astfel, pot fi folosite citate duble și pur și simplu pentru a căuta cuvinte într-o formă dată (în mod implicit, cuvintele sunt în toate formele). De exemplu, interogarea: satisface documentul care conține textul ". Trenul a ajuns să transporte pasageri. "și nu îndeplinesc documentele: c '. Trenul se apropia de platforma de aterizare a pasagerilor. "sau" ... trenul a fost servit pentru a transporta pasageri ... ", etc.

Metacaracterele sau măștile. Nu toate motoarele de căutare pot susține căutarea unor șiruri de caractere utilizând metacaracterele ('*', '?'), Care sunt folosite de obicei în sensul "oricăror substring" și "un singur caracter arbitrar". Cu toate acestea, acești operatori sunt adesea rezervate pentru utilizarea similară în viitor.

Să luăm în considerare un exemplu concret. Să deschidem în browser pagina de start a serverului de căutare Yandex. În caseta de căutare, introducem cuvintele cheie, cum ar fi „computer manuale de știință teste pe CD-ROM-ul“ sau „informatikauchebnikitestyCD-ROM». Ca urmare a căutării, au fost găsite 202 de pagini care conțin această solicitare și cel puțin 81 de site-uri web. Statistici de căutare este disponibil cu un număr de site-uri, fiecare conținând cuvinte cheie: Informatica - 55813, manuale - 189 860 - 498 394 teste, CD-ul - 348 167? ROM - 34315.

Acum, în câmpul de căutare, introduceți următoarele: "informatică | manuale | teste | CD-ROM-uri" utilizând operatorul OR. Prin urmare, 48518876 pagini vor fi găsite pentru această interogare, cel puțin 22970 site-uri, în directorul site-ului 962.

Utilizând operatorul NOT, introduceți următoarea expresie în câmpul de căutare: "Informatică

manuale CD-ROM teste »/ Ca urmare, 3695907 pagini vor fi găsite și nu mai puțin de 4056 site-uri care vor conține cuvântul cheie" informatică "cu excepția cuvintelor din cerere după pictograma"

Yndex vă permite de asemenea să utilizați expresii logice întregi în loc de cuvinte și trebuie să fie închise în paranteze. Folosind exemplul nostru, introducem următoarea expresie în câmpul de căutare: (manualele de informatică) testează CD-ROM-ul. În urma căutării, vor fi găsite 3564 de pagini și cel puțin 701 site-uri care conțin un astfel de grup de cuvinte (manuale de științe informatice).

Acum găsiți fraza, pentru aceasta introducem următoarea expresie în câmpul de căutare: "îngheț și soare, o zi minunată". Ca urmare a acestei căutări, vor fi găsite 14195 de pagini și cel puțin 756 site-uri.

Când căutați informații pe Internet, este foarte important să țineți cont de morfologia limbajului de interogare. Pentru fiecare cuvânt al interogării, căutarea se realizează ținând cont de regulile de modificare a limbii respective. Motorul de căutare "înțelege" și "distinge" cuvintele din limba rusă și engleză - implicit. Căutarea este efectuată ținând cont de schimbarea în declenare, conjugare, număr și persoană, adică pentru toate formele cuvântului; inclusiv chiar coincide în sens. De exemplu, când căutați un cuvânt, aparatul va găsi și documente conținând cuvintele "despre mașină", ​​"promashinu", "mașină" etc. dar, cel mai important, chiar și cuvintele "mașini", "mașini", "mașini" vor corespunde cererii. Pentru a căuta o singură formă strict definită a unui cuvânt, trebuie să o luați în citate dublă sau să utilizați semnul "!".

De asemenea, există câteva cuvinte și simboluri care sunt excluse în mod implicit din interogare, datorită conținutului lor redus de informații. Acestea sunt cele mai frecvente cuvinte în limba rusă și engleză, de exemplu, preposiții, particule și articole. Foarte des, apostrofele și liniuțele sunt omise. Majoritatea motoarelor de căutare le cunosc și le eliberați de interogarea pe care ați formulat-o. Acest lucru se datorează faptului că prezența acestor cuvinte poate încetini în mod semnificativ căutarea și poate afecta negativ rezultatele și exhaustivitatea acestuia și, în cele din urmă, succesul. În același timp, există o oportunitate de a indica necesitatea acestor cuvinte în interogare. Pentru a face acest lucru, ar trebui să faceți o interogare în citate dublă sau prin căutarea expresiei exacte în căutarea avansată.

Există, de asemenea, o căutare folosind restricția de distanță. De exemplu, dacă o interogare este compusă din mai multe cuvinte fără utilizarea operatorilor și a construcțiilor de limbaj de interogare, aparatul va încerca să găsească documente în care se întâlnesc toate cuvintele de interogare. În acest caz, pentru fiecare cerere, așa-numita constrângere de context - un număr pozitiv este întotdeauna introdus. Distanța implicită este de 40 de cuvinte. Documentul în care s-au îndeplinit toate cuvintele interogării va fi emis numai dacă distanța dintre cuvintele cererii este mai mică decât acest număr. În motoarele de căutare este posibil să se precizeze ordinea și distanța dintre cuvinte. Distanta dintre cuvintele A si B este: 1 (B urmeaza imediat dupa A), 2 (B urmareste A printr-un singur cuvant), etc. Sau -1 (B depaseste A), -2 ... Semnul "/" intre în cuvinte, urmată de un număr, înseamnă că distanța dintre ele nu trebuie să depășească acest număr de cuvinte.

De exemplu, trebuie să găsim documente care conțin cuvintele "informatică" și "manuale", iar distanța dintre acestea nu trebuie să depășească 2 cuvinte. Pentru a face acest lucru, introduceți următoarea expresie în câmpul de căutare: "Informatică / 2Tutoriale". Ca urmare, la cererea noastră, obținem 9 pagini și cel puțin 5 site-uri

Dacă ne schimbăm ancheta cu câteva manuale informatice / (+ 1 + 4) - atunci vom primi documente în care aceste cuvinte cheie vor merge unul după altul în această ordine la o distanță de 1 până la 4 cuvinte.

De foarte multe ori trebuie să căutați deja în informațiile găsite, adică Puteți căuta după documentele găsite în interogarea anterioară. Pentru a face acest lucru, la sfârșitul interogării, trebuie să puneți "$$" sau pur și simplu să faceți o notă în căsuța "căutați în găsită" aflată pe pagina de interogare. Această funcție este foarte convenabilă pentru îngustarea secvențială a căutării.

Limba motorului de căutare Yandex are cel mai complet set de capabilități în căutarea în limba rusă, prin urmare, după ce l-ați stăpânit, navigați cu ușurință în limba de interogare a oricărui alt instrument de căutare.

În concluzie, aș dori să definim un algoritm de căutare de bază.

O persoană modernă trebuie să poată căuta pe Internet pentru a "nu îneca" într-o multitudine de informații.

Realizat de uCoz







Articole similare

Trimiteți-le prietenilor: