Notiunea webmasterului

Indexarea unui site de către roboți de căutare

În primul rând, trebuie să spun că atunci când motorul de căutare a primit solicitarea utilizatorului, acesta nu începe să ocolească întregul Internet în căutarea paginilor necesare, ci se referă la baze de date pre-asamblate - indexuri de pagină. Indicii sunt. (este necesar să găsiți o descriere). Pentru a genera și actualiza indexul de pagini, motorul de căutare lansează periodic un program special (numit păianjen sau bot). Acest program accesează cu crawlere site-urile de Internet și, pe baza rezultatelor acestui crawl, face sau actualizează indexul.







Ce se întâmplă când un utilizator accesează motorul de căutare cu o interogare?

Motorul de căutare se referă la indexul care compilează o listă de pagini care corespund cel mai bine interogării utilizatorului, acestea fiind numite "interogare relevantă". Decideți dacă o pagină din numărul total de pagini incluse în index corespunde interogării utilizatorului, motorul de căutare ar trebui să se bazeze numai pe interogarea care a fost emisă. O interogare constă dintr-unul sau mai multe cuvinte. Prin urmare, pagina va fi considerată mai relevantă dacă conține cât mai multe întâlniri de cuvinte din interogare. Și pentru clasarea paginilor din SERP, motoarele de căutare, pe lângă textul paginii în sine, au folosit cuvintele enumerate în etichete , <Description>, <Keywords>. Webmasterii și optimizatorii au învățat rapid să sporească relevanța paginilor lor "în ochii" motoarelor de căutare pentru anumite interogări, crescând numărul de apariții de cuvinte cheie în textul paginii și în etichetele specificate. Relevanța emiterii a scăzut.</p> <p>Apoi (sau chiar mai devreme, dar acest moment din punctul de vedere al acestei note este neimportant), motoarele de căutare, pe lângă numărul de apariții ale cuvintelor cheie din interogare, au început să utilizeze criterii suplimentare atunci când evaluează relevanța paginii. Unul dintre aceste criterii este greutatea sau semnificația paginii. Pagina de mai sus este localizată în ieșirea motorului de căutare, cu atât mai multă greutate atribuită de motorul de căutare dat. Ideea de a calcula semnificația paginilor sau site-urilor este împrumutată din practica publicațiilor științifice.</p> <p>În Internet, ideea de a calcula indicii de citare este întruchipată în utilizarea greutăților unor pagini sau site-uri individuale. Diferitele motoare de căutare utilizează metode diferite pentru calcularea greutății paginilor. Indicele cel mai cunoscut al motorului de căutare Google PR și indexul subiectului citând motorul de căutare Yandex. În același timp, Yandex se concentrează asupra importanței sitului în ansamblu, astfel încât indicele de citare (TCI) este calculat pentru site-uri. Iar Google calculează indexul PR pentru fiecare pagină separată a site-ului.</p> <p>Să vorbim despre acești doi indici mai detaliat.</p> <h3>Ce este Page Rank?</h3> Pentru mai multe informații despre algoritmul de calcul al indexului PR, consultați articolul <ul> <li>Chris Ridings, traducere de A. Sadovsky, "Interpretată PageRank, sau tot ceea ce ați dorit întotdeauna să știți despre PageRank"</li> </ul> <h3>Indexul de citare (TCI) al motorului de căutare Yandex</h3> <p>Deoarece TCI nu ia în considerare decât ponderea resurselor externe de Internet care se referă la cele specificate, TCI nu poate fi mărită fie prin link-uri "interne" (de la o pagină a resursei la altele), fie prin plasarea mai multor linkuri pe una sau mai multe pagini ale aceluiași aceeași resursă "externă". La calculul TIC al uneia dintre secțiunile site-ului (directoare), legăturile către o secțiune a site-ului din alte secțiuni ale acestui site vor fi considerate interne și, prin urmare, nu vor crește TCI. În acest caz, legăturile la fiecare dintre secțiunile site-ului sunt luate în considerare (combinate) la calcularea TIC a întregului site.</p><br> <br> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-8686842323494376" data-ad-slot="9763162049" data-ad-format="auto"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> <br> <br> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-8686842323494376" data-ad-slot="2447347631" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> <br> <br><p>Când se măsoară tIC, legăturile se iau numai din acele resurse pe care Yandex le indexează și pentru care se uită. Atunci când se calculează site-ul TIC, nu sunt luate în considerare legături de la panouri web, forumuri, conferințe de rețea, directoare nemodificate și alte resurse la care oricine poate adăuga linkuri fără control de la proprietarul resursei. De asemenea, atunci când se calculează TIC, legăturile de la site-uri situate pe serviciile de gazduire gratuită nu sunt luate în considerare dacă nu sunt descrise în catalogul Yandex. Cu alte cuvinte, toate aceste legături au greutate zero pentru Yandex.</p> <p>Valoarea tIC este calculată pentru toate resursele la care se face referire cel puțin o dată de oricare dintre resursele scanate de Yandex. Pentru a afla resursele TCI, puteți utiliza serviciile disponibile pe web pentru webmasteri, de exemplu, pe site-ul Web. Pentru site-urile descrise în indexul de citare Yandex.Catalog este afișat lângă descrierea resursei:</p> <h3>Excludeți paginile de indexare utilizând un fișier robots.txt</h3> <p>Nu toate paginile site-ului au sens pentru a da indexării motoarelor de căutare. De exemplu, nu este necesar să indexați scripturile CGI sau ISAPI, precum și fișierele statistice sau listele de fișiere în directoare. Refuzul de a indexa un număr de pagini poate fi cauzat de considerente de secret sau de dorința de a nu indexa aceleași documente în diferite codificări. Cu cât este mai mic site-ul dvs., cu atât mai rapid robotul îl va ocoli. Prin urmare, atunci când creați un site, este logic să vă gândiți să împiedicați roboții de căutare să indexeze toate documentele care nu au sens la indexare. Puteți face acest lucru utilizând un fișier robots.txt localizat în directorul rădăcină al site-ului.</p> <p>O descriere detaliată a caietului de sarcini poate fi găsită în documentul "Standard de excepții pentru roboți". În forma sa cea mai simplă (toate cu excepția dosarului de script), fișierul robots.txt arată astfel:</p> <p>Șirul cu câmpul User-Agent este obligatoriu și trebuie să precede liniile cu câmpul Disallow.</p> <p>Liniile goale din fișierul robots.txt sunt semnificative, separând intrările referitoare la roboți diferiți. De exemplu, în următoarea secțiune a fișierului robots.txt, linia Disallow: / forum este ignorată, deoarece nu există o linie cu câmpul utilizator-Agent înainte de aceasta.</p> <p>Un rând cu un câmp Disallow poate împiedica indexarea documentelor cu un singur prefix. Pentru a interzice mai multe prefixe, trebuie să scrieți mai multe rânduri. De exemplu, pentru a împiedica indexarea documentelor începând cu / cgi-bin și / forum, trebuie să scrieți.</p> <p>Și fragmentul următor va fi incorect</p> <p>În liniile cu câmpul Disallow nu sunt scrise prefixele absolute, dar relative. Adică fișierul:</p> <p>interzice indexarea documentelor începând cu simbolul "*" (care nu există în natură), dar fișierul:</p> <p>împiedică indexarea întregului site.</p> <p>Dacă nu puteți crea / modifica un fișier robots.txt, trebuie doar să adăugați o etichetă suplimentară <МЕТА> în codul HTML al paginii dvs. (în interiorul etichetei <HEAD>):</p> <p>Apoi, acest document nu va fi indexat. De asemenea, puteți utiliza eticheta</p> <p>Pentru a împiedica indexarea anumitor fragmente de text într-un document, marcați-le cu etichete <NOINDEX> </NOINDEX> Acum că toate anteturile corespund conținutului paginilor, fiecare pagină conține o descriere și cuvintele cheie pentru aceasta, toate fotografiile sunt etichetate, iar indexarea anumitor documente sau părți ale acestora este interzisă, puteți începe înregistrarea site-ului în motorul de căutare.</p> <h3>Folosind noindex și nofollow</h3> <p>Pentru a împiedica indexarea unei părți a paginii, există o etichetă noindex.</p> <p>Eticheta noindex este percepută numai de motoarele de căutare ale Yandex și Rambler, alte motoare de căutare, inclusiv Google, o ignoră. Eticheta noindex poate fi utilizată în eticheta meta Robots.</p> Când să utilizați eticheta noindex: <ul> <li>1) Închideți codurile contoarelor de la indexare;</li> <li>2) Închideți legăturile de ieșire din indexare atunci când nu doriți ca acestea să fie luate în considerare de motoarele de căutare sau schimburile de link-uri.</li> <li>3) Închideți eticheta noindex cu informații a căror indexare nu are sens datorită unei modificări permanente.</li> <li>4) Închideți indexarea conținutului duplicat.</li> </ul> <p>Dacă nu doriți să închideți linkul din indexare (și uneori aveți nevoie de crawler să îl urmeze), puteți folosi atributul rel = "nofollow".</p> <p>Atributul nofollow ar trebui să fie utilizat pentru toate linkurile care duc la alte site-uri (dacă nu sunt site-urile dvs. și nu doriți să le transferați greutatea paginii). Pentru linkuri care conduc spre propriile dvs. pagini, acest atribut nu trebuie utilizat.</p> <p>Atributul nofollow poate fi utilizat și în meta-tag-ul roboților.</p> <h3>Resurse utile</h3> <br> <br> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-8686842323494376" data-ad-slot="8576168847" data-ad-format="auto"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> <br> <br> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script> <ins class="adsbygoogle" style="display:inline-block;width:300px;height:600px" data-ad-client="ca-pub-8686842323494376" data-ad-slot="9162386769"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> <br> <br><h4>Articole similare</h4> <ul> <li> <p><a href="/utilizator-203/rezumatul-lectiei-pe-tema-sunt-cetatean-si-student.html">Rezumatul lecției pe tema "Sunt cetățean și student"</a></p> </li> <li> <p><a href="/utilizator-203/descrierea-lectiei-despre-dezvoltarea-discursului.html">Descrierea lecției despre dezvoltarea discursului (grupul pregătitor) cu privire la subiectul abstractului însuși</a></p> </li> <li> <p><a href="/utilizator-203/descrierea-activitatii-extra-curriculare-cu-elevii.html">Descrierea activității extra-curriculare cu elevii claselor a VII-a</a></p> </li> </ul> <div class="vnizine"><p style="text-align: left;"><a href="/utilizator-203/tot-ce-trebuie-sa-stiti-despre-kebab-shish-mancare.html">Pagina anterioară</a></p><p style="text-align: right;"><a href="/utilizator-203/cum-sa-alegi-cea-mai-buna-substanta-de-albire.html">Pagina următoare</a></p> </div> <h3>Trimiteți-le prietenilor:</h3> <p> <script type="text/javascript">(function(w,doc) { if (!w.__utlWdgt ) { w.__utlWdgt = true; var d = doc, s = d.createElement('script'), g = 'getElementsByTagName'; s.type = 'text/javascript'; s.charset='UTF-8'; s.async = true; s.src = ('https:' == w.location.protocol ? 'https' : 'http') + '://w.uptolike.com/widgets/v1/uptolike.js'; var h=d[g]('body')[0]; h.appendChild(s); }})(window,document); </script> <div data-mobile-view="true" data-share-size="40" data-like-text-enable="false" data-background-alpha="0.0" data-pid="1771468" data-mode="share" data-background-color="#ffffff" data-share-shape="round-rectangle" data-share-counter-size="12" data-icon-color="#ffffff" data-mobile-sn-ids="fb.tw.wh.vb.ps.gp." data-text-color="#000000" data-buttons-color="#FFFFFF" data-counter-background-color="#ffffff" data-share-counter-type="disable" data-orientation="horizontal" data-following-enable="false" data-sn-ids="fb.tw.ps.gp.ms.bl.gt." data-preview-mobile="false" data-selection-enable="false" data-exclude-show-more="true" data-share-style="1" data-counter-background-alpha="1.0" data-top-button="true" class="uptolike-buttons" ></div> </p> </article> </div> </div> </div> </div><footer class="akatita-footer clearfix"> <div class="akatita-content-layout layout-item-0"> <div class="akatita-content-layout-row"> <div class="akatita-layout-cell layout-item-1" style="width: 20%"> <p style="font-size: 18px; font-family: 'Times New Roman';">Articole aleatoare</p> <br> <ul> <li><a href="/utilizator-157/cum-se-trateaza-osul-rupt.html">Cum se tratează osul rupt?</a></li> <li><a href="/utilizator-123/reguli-de-servicii-de-excursii-muzee-din-rani.html">Reguli de servicii de excursii - muzee din răni</a></li> <li><a href="/utilizator-141/reparatii-in-casa-panourilor-de-sipca.html">Reparatii in casa panourilor de sipca</a></li> <li><a href="/utilizator-182/proprietatile-ceaiului-lapsang-suhong-si-puer-vor.html">Proprietățile ceaiului Lapsang suhong și Puer vor ajuta corpul!</a></li> <li><a href="/utilizator-137/manichiura-de-catre-feng-shui.html">Manichiură de către Feng Shui</a></li> </ul> </div><div class="akatita-layout-cell layout-item-1" style="width: 20%"> <p style="font-size: 18px; font-family: 'Times New Roman';">locație</p> <br> <ul> <li><a href="/locul-pe-harta.html">Suntem pe hartă</a></li> <li><a href="/adresa.html">Adresa</a></li> </ul> <ol> <li><a href="/sitemap/sitemap66.html">sitemap</a></li> <li><a href="/sitemap/sitemap228.html">sitemap</a></li> <li><a href="/sitemap/sitemap666.html">sitemap</a></li> <li><a href="/sitemap/sitemap907.html">sitemap</a></li> <li><a href="/sitemap/sitemap1022.html">sitemap</a></li> </ol> </div><div class="akatita-layout-cell layout-item-1" style="width: 20%"> <p style="font-size: 18px; font-family: 'Times New Roman';">Mai multe despre noi</p> <br> <ul> <li><a href="/contactati-ne.html">Contactați-ne</a></li> <li><a href="/despre-site.html">Despre site</a></li></ul> </ul> </div><div class="akatita-layout-cell layout-item-1" style="width: 40%"> <p style="text-align:right;"><a href="#"></a>Drepturi de autor © 2024. Toate drepturile rezervate.</p><br> <p style="text-align: right;"> <!--LiveInternet counter--><script type="text/javascript"> document.write("<a href='//www.liveinternet.ru/click' "+ "target=_blank><img src='//counter.yadro.ru/hit?t40.6;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+ ";h"+escape(document.title.substring(0,150))+";"+Math.random()+ "' alt='' title='LiveInternet' "+ "border='0' width='31' height='31'><\/a>") </script><!--/LiveInternet--> </p> </div> </div> </div> </footer> </div> </div></body> </html>