Creați fișier

Creați fișier
Iată o altă greșeală pe care am făcut-o când creează un blog. Nu am acordat atenție creării unui fișier cum ar fi robots.txt. În primul rând, ce face el? Aceasta interzice sau permite indexarea fișierelor sau a directoarelor de fișiere întregi găzduite pe serverul gazdei mele. Pentru cine este acest fișier? Acest fișier conține instrucțiuni pentru roboți de căutare, atât pentru toată mulțimea, cât și pentru tipurile individuale ale acestora. La urma urmei, numai la dispoziția Yandex vor exista cel puțin 10 dintre ele.







Când acești roboți vin să indexeze site-ul, ei își caută instrucțiunile care sunt scrise în acest fișier. Când trebuie să creez acest fișier robots.txt? Imediat după crearea blogului și instalarea acestuia pe server. În momentul acestei scrieri voi încerca să creez fișiere robots.txt pentru wordpress și robots.txt pentru joomla

Nu am putut începe să scriu acest articol pentru o lungă perioadă de timp, deoarece nu am putut înțelege unele dintre nuanțele creării unui fișier robots.txt. Se pare că a creat un document obișnuit, numit Roboti misterios, și a scris câteva linii, a aruncat asupra gazdei.

Dar, potrivit informațiilor care mă adunau, capul meu a început să se umfle, nuanțele au fost importante. Trebuie să luați în considerare câteva lucruri, astfel încât site-ul să nu fie deteriorat, iar blogul a fost fericit. În primul rând, deoarece acest document comunică cu roboții motoarelor de căutare și indică ce fișiere și directoare să indice sau să nu indexeze, ar fi rezonabil să scrieți două Robots.txt. Primul document se va ocupa de fișiere CMS WordPress, al doilea - CMS Joomla.

Primul fișier pentru CMS WordPress.

Pentru a crea un fișier, trebuie să instalați toate directoarele acestui CMS și, după instalare, le suprascriu. Fac acest lucru pentru a generaliza cunoștințele despre directoarele și fișierele acestui motor și apoi să înțeleg cum să creez acest robots.txt pentru wordpress:

wp-admin - directorul fișierelor

Și acum un pic de text am creat un document robots.txt pentru wordpress.

User-agent: * este un șir care spune că toate motoarele de căutare sunt legate de instrucțiunile care sunt scrise mai jos, nu voi restrânge pe nimeni de la motoarele de căutare. User-agent: Yandex - blocul de instrucțiuni care se referă numai la motorul de căutare Yandex

Dacă blogul folosește numai imagini descărcate pe Internet, merită să le numiți în mod diferit, să le modifici dimensiunea.

Tot ceea ce este plasat în alte subdirectoare de wp-content - ar trebui să fie interzis de a fi indexate, deoarece a postat un blog teme de design, plugin-uri, pagini cache, în principiu, nu este necesar să se arate motorul de căutare complet. Acesta conține fișiere care pot fi încă în mii de alte bloguri, fiind asociate cu menținerea blogului.







Dezactivați: / wp-admin / - Neagră indexarea dosarului cu fișierele care furnizează panoul de administrare în blog.

Dezactivați: / wp-include / - interzice indexarea directorului cu fișierele găzduite de wp-include. Acestea sunt fișiere de lucru ale WordPress CMS, ele nu reprezintă nimic nou pentru motorul de căutare, dar pentru consumatori nu au nici un interes.

Disallow: / wp-content / plugins /, Disallow: / wp-content / cache /, Disallow: / wp-content / teme / - Vă interzic să indexeze toate fișierele și folderele din ele care conțin plugin-uri care sunt instalate pe blog-ul meu , dosar cache - vă interzic să indexeze fișierele care creează un plugin cache, se dublează paginile deschise ale blog-ul meu, dar eu nu știu, la fel ca în .html. Nu vreau ca aceste fișiere să cadă în indexul motoarelor de căutare, deoarece acestea sunt vremuri și sunt create la atracția unui anumit moment și sunt distruse. De ce să-l indexez.

Nu permiteți: /wp-login.php - Nu vreau să indexez pagina care mă duc la zona de administrare, cred că nu merită spus de ce.

Nu permiteți: /wp-register.php - interzic indexarea paginii de înregistrare pe blog, nu o folosesc deloc.

Disallow: / trackback / și Disallow: * / trackback / - interzic pagini de index, care sunt responsabile pentru Urmãritori, nu utilizați acest lucru, și nu înțeleg de mult ce este.

Disallow: / / hranei pentru animale, Disallow: * / hrana pentru animale /, Disallow :? / Alimentare = - interzic pagini de index, care sunt asociate cu lucrul cu feed-uri WordPress motor, pentru a fi sincer nu a înțeles cu adevărat scrierea acestor linii, dar am dat seama de ce - toate aceeași hrană, acest lucru este, de asemenea, ca note, numai fără a aplica proprietățile subiectului.

Dezactivați: /? S =. Dezactivați: / *? *. Nu permiteți: / *? - Interzic indexarea rezultatelor căutării, este clar de ce.

Împiedicați: / tag / - interzice indexarea etichetelor pe blogul meu, deoarece acestea conțin copii de 100% din note.

Dezactivați: /xmlrpc.php - interzicem indexarea fișierului xmlrpc.php, care este responsabil pentru apelarea procedurilor la distanță în WP.

Gazdă: seomans.ru - această linie spune că acesta este domeniul meu principal, găzduiește principalele mele, originale, dulce, apoi extrase informații. Toate celelalte informații similare, care, în acest domeniu, sunt o oglindă.

Unii operatori au fost copiați fără milă de alte bloguri, bazate pe CMS WordPress. Pentru moment, voi pune acest Robots.txt în dosarul rădăcină al blogului meu. Când găsesc mai multe informații despre rolul fișierelor care nu sunt incluse în roboți, voi adăuga cu siguranță intrări și scriu continuarea notei mele.

Cel de-al doilea fișier pentru Joomla CMS.

Pentru a crea un fișier, trebuie să instalați toate directoarele acestui CMS și, după instalare, le suprascriu:

director - fișier director

WebAlta (WebAlta Crawler / 2.0)

Respinge: interzice indexarea. Dupa. indică faptul că interzic indexarea. Dacă există Disallow: / - întregul site, dacă Disallow: / administrator / - apoi directorul numit administrator, dacă Disallow: /LICENSE.php - numai acest fișier.

Permiteți: - directiva permisiune de indexare a blogului creat de robot, a directorului cu fișiere sau a fișierului. Există o nuanță, puteți interzice indexarea tuturor directoarelor și subdirectoarelor site-ului (de exemplu, administrator). În continuare, scrieți permisiunea: / administrator / language / - directive și numai acest director și fișierele care vor fi indexate.

Directiva sitemap: - indică calea către harta site-ului sau blog, este foarte importantă pentru indexarea corectă a resursei.

Directiva gazdă: - indică domeniul principal al site-ului meu, toate celelalte domenii cu un blog sau un site similar sunt considerate oglindă.

Vă urez bun venit, pe blogul seomans.ru

Înregistrați-vă pentru a primi recomandări privind crearea de bloguri și site-uri de la seomans.ru

Nu am putut să nu vă mulțumesc pentru o descriere atât de detaliată.

Am introdus o solicitare Google și am deschis toate site-urile de pe pagină simultan.

aveți un exemplu mai bun și mai dezvoltat. Și este de înțeles și nu este confuz.

Să vă arătați puțin.







Articole similare

Trimiteți-le prietenilor: