Controlați modul în care Google indexează conținutul dvs. cu etichete Meta

Există multe motoare de căutare acolo, dar, în cea mai mare parte a timpului, proprietarii de site-uri le pasă de obținerea site-ului lor indexate pe Google atotputernic. O modalitate de a funcționa mai bine pe motorul de căutare este să utilizați etichete meta robot.

meta tag-ul robot este o meta-tag consens între motoarele de căutare precum Google, Yahoo și Bing. Utilizarea etichetei meta este de a permite dezvoltatorilor web să aibă controlul accesibilității pentru paginile web, în comparație cu crawlerele motoarelor de căutare. De exemplu, ceva de genul noindex va împiedica toate roboții de la motoarele de căutare să pună pagina web în indexul lor.

Robotul Google se numește Googlebot. În acest post vom vedea modul în care abordăm exclusiv Googlebot meta etichete.

Adresați-vă Googlebot

Pentru a aborda Googlebot, specificați meta Nume la fel de Googlebot în loc de doar roboți. Acest exemplu va împiedica Googlebot să pună pagina dvs. web în indexul său, dar să permită boturilor de la Bing și Yahoo să acceseze cu crawlere pagina. Astfel, paginile dvs. Web pot să apară în continuare în rezultatele căutării Bing și Yahoo.

Google are un număr de roboți speciali care accesează cu crawlere diferite tipuri de conținut, cum ar fi Imagine, Știri, Video, Anunțuri și Mobile. Google vă permite să blocați aceste roboți în mod individual. Dacă nu doriți ca site-ul dvs. să apară în rezultatele căutării Google Mobile, de exemplu, puteți specifica eticheta meta robot astfel:

Lista completă a tipurilor de bot Google poate fi găsită în pagina crawlerelor de pe site-ul Google.

Preveniți indexarea imaginilor

Este o realitate iritantă atunci când găsiți imaginea dvs. protejată prin drepturi de autor utilizată de altcineva fără permisiunea dvs. prealabilă. Dacă doriți să minimalizați această situație, puteți împiedica Google să vă afișeze imaginile pe indicele lor.

Specificați eticheta meta robot cu valoarea lui noimageindex. Acest lucru va împiedica robotul să indexeze toate imaginile din pagină și imaginile dvs. să nu apară în rezultatele Căutării de imagini Google, de unde oamenii caută de obicei imagini.

Alternativ, puteți seta meta nume ca Googlebot-image pentru a împiedica în special robotul Google să acceseze cu crawlere site-ul pentru imagini.

Preveniți traducerea

Google Chrome oferă traducerea unui site în limbă străină în limba preferată sau în limba locală a vizitatorului, cu ajutorul serviciului Google Translate. În timp ce traducerea Google Translate se îmbunătățește, este departe de a fi perfectă pentru anumite limbi. Ieșirea de traducere poate fi, uneori, foarte ciudată.

Dacă nu doriți ca Google să traducă paginile dvs. Web, setați meta googlebot cu valoarea notranslate, ca astfel.

Dacă doriți să împiedicați traducerea unei anumite secțiuni a paginii, puteți adăuga notranslate clasă în elementul care înfășoară conținutul:

Google va ignora acest lucru

complet.

Preveniți indexarea după un anumit timp

De asemenea, puteți împiedica Google să indexeze paginile web după o anumită perioadă de timp. Acest lucru va fi util în special pentru paginile web care sunt relevante numai într-un interval de timp, cum ar fi, de exemplu, o pagină de înregistrare a evenimentelor.

În acest caz, probabil că doriți să spuneți robotului să nu acceseze cu crawlere și să indexeze această pagină după ce evenimentul sa încheiat, împiedicându-l să apară în rezultatele căutării Google.

Pentru a face acest lucru, specificați eticheta meta cu valoarea de unavailable_after apoi urmată de informația despre timp. Formatul de timp trebuie să respecte formatul RFC-850, de exemplu: Joi, 26-Sep-14 10:00:00 UTC

Dând exemplul de mai sus, robotul Google nu va accesa cu crawlere pagina după 29-Sep-14. În final, pagina va dispărea din index, dar puteți păstra pagina de arhivare pe site-ul dvs. Web.