Controlați modul în care Google indexează conținutul dvs. cu etichete Meta
Există multe motoare de căutare acolo, dar, în cea mai mare parte a timpului, proprietarii de site-uri le pasă de obținerea site-ului lor indexate pe Google atotputernic. O modalitate de a funcționa mai bine pe motorul de căutare este să utilizați etichete meta robot.
meta
tag-ul robot este o meta-tag consens între motoarele de căutare precum Google, Yahoo și Bing. Utilizarea etichetei meta este de a permite dezvoltatorilor web să aibă controlul accesibilității pentru paginile web, în comparație cu crawlerele motoarelor de căutare. De exemplu, ceva de genul noindex
va împiedica toate roboții de la motoarele de căutare să pună pagina web în indexul lor.
Robotul Google se numește Googlebot. În acest post vom vedea modul în care abordăm exclusiv Googlebot meta etichete.
Adresați-vă Googlebot
Pentru a aborda Googlebot, specificați meta Nume
la fel de Googlebot
în loc de doar roboți
. Acest exemplu va împiedica Googlebot să pună pagina dvs. web în indexul său, dar să permită boturilor de la Bing și Yahoo să acceseze cu crawlere pagina. Astfel, paginile dvs. Web pot să apară în continuare în rezultatele căutării Bing și Yahoo.
Google are un număr de roboți speciali care accesează cu crawlere diferite tipuri de conținut, cum ar fi Imagine, Știri, Video, Anunțuri și Mobile. Google vă permite să blocați aceste roboți în mod individual. Dacă nu doriți ca site-ul dvs. să apară în rezultatele căutării Google Mobile, de exemplu, puteți specifica eticheta meta robot astfel:
Lista completă a tipurilor de bot Google poate fi găsită în pagina crawlerelor de pe site-ul Google.
Preveniți indexarea imaginilor
Este o realitate iritantă atunci când găsiți imaginea dvs. protejată prin drepturi de autor utilizată de altcineva fără permisiunea dvs. prealabilă. Dacă doriți să minimalizați această situație, puteți împiedica Google să vă afișeze imaginile pe indicele lor.
Specificați eticheta meta robot cu valoarea lui noimageindex
. Acest lucru va împiedica robotul să indexeze toate imaginile din pagină și imaginile dvs. să nu apară în rezultatele Căutării de imagini Google, de unde oamenii caută de obicei imagini.
Alternativ, puteți seta meta nume ca Googlebot-image
pentru a împiedica în special robotul Google să acceseze cu crawlere site-ul pentru imagini.
Preveniți traducerea
Google Chrome oferă traducerea unui site în limbă străină în limba preferată sau în limba locală a vizitatorului, cu ajutorul serviciului Google Translate. În timp ce traducerea Google Translate se îmbunătățește, este departe de a fi perfectă pentru anumite limbi. Ieșirea de traducere poate fi, uneori, foarte ciudată.
Dacă nu doriți ca Google să traducă paginile dvs. Web, setați meta googlebot cu valoarea notranslate
, ca astfel.
Dacă doriți să împiedicați traducerea unei anumite secțiuni a paginii, puteți adăuga notranslate
clasă în elementul care înfășoară conținutul:
Google va ignora acest lucru De asemenea, puteți împiedica Google să indexeze paginile web după o anumită perioadă de timp. Acest lucru va fi util în special pentru paginile web care sunt relevante numai într-un interval de timp, cum ar fi, de exemplu, o pagină de înregistrare a evenimentelor. În acest caz, probabil că doriți să spuneți robotului să nu acceseze cu crawlere și să indexeze această pagină după ce evenimentul sa încheiat, împiedicându-l să apară în rezultatele căutării Google. Pentru a face acest lucru, specificați eticheta meta cu valoarea de Dând exemplul de mai sus, robotul Google nu va accesa cu crawlere pagina după 29-Sep-14. În final, pagina va dispărea din index, dar puteți păstra pagina de arhivare pe site-ul dvs. Web.Preveniți indexarea după un anumit timp
unavailable_after
apoi urmată de informația despre timp. Formatul de timp trebuie să respecte formatul RFC-850, de exemplu: Joi, 26-Sep-14 10:00:00 UTC