HTML meta robots és X-robots: teljes útmutató (noindex, follow, index, stb.)

A keresőoptimalizálásban kiemelten fontos az indexelés kézben tartása. Ezt a célt szolgálják a meta robots címkék és az X-robots tag-ok.

A weboldalunk egészének megítélése mindig az összes indexelt tartalom alapján történik, ezért is fontos az indexelés kézben tartása, és a gyenge minőségű aloldalak noindexre helyezése.

Ebből az útmutatóból megtanulhatod, hogyan használd a meta robots és X-robots címkéket, hogy szabályozni tudd weboldalat indexálását. Megtanulhatod azt is, hogyan kerüld el a leggyakoribb hibákat és hogyan tegyél szert SEO előnyre.

Mi az a meta robots címke?

A meta robots, vagy egyszerűen csak robots címke, nem más mint egy HTML kódrészlet, ami a weboldal <head></head> részében van elhelyezve.

Feladata, hogy szabályozza, hogy a keresőmotorok robotjai hogyan térképezhetik és indexelhetik az adott URL-t.

Konkrétan így néz ki a forráskódban a meta robots kód:

Hirdetés


<meta name="robots" content="noindex" />

Ezek a címkék mindig URL szintűek, azaz aloldal szinten szabályozzák a keresőrobotok viselkedését.

Mire használjuk a meta robots címkét?

A robots meta címkék feladata, hogy szabályozzák a Google (vagy más keresőrobotok) viselkedését az oldaladon. Leggyakrabban az alábbi szabályozásokra használjuk:

engedik, vagy tiltják, hogy az adott oldal megjelenjen a találati listán
engedik, vagy tiltják, hogy az oldalon lévő linkeket kövessék a keresőrobotok
az oldalon lévő képek indexelésének tiltása
az oldalon lévő meta leírás megjelenítésének tiltása
videók megjelenítésének tiltása a találati listán

És ezek csak a legfontosabbak, a későbbiekben az összes szabályozást végigvesszük.

Ahhoz, hogy megérts a robots meta címkék működését, meg kell ismerkedned, ennek tulajdonságaival, és az általános irányelvekkel.

Rengeteg kód példát is hozok majd, hogy könnyebb legyen megérteni és alkalmazni a leírtakat. És persze ezeket saját oldalad feltérképezésének és indexelésének beállítására is használhatod.

Meta robots tulajdonságok és direktívák

A meta robots címke felépítése

Először nézzük meg, hogyan épül fel egy meta robots címke!

Először jön egy kacsacsőr jel: <

utána jön a „meta” szócska,

majd két kötelező tulajdonság:

name=””
content=””

végül a záró kacsacsőr jel, fordított irányban: >

Egyben így néz ki:

<meta name="robots" content="noindex, follow">

Amint láthatod a content részen belül a különböző szabályozásokat vessző választja el.

Ennek a cikknek a forráskódjában mindez így néz ki:

A két kötelező meta robots tulajdonság

A name tulajdonság

A name tulajdonság feladata, hogy nevesítse azokat a robotokat, amelyeknek a meta robots-ban leírt tulajdonságokat követnie kell.

Leggyakrabban ez így néz ki:

name=”robots”

és általában ezt is használjuk, ugyanakkor ha szeretnéd lehetőség van több meta robots cmíke megadására, ahol más-más robotokat szabályozhatsz.

<meta name="googlebot" content="noindex">

<meta name="googlebot-news" content="nosnippet">

Ennél a példánál két meta robots címke van, az első a googlebot-ra vonatkozóan ad meg szabályokat, míg a másik a googlebot-news-ra.

Több száz különböző robot van, például külön robotjai vannak az egyes keresőmotoroknak, de sok SEO eszköznek is.

A legfontosabb keresőmotorokat itt találod:

Google: Googlebot ( az összes Google keresőrobotot itt nézheted meg)

Bing: Bingbot (a többi Bing robot itt található)

DuckDuckGo: DuckDuckBot

Baidu: Baiduspider

Yandex: YandexBot

A content tulajdonság

A name részben azt adtuk meg milyen robotra vonatkozik az instrukció, a content részben pedig megadhatjuk, hogy milyen szabályozás vonatkozik az adott robotra.

Érdemes tudni, hogy ha nem adsz meg semmilyen szabályozást, akkor az alapértelmezett eset az, hogy a robotok indexelhetik a tartalmadat és követhetik a linkeket (follow). Ugyanakkor az egyes konkrét linkeknél ez átállítható nofollow-ra.

A content tulajdonságnál az alábbi direktívákat használhatod:

index: indexelheti a tartalmadat a keresőrobot (megjegyzés: ez az alapértelmezett beállítás, így nem muszáj használni)
noindex: a keresőrobot nem indexelheti a tartalmat, így az nem jelenhet meg a találati listán sem.
follow: követheti az oldalon lévő linkeket, így újabb oldalakat fedezhet fel a keresőrobot
nofollow: nem követheti a linkeket
none: a noindex, nofollow rövidített változata
all: az index, follow összevont változata
noimageindex: nem indexelheti a képeket az oldalról
noarchive: a weboldal tárolt változata nem jelenhet meg a találati listán
nocache: ugyan az, mint a noarchive, de ez a Microsoft robotjainak szól
nositelinkssearchbox: nem jelenhet meg egy beágyazott keresőmező a weboldalara vonatkozóan a találati listán
nopagereadloud: a képernyőolvasóknak nem engedélyezed a tartalom felolvasását
notranslate: nem jelenhet meg a találati listán az oldal fordítása
unavaible_after: a megadott időpont után noindexre kerül az oldal

A Google teljes útmutatóját erre vonatkozóan itt találod.

A meta a robots a találati listán való megjelenés szabályozására

Bár a meta robots alapvetően az indexelés és feltérképezés szabályozására szolgál, azonban azt is irányíthatjuk vele, hogy hogyan jelenjen meg oldalunk a találati listán.

A Google 2019 szeptemberében bejelentette, hogy több új lehetőséget vezet be, amellyel a weboldaltulajdonosok szabályozhatják oldaluk megjelenését a találati listán. Ezeket a szabályozásokat szintén a meta robots beállításokkal tehetjük meg.

Az alábbi beállításokat a content részben kell szintén megadni:

nosnippet: ne jelenjen meg kivonat / meta leírás az oldalról a találati listán
max-snippet [number]: a kivonat maximális hossza karakterben
max-video-preview [number]: másodpercben megadva a videó-előnézet maximális hossza
max-image-preview [setting]: a képe előnézet konkrét mérete, ha az nem „none”, „large”, vagy „standard”

És akkor most nézzünk konkrét példákat a meta robots beállításokra, amit akár a saját weboldaladon is alkalmazhatsz.

Meta Robots kód példák

Ne indexelje a tartalmat, de kövesse az oldalon lévő más weblapokra mutató linkeket:

<meta name="robots" content="noindex, follow" />

Ne indexelje és ne kövesse az oldalon lévő linkeket:

<meta name="robots" content="none" />

Ne legyen gyorsítótárazott verzió a találati listán:

<meta name="robots" content="noarchive" />

Ne legyen kép a találati listán (mobil találati listán elsősorban):

És akkor néhány beállítás, ami a találati listán való megjelenést szabályozza.

A videó-előnézet hossza maximum 10 másodperc lehet:

<meta name="robots" content="max-video-preview:30" />

Videó nem jelenhet meg, de kép igen, a találati listán:

<meta name="robots" content="max-image-preview:large, max-video-preview:0" />

Mindent megengedünk a keresőrobotoknak (kép, videó, szöveges):

<meta name="robots" content="max-snippet:-1, max-image-preview:large, max-video-preview:-1" />

Mi az az X-Robots címke?

A keresőrobotokat nem csak a HTML forráskódunk <head> részében tudjuk szabályozni, hanem az X-robots címkével is. De mi ez pontosan?

A X-Robots címke nem egy HTML elem, hanem egy HTTP-fejléc válasz, ahol ugyan azokat a beállításokat tudjuk használni, amit a meta robots esetén. Íme egy minta beállítás:

x-robots-tag: noindex, nofollow

Fontos tudni, hogy az X-Robots nem látszik a forráskódban, ahhoz, hogy alkalmazni tudjuk, hozzá kell férnünk a weboldalunk header.php, vagy .htaccess, esetleg a szerver konfigurációs fájljaihoz.

Mikor használjuk az X-Robots címkét?

Az X-Robots alkalmazásának van egy keresőoptimalizálási kockázata is.

Mivel a forráskódban nem látható, előfordulhat, hogy a meta robots beállításban indexelhetővé tesszük a tartalmat, de az X-robots címkében noindexre. Ez esetben az oldal nem kerül indexelésre, és a hiba forrását nehezebb megtalálni.

Miért alkalmazzuk akkor mégis, és pontosan hol?

akkor, ha nem HTML-típusú fájlok indexelését akarjuk szabályozni (pl. .pdf fileok)
akkor, ha nem oldalszinten, hanem a weboldal egészére vonatkozóan akarunk direktívákat beállítani

Hogyan állítsd be a meta címkéidet?

Általában a meta robots címkék beállítása egyszerűbb, mint az X-tobots címkéké, de ez utóbbi sem túl bonyolult feladat.

Az alábbiakban megmutatom konkrétan hogyan kell ezeket a beállításokat megoldani, különböző CMS és szerverek esetén.

Meta Robots beállítása HTML fájlok esetén

Ha hozzáférsz a HTML fájlokhoz, akkor egyszerű dolgod van. A HTML dokumentum <head> részébe kell a meta robots címkét beillesztened.

Például ha azt akarod, hogy az oldal ne indexelje, de alinkeket kövesse a keresőrobot, akkor az alábbi kódot kell használni:


<meta name="robots" content="noindex, follow" />

Meta robots beállítása WordPress alatt

Ha WordPresst használsz, akkor a különböző SEO Pluginok alkalmazásával tudod legkönnyebben szabályozni az indexelést.

Ha Yoast SEO Plugin használsz, akkor az Advanced fül alatt találod a beállításokat.

Az „ Megengedjük a kereső motoroknak, hogy mutassák a(z) Bejegyzés a keresési eredményekben?” kérdésre ha no válaszolsz, akkor noindexre állítod az oldalt.

A „Ha a keresőmotorok követni akarják a(z) Bejegyzés hivatkozásokat” kérdésre adott no, pedig a nofollow beállítást jelenti.

Az általam is használt RankMath esetében az Advanced fül alatt egyértelműbb a szabályozás, ugyanis itt a fent már megismert noindex, nofollow, stb beállításokat találod, valamit a találati listán való megjelenést is szabályozhatod.

Az X-robots szabályozása Apache szerveren

Végül a X-robots címkét Apache webszerveren a .htaccess fájlban tudod szabályozni, amit a főkönyvtárban találsz meg.

Az alábbi beállítás a pdf fileok indexelését akadályozza meg:

<Files ~ "\.pdf$">

Header set X-Robots-Tag "noindex, follow"

</Files>

Ezek a beállítások már kicsit bonyolultabbak, érdemes egy programozó segítségét kikérni.

Gyakori hibák a meta robots beállításakor

Az alábbiakban az elmúlt 10 évem tapasztalatai alapján a legtipikusabb meta-robots hibákat mutatom be röviden.

Az oldal indexelésének teljes blokkolása

Igen gyakori, hogy amikor egy új weboldal kerül kialakításra, vagy éppen design csere történik a fejlesztő benne hagyja az éles oldalon is a noindex, nofollow címkét az oldal forráskódjában.

Ez természetes fejlesztés során, de ha az éles oldalon is bent marad, akkor a Google törli az adatbázisából a teljes oldalt. Ez néhány hétig nem probléma, de ha hetekig fennáll, az már keresőoptimalizálási szempontból is hátrányos, mert bizonyos szignálok elvesztését eredményezheti.

Új oldal élesítésekor mindig ellenőrizd a meta robots beállításokat!

X-robots noindex, meta robots index

Szintén előfordul, hogy a meta-robtos beállítás index-re van állítva, így látszólag az oldal indexelhető, de a forráskódban nem látható X-robots címe noindexen marad. ebben az esetben a keresőrobotok nem fogják feltérképezni az oldalt, az oldaltulajdonos viszont a forráskód alapján nem fogja megtalálni a hibát.

Ellenőrizd az X-Robots beállításokat is!

Meta Robots beállítások a robots.txt-ben blokkolt oldalakon

Ha bizonyos fájlok elérését blokkolod a robots.txt fájlodban, akkor ezeket az oldalakat a Google keresőrobotja nem éri el. Így hiába változtatsz a meta robots beállításokon, ha azokat nem tudja megnézni a Googlebot.

Ha valamit változtatsz ezeken a beállításokon ügyelj rá, hogy a robots.txt ne blokkolj ezek elérését.

Szerző: Szuhi Attila

Üdv! Szuhi Attila vagyok, az ITE.hu alapítója és főszerkesztője. Fő területem a keresőoptimalizálás és az online marketing. Speciális szakterületem a Google büntetések, a technikai SEO Audit és a linképítés.
Ha segítségre van szükséged, keress bátran.

Követhetsz

Share 0

Írd meg a véleményed!

Cikkek a témában

szeptember 30, 2022

HTML meta robots és X-robots: teljes útmutató (noindex, follow, index, stb.)

Mi az a meta robots címke?

Mire használjuk a meta robots címkét?

Meta robots tulajdonságok és direktívák

A meta robots címke felépítése

A két kötelező meta robots tulajdonság

A name tulajdonság

A content tulajdonság

A meta a robots a találati listán való megjelenés szabályozására

Meta Robots kód példák

Mi az az X-Robots címke?

Mikor használjuk az X-Robots címkét?

Hogyan állítsd be a meta címkéidet?

Meta Robots beállítása HTML fájlok esetén

Meta robots beállítása WordPress alatt

Az X-robots szabályozása Apache szerveren

Gyakori hibák a meta robots beállításakor

Az oldal indexelésének teljes blokkolása

X-robots noindex, meta robots index

Ellenőrizd az X-Robots beállításokat is!

Szerző: Szuhi Attila

Írd meg a véleményed!

Robots.txt használatáról közérthetően SEO szempontok alapján

Google indexelés és feltérképezés problémák megoldásai

HTML meta robots és X-robots: teljes útmutató (noindex, follow, index, stb.)

Azonnali Indexelés – a Google Indexing API és a Bing Submission API

INGYENES!

TÖLTSD LE A GOOGLE 100 SEO TANÁCSÁT