Milyen lesz az előttünk álló Pingvin algoritmus? Hogyan alkalmazhatja a gépi tanulást a Google a Pingvin algoritmusnál? Mi számít majd rossz linknek?
Ez a cikk nem a tényeken alapul. Ez elszabadult gondolatkísérlet arról, milyen lesz a Google Pingvin algoritmusa, ha a Google beveti a mesterséges intelligenciát.
A Rankbrain és John Giannandrea
Kezdjük a körítéssel. 2015 nagy híre volt a RankBrain algoritmus. A lényeg, hogy a Google a gépi tanulást (machine learning) alkalmazó algoritmusa a harmadik legfontosabb rangsorolási tényezővé vált.
Mindezt úgy, hogy a SEO világ észre sem vette.
2016 februárjának nagy híre, hogy visszavonult Amit Singhal a Google keresési részlegének vezetője, és helyére az a John Giannandre kerül, aki eddig a kutatási és mesterséges Intelligencia részleget vezette.
A Google már használja a gépi tanulást például az Adwords-ben, a képfelismerés során, a Google Hírekben és sok más helyen. Ugyan ezt teszi az Apple, az Amazon, a Microsoft, és ezer másik cég. A gépi tanulás – bár keveset hallunk róla – mára kulcskérdéssé vált az info-tech világban.
2008-ban a Google még egyértelműen kézzel írt kódokat használt, de még 2011-ben is úgy nyilatkozott egy volt Google munkatárs, hogy Amit Singhal a Google most visszavonult keresési részlegének vezetője elutasítja a gépi tanuláson alapuló rangsorolást.
2013-ban viszont már Matt Cutts arról beszélt, hogy a Google aktívan dolgozik a gépi tanuláson.
Azt hiszem, látszik a tendencia. 2011-ben még elutasítás, 2013-ban már aktív használat egyes területeken 2015-ben már a harmadik legfontosabb rangsorolási algoritmus, 2016-ban pedig a mesterséges intelligenciáért felelős részleg korábbi vezetője lesz a teljes keresési részleg feje.
A képlet világos a keresés, és a keresőoptimalizálás jelene, de még inkább jövője a gépi tanulás, és a mesterséges intelligencia.
A gépi tanulás lényege
És még mindig nem jutottunk el a Pingvin algoritmushoz. Nagyon röviden szót kell ejteni a gépi tanulásról is.
A gépi tanulásnak alapvetően két fajtája van:
– a felügyelt
– és a felügyelet nélküli
Az előbbi esetében az algoritmus kap rengeteg bemenő adatot, és ezek alapján tud következtetni arra, hogy egy ismeretlen adat esetén mi lenne az eredmény. A felügyelet nélküli gépi tanulás során az algoritmus csak a végeredményt látja és ezek alapján próbál azonos jellegzetességeket látni.
A keresőoptimalizálás világára lefordítva a dolgot. Az algoritmus kap rengeteg bemenő adatot, hogy mi számít jó és mi számít rossz találati listának (milliárdos adattömegről van szó). Ez alapján pedig egy új keresés esetén már önmaga tudja előállítani a jó minőségű találati listát.
A példa persze nagyon sarkított és leegyszerűsített, de most ennyi elég. Mehetünk a Pingvin algoritmushoz.
A Pingvin algoritmus és a gépi tanulás
A Pingvin algoritmus esetén a gépi tanulás kiválóan tud működni, ugyanis a Google-nak rengeteg bemenő adata van, amivel az algoritmus tanítható.
Például a Google-nak vélhetően rendelkezésre áll a katalógusok és PR cikkes oldalak több tíz vagy százezres listája. Nincs más feladata, mint betáplálni ezt az algoritmusba, bemenő adatként, mint értéktelen, vagy gyanús linkek.
A gépi tanulás innentől ha új, hasonló struktúrájú oldalra bukkan, azonnal megszólalhat a vészcsengő. A gépi tanulás segítségével az algoritmus felismeri a hasonló struktúrájú oldalakat.
Természetesen ennek másik oldala is igaz, a Google bemenő adatként rengeteg természetes linket is mutathat a rendszernek.
Milyen más szignálok tehetnek gyanússá egy oldalt:
– a láblécben elhelyezett külső oldalra mutató linkek
– a láblécben elhelyezett kulcsszavas más oldalra mutató linkek
– dofollow link, ha a közelében megtalálható a hirdetés/szponzor felirat
– ugyanez képlink esetén
– kulcsszavas külső oldalra mutató link az oldalsávban
– a főmenüben lévő kulcsszavas kimenő link
– magas link/szöveg arány
– azonos karakterszámú cikkek, benne linkkel
– irreleváns, kulcsszavas link egy szövegben
– normál karakterszínnel azonos link szín (a link nem különül el a szöveg többi részétől)
– kulcsszavas linkek magas aránya az egyéb típusú linkekhez képest (brand, általános, stb.)
– olyan oldalak, amelyek horgonyszövegeiben magas Adwords értékű horgonyszövegek találhatóak
– olyan oldalcsoportok, amelyek azonos oldalakat hivatkoznak meg kulcsszavas linkekkel
– magas linkszám, olyan oldalnak, amelyre kevés a keresési forgalom
– magas linkszám, de kevés link más releváns domainről
– magas brand horgonyszöveg, úgy, hogy minimális, vagy nincs brandkeresés
– magas linkszám a szegmens más hasonló szereplőihez képest
– magas linkszám az oldal látogatóihoz képest
– gyanús oldalcsoporttól származó linkek jelentős aránya
– disavowban gyakran előforduló hivatkozó domainek magas aránya
– bizonyos aloldalak magas linkelési aránya más aloldalakhoz képest
– természetellenesen magas főoldal linkelés
A sort lehetne folytatni számtalan tippel. A lényeg, amit látni kell, hogy a fenti ötletek matematikailag jól leírhatóak.
Az is jól látszik, hogy a Google-nak már bőven rendelkezésre állnak azok az erőforrások, hogy a Pingvin algoritmust a gépi tanulásra építsék. Gondoljunk csak arra, hogy az alapalgoritmusban milyen alapvető szerepet játszik!
Jusson eszünkbe az is, hogy a Pingvin a Google ígéretei szerint már folyamatosan, real-time módon fut majd. Ez pedig ismét arra utal, hogy nem egy manuálisan írt algoritmussal dolgoznak, mint a Pingvin első verziójának esetén lehetett, hanem egy olyan rendszerrel rendelkeznek, amely képes folyamatosan újraértékelni az új linkeket.
Akkor brutális változásokat hoz az új Pingvin?
Nem feltétlenül. Ne feledjük, hogy a Rankbrain algoritmus is úgy futott le, hogy észrevétlen maradt. A Google-nak vélhetően nem célja feje tetejére állítani a találati listát.
Azt azonban ne feledjük, hogy az új Pingvin vélhetően könnyen fejleszthető lesz, idővel egyre szigorúbb lesz, és mivel a futás folyamatos lesz a rengeteg apró szigorítás szinte láthatatlan lehet, de egy évvel később már egy sokkal szigorúbb Pingvin algoritmus élhet, és ez a szigorodás szinte észlelhetetlen lesz. Jól láttuk ezt a Panda algoritmusnál.
Persze lehet, hogy az új Pingvin radikális változásokkal indít, de a láthatatlan, folyamatos szigorodás igen valószínűnek tűnik most.
Ha tippelni kell, azt gondolom, hogy a Pingvin algoritmusban a büntetés mellett a linkleértékelés is nagy szerepet kap majd.
Így azok az oldalak, amelyek természetes linkeket is kaptak és jó felhasználói élményt nyújtanak, nem tűnnek majd el a találati listáról, csak a természetellenes linkek hatása megszűnik. Ez a minőségi oldalaknak (és a nagy márkáknak) egyfajta védelmet nyújt, és csökkenti a Pingvin drasztikus hatását, és nem eredményezi a találati lista minőségének romlását.
Következtetés
Valóban így lesz? A fentiek csupán egy gondolatkísérlet. Azt azonban látni kell, hogy a Google nagyon komoly változás alatt áll, a gépi tanulás miatt, és emiatt a keresőoptimalizálás is átalakul, és természetesen a linképítés is. Néhány hónap, vagy talán hét múlva okosabbak leszünk.