Egy korábbi Yandex alkalmazott kiszivárogtatta a Yandex, az orosz keresőmotor forráskódjainak egy részét, köztük a keresőmotor közel 2000 rangsorolási szignálját.
Miért érdekes a Yandex szivárogtatás?
Talán nem túlzás ezt ez az elmúlt évek legérdekesebb SEO eseményének nevezni, hiszen a Yandex a világ egyik élvonalbeli keresőmotorja, jelenleg a világpiacon a 4. legnagyobb szerepelő, amely Oroszországban a Google-t is maga mögé tudta szorítani.
A Yandex orosz internetes keresőmotor és webes szolgáltatásokat kínáló cég. A céget 1997-ben alapították Oroszországban. Jelenleg a legnagyobb orosz keresőmotor, melynek piaci részesedése meghaladja a 60%-ot. Világszinten a Google, Bing, Baidu után a 4. legnagyobb keresőmotor.
Forrás: ChatGPT, emberi ellenőrzéssel
Yandex a kereső mellett több webes szolgáltatást is kínál, beleértve e-mail, online tárhelyet, fényképtárat, online pénztárcát, és online üzletet. A cég üzleti tevékenysége túlterjed Oroszországon, érinti Ukrajnát, Belaruszt, Kazahsztánt és Türkmenisztánt is.
A Yandex a Bécsi Értéktőzsdén (Wiener Börse) és a Moszkvai Értéktőzsdén (MOEX) is jegyzett cég.
De a mostani szivárgás nem csak emiatt fontos keresőoptimalizálási szempontból.
- A Yandex számos korábbi Google alkalmazottat foglalkoztat
- a Yandex-et emiatt is egyfajta Google-klónnak tartják, és érdekes módon a kiszivárgott rangsorolási tényezők legelső eleme éppen a PageRank
- a Yandex és a Google találati listája nagyban hasonló, ami a találatokat illeti, azaz rangsorolási algoritmusuk hasonló ereményeket hoz, mint a Google-é
- végül a Yandex-re optimalizáló SEO szakemberek hasonló technikákat alkalmaznak, mint a Goole-re optimalizálók.
Mindazonáltal a Yandex nem a Google, így a most kiszivárgott rangsorolási szignálok nem feleltethetőek meg egy-az egyben a Google rangsorolási szignáljainak. Mindazonáltal elképesztően érdekes belelátni az élvonalbeli keresőmotor működésébe.
Hogy szivárgott ki a kód és mennyire hiteles?
A kiszivárgott kód egy népszerű hack fórumon jelent meg torrentként.
A Bleeping Computer szerint a kiszivárgott anyagok:
„44,7 GB fájlból állnak, amelyeket 2022 júliusában loptak el a cégtől. Ezek a kódtárak állítólag a cég összes forráskódját tartalmazzák a spamellenes szabályokon kívül.”
Arseniy Shestakov programozó elemzése szerint a forráskódok a Yandex alábbi szolgáltatásait érinti:
- Yandex keresőmotor és indexelő bot
- Yandex Térképek
- Alice (AI asszisztens)
- Yandex Taxi
- Yandex Direct (hirdetési szolgáltatás)
- Yandex Mail
- Yandex Disk (felhőalapú tárhelyszolgáltatás)
- Yandex Market
- Yandex Travel (utazási foglalási platform)
- Yandex360 (munkaterület-szolgáltatás)
- Yandex Cloud
- Yandex Pay (fizetés-feldolgozási szolgáltatás)
- Yandex Metrika (internetes analitika)
A Yandex közleménye szerint:
„A Yandexet nem hackelték meg. Biztonsági szolgálatunk egy belső adattárból származó kódrészleteket talált a nyilvánosság számára elérhető felületeken, de a tartalom eltér a Yandex szolgáltatásaiban használt adattár jelenlegi verziójától.”
Az tehát egyértelmű, hogy a kiszivárgott file-ok valósak, így a rangsorolási szignálok is valamikor a Yandex algoritmusának részei volt. Hogy a mostani rangsorolás mennyiben tér el a kiszivárgott verziótól az nem tudható.
Grigory Bakunov a Yandex egykori munkatársa a Bleeping Computernek nyilatkozva elmondta, hogy a szivárogtatás mögött vélhetően politikai motiváció állt, mivel a szivárogtató nem kért pénzt az adatokért, és személyes adatok sem kerültek nyilvánosságra. Becslése szerint a nyilvánosságra hozott kód 90%-ban lehet azonos az aktuálisan használt verzióval.
A Yandex rangsorolási szignáljai
A kiszivárgott rangsorolási szignálok elképesztően érdekesek. Elkezdtem a feldolgozásukat, de még csak nagyjából 15%-kal végeztem (az anyag részben angol, részben orosz nyelven íródott).
Szerencsére nemzetközi szinten sokan jobban állnak az anyag feldolgozásából, így most ezekből is tudok válogatni. A teljesség igénye nélkül néhány a Yandex rangsorolási faktorai közül:
- A linkek kora rangsorolási tényező
- A forgalom és az organikus forgalom %-a rangsorolási tényező
- A számok az URL-ekben rossz hatással vannak a rangsorolásra
- Az URL-ekben lévő sok kötőjel rossz hatással van a rangsorolásra
- Létezik kemény büntetés, amikor az oldal PageRank értéke lenullázódik
- A tárhely megbízhatósága rangsorolási tényező (kevesebb 4xx/5xx hiba, jobb az organikus forgalom szempontjából)
- Külön rangsorolási tényező a Wikipédia jobb rangsorolásához
- Sok rangsorolási tényező kapcsolódik a felhasználói viselkedéshez – CTR, utolsó kattintás, oldalon töltött idő, visszalépési arány.
- A dokumentum kora és az utolsó frissítés, mindkettő rangsorolási tényező.
- A domain átlagos pozíciója az összes lekérdezésben rangsorolási tényező.
- A napszak és a hét napja hatással van a keresési eredményekre (pl. a hozzám közeli éttermek 10 órakor a reggelizőhelyeket, míg délután 4 órakor a vacsorázóhelyeket mutatja, stb…).
- YMYL létezik/létezett – 15 tényező orvosi, pénzügyi és jogi témákhoz kapcsolódóan
- A feltérképezés mélysége rangsorolási tényező (a legjobb oldalak 1 kattintásra a kezdőlaptól, fontos oldalak <3)
- A főoldalakról származó backlinkek fontosabbak, mint a belső oldalakról származóak
- A webhelyére történő keresési lekérdezések száma rangsorolási tényező (több = jobb)
- A Wikipédiáról érkező forgalom rangsorolási tényező
- Ha az URL az utolsó a keresési munkamenetben (a felhasználó megtalálta, amire szüksége van) – ez pozitívan befolyásolja a rangsorolást.
- Minél több felhasználó tesz könyvjelzőt az URL-edre, annál több tényező értéke van.
- Külön rangsorolási tényezők a rövid videók esetében (TikTok, Shorts, Reels)
- Az oldalon található térképek js-api (pl. Google Maps) rangsorolási faktor.
- A kulcsszavak az URL-ben rangsorolási tényező (optimális lenne, ha legfeljebb 3 szót tartalmazna a kereső kifejezésből)
- A visszatérő felhasználók rangsorolási tényező (a jó ügyfélmegtartással rendelkező termékek építése előnyös a SEO-nak)
- A nagybetűk aránya a <title>-ben rangsorolási tényező a spam elleni küzdelemben.
- A közvetlen forgalom százalékos aránya rangsorolási tényező (ha az összes forgalom organikusan érkezik, az gyanús és negatívan befolyásolja a rangsorolást).
- Az oldalra beágyazott videó jót tesz a rangsorolásnak; a tartalom minősége rangsorolási tényező.
- Ha a backlinkek horgonyai tartalmazzák a keresési lekérdezésben szereplő kulcsszavak összes szavát – ez jó a SEO szempontjából (Exact Match Anchor Text).
- A jó backlinkek és a rossz backlinkek aránya rangsoroló tényező
- A domain szövegek általános minőségi rangsora (azaz a gyenge minőségű tartalommal rendelkező oldalak kihatással vannak az egész domainre.)
- A hirdetések mennyisége egy oldalon (kevesebb = jobb)
- Ha az oldal használja a Google Analytics-et, az pozitív rangsorolási tényező
- A PageRank szerint a legjobb 100 weboldalról származó backlinkek speciális hatással vannak a rangsorolásra
Aki foglalkozik keresőoptimalizálással, annak aligha kell ecsetelni milyen értéke van ennek a kiszivárogtatásnak. Rengeteg eddig csak feltételezett rangsorolási tényezőről bizonyosodott be, hogy valóban rangsorolási tényezők.
Kiderült például, hogy egyes weboldalak (TikTok, Wikipedia, Youtube, stb.) speciális eljárást élveznek. Bár a fenti listából nem látszik, de az eddig látottak alapján a felhasználói viselkedésre vonatkozó tényezőknek nagyon nagy súlya van (a Google tagadja, hogy ezt figyelembe venné a rangsorolásnál)
De természetesen ismét hangsúlyozni kell, hogy a Yandex nem a Google, tehát nem biztos, hogy ezek a rangsorolási faktorok a Google esetén is rangsorolási faktoroknak minősülnek.
Ugyanakkor ez a lista elképesztő lehetőség minden SEO szakember számára, hogy a világ élvonalába tartozó keresőmotor logikájába belelásson és ezt beépítse a napi munkájába.
Tervezem, hogy a SEO Klubban a teljes anyagot magyar nyelven, magyarázatokkal elérhetővé teszem, de még nem mértem fel teljesen a munka nagyságát. Úgy tűnik, hogy a kódban nem csak a rangsorolási szignálok, hanem azok súlya is elérhető, ez azonban nem könnyen kinyerhető információ, egyelőre nem tudom, hogy boldogulok e vele (ezt azonban a Yandex gépi tanulásos algoritmusa tovább súlyozza.) Ha érdekel iratkozz fel a klub várólistájára.
A kiszivárgott listán letöltheted innen.
Végszó
A ChatGPT után alig két hónappal itt van nekünk a Yandex szivárogtatása. Ahogy a bevezetőben is írtam véleményem szerint ez alapjaiban fogja megváltoztatni a SEO szakmát, hiszen kezünkben lesz egy teljes lista a világ negyedik legnagyobb keresőmotorjának rangsorolásáról.
Nyilván a gépi tanulás és a mesterséges intelligencia a jövőben alaposan megkeveri kártyákat és a Yandex nem azonos a Google-lel, de mégis elképesztő hiteles információmennyiséghez jutottunk most hozzá.