Egy korábbi Yandex alkalmazott kiszivárogtatta a Yandex, az orosz keresőmotor forráskódjainak egy részét, köztük a keresőmotor közel 2000 rangsorolási szignálját.

Miért érdekes a Yandex szivárogtatás?

Talán nem túlzás ezt ez az elmúlt évek legérdekesebb SEO eseményének nevezni, hiszen a Yandex a világ egyik élvonalbeli keresőmotorja, jelenleg a világpiacon a 4. legnagyobb szerepelő, amely Oroszországban a Google-t is maga mögé tudta szorítani.

A Yandex orosz internetes keresőmotor és webes szolgáltatásokat kínáló cég. A céget 1997-ben alapították Oroszországban. Jelenleg a legnagyobb orosz keresőmotor, melynek piaci részesedése meghaladja a 60%-ot. Világszinten a Google, Bing, Baidu után a 4. legnagyobb keresőmotor.
Yandex a kereső mellett több webes szolgáltatást is kínál, beleértve e-mail, online tárhelyet, fényképtárat, online pénztárcát, és online üzletet. A cég üzleti tevékenysége túlterjed Oroszországon, érinti Ukrajnát, Belaruszt, Kazahsztánt és Türkmenisztánt is.
A Yandex a Bécsi Értéktőzsdén (Wiener Börse) és a Moszkvai Értéktőzsdén (MOEX) is jegyzett cég.

Forrás: ChatGPT, emberi ellenőrzéssel

De a mostani szivárgás nem csak emiatt fontos keresőoptimalizálási szempontból.

  • A Yandex számos korábbi Google alkalmazottat foglalkoztat
  • a Yandex-et emiatt is egyfajta Google-klónnak tartják, és érdekes módon a kiszivárgott rangsorolási tényezők legelső eleme éppen a PageRank
  • a Yandex és a Google találati listája nagyban hasonló, ami a találatokat illeti, azaz rangsorolási algoritmusuk hasonló ereményeket hoz, mint a Google-é
  • végül a Yandex-re optimalizáló SEO szakemberek hasonló technikákat alkalmaznak, mint a Goole-re optimalizálók.

Mindazonáltal a Yandex nem a Google, így a most kiszivárgott rangsorolási szignálok nem feleltethetőek meg egy-az egyben a Google rangsorolási szignáljainak. Mindazonáltal elképesztően érdekes belelátni az élvonalbeli keresőmotor működésébe.

Hogy szivárgott ki a kód és mennyire hiteles?

A kiszivárgott kód egy népszerű hack fórumon jelent meg torrentként.

Hirdetés

hirdetés
a yandex forráskódját kiszivárogtató fórum

A Bleeping Computer szerint a kiszivárgott anyagok:

„44,7 GB fájlból állnak, amelyeket 2022 júliusában loptak el a cégtől. Ezek a kódtárak állítólag a cég összes forráskódját tartalmazzák a spamellenes szabályokon kívül.”

Arseniy Shestakov programozó elemzése szerint a forráskódok a Yandex alábbi szolgáltatásait érinti:

  • Yandex keresőmotor és indexelő bot
  • Yandex Térképek
  • Alice (AI asszisztens)
  • Yandex Taxi
  • Yandex Direct (hirdetési szolgáltatás)
  • Yandex Mail
  • Yandex Disk (felhőalapú tárhelyszolgáltatás)
  • Yandex Market
  • Yandex Travel (utazási foglalási platform)
  • Yandex360 (munkaterület-szolgáltatás)
  • Yandex Cloud
  • Yandex Pay (fizetés-feldolgozási szolgáltatás)
  • Yandex Metrika (internetes analitika)

A Yandex közleménye szerint:

„A Yandexet nem hackelték meg. Biztonsági szolgálatunk egy belső adattárból származó kódrészleteket talált a nyilvánosság számára elérhető felületeken, de a tartalom eltér a Yandex szolgáltatásaiban használt adattár jelenlegi verziójától.”

Az tehát egyértelmű, hogy a kiszivárgott file-ok valósak, így a rangsorolási szignálok is valamikor a Yandex algoritmusának részei volt. Hogy a mostani rangsorolás mennyiben tér el a kiszivárgott verziótól az nem tudható.

Grigory Bakunov a Yandex egykori munkatársa a Bleeping Computernek nyilatkozva elmondta, hogy a szivárogtatás mögött vélhetően politikai motiváció állt, mivel a szivárogtató nem kért pénzt az adatokért, és személyes adatok sem kerültek nyilvánosságra. Becslése szerint a nyilvánosságra hozott kód 90%-ban lehet azonos az aktuálisan használt verzióval.

A Yandex rangsorolási szignáljai

A kiszivárgott rangsorolási szignálok elképesztően érdekesek. Elkezdtem a feldolgozásukat, de még csak nagyjából 15%-kal végeztem (az anyag részben angol, részben orosz nyelven íródott).

Szerencsére nemzetközi szinten sokan jobban állnak az anyag feldolgozásából, így most ezekből is tudok válogatni. A teljesség igénye nélkül néhány a Yandex rangsorolási faktorai közül:

  • A linkek kora rangsorolási tényező
  • A forgalom és az organikus forgalom %-a rangsorolási tényező
  • A számok az URL-ekben rossz hatással vannak a rangsorolásra
  • Az URL-ekben lévő sok kötőjel rossz hatással van a rangsorolásra
  • Létezik kemény büntetés, amikor az oldal PageRank értéke lenullázódik
  • A tárhely megbízhatósága rangsorolási tényező (kevesebb 4xx/5xx hiba, jobb az organikus forgalom szempontjából)
  • Külön rangsorolási tényező a Wikipédia jobb rangsorolásához
  • Sok rangsorolási tényező kapcsolódik a felhasználói viselkedéshez – CTR, utolsó kattintás, oldalon töltött idő, visszalépési arány.
  • A dokumentum kora és az utolsó frissítés, mindkettő rangsorolási tényező.
  • A domain átlagos pozíciója az összes lekérdezésben rangsorolási tényező.
  • A napszak és a hét napja hatással van a keresési eredményekre (pl. a hozzám közeli éttermek 10 órakor a reggelizőhelyeket, míg délután 4 órakor a vacsorázóhelyeket mutatja, stb…).
  • YMYL létezik/létezett – 15 tényező orvosi, pénzügyi és jogi témákhoz kapcsolódóan
  • A feltérképezés mélysége rangsorolási tényező (a legjobb oldalak 1 kattintásra a kezdőlaptól, fontos oldalak <3)
  • A főoldalakról származó backlinkek fontosabbak, mint a belső oldalakról származóak
  • A webhelyére történő keresési lekérdezések száma rangsorolási tényező (több = jobb)
  • A Wikipédiáról érkező forgalom rangsorolási tényező
  • Ha az URL az utolsó a keresési munkamenetben (a felhasználó megtalálta, amire szüksége van) – ez pozitívan befolyásolja a rangsorolást.
  • Minél több felhasználó tesz könyvjelzőt az URL-edre, annál több tényező értéke van.
  • Külön rangsorolási tényezők a rövid videók esetében (TikTok, Shorts, Reels)
  • Az oldalon található térképek js-api (pl. Google Maps) rangsorolási faktor.
  • A kulcsszavak az URL-ben rangsorolási tényező (optimális lenne, ha legfeljebb 3 szót tartalmazna a kereső kifejezésből)
  • A visszatérő felhasználók rangsorolási tényező (a jó ügyfélmegtartással rendelkező termékek építése előnyös a SEO-nak)
  • A nagybetűk aránya a <title>-ben rangsorolási tényező a spam elleni küzdelemben.
  • A közvetlen forgalom százalékos aránya rangsorolási tényező (ha az összes forgalom organikusan érkezik, az gyanús és negatívan befolyásolja a rangsorolást).
  • Az oldalra beágyazott videó jót tesz a rangsorolásnak; a tartalom minősége rangsorolási tényező.
  • Ha a backlinkek horgonyai tartalmazzák a keresési lekérdezésben szereplő kulcsszavak összes szavát – ez jó a SEO szempontjából (Exact Match Anchor Text).
  • A jó backlinkek és a rossz backlinkek aránya rangsoroló tényező
  • A domain szövegek általános minőségi rangsora (azaz a gyenge minőségű tartalommal rendelkező oldalak kihatással vannak az egész domainre.)
  • A hirdetések mennyisége egy oldalon (kevesebb = jobb)
  • Ha az oldal használja a Google Analytics-et, az pozitív rangsorolási tényező
  • A PageRank szerint a legjobb 100 weboldalról származó backlinkek speciális hatással vannak a rangsorolásra

Aki foglalkozik keresőoptimalizálással, annak aligha kell ecsetelni milyen értéke van ennek a kiszivárogtatásnak. Rengeteg eddig csak feltételezett rangsorolási tényezőről bizonyosodott be, hogy valóban rangsorolási tényezők.

Kiderült például, hogy egyes weboldalak (TikTok, Wikipedia, Youtube, stb.) speciális eljárást élveznek. Bár a fenti listából nem látszik, de az eddig látottak alapján a felhasználói viselkedésre vonatkozó tényezőknek nagyon nagy súlya van (a Google tagadja, hogy ezt figyelembe venné a rangsorolásnál)

De természetesen ismét hangsúlyozni kell, hogy a Yandex nem a Google, tehát nem biztos, hogy ezek a rangsorolási faktorok a Google esetén is rangsorolási faktoroknak minősülnek.

Ugyanakkor ez a lista elképesztő lehetőség minden SEO szakember számára, hogy a világ élvonalába tartozó keresőmotor logikájába belelásson és ezt beépítse a napi munkájába.

Tervezem, hogy a SEO Klubban a teljes anyagot magyar nyelven, magyarázatokkal elérhetővé teszem, de még nem mértem fel teljesen a munka nagyságát. Úgy tűnik, hogy a kódban nem csak a rangsorolási szignálok, hanem azok súlya is elérhető, ez azonban nem könnyen kinyerhető információ, egyelőre nem tudom, hogy boldogulok e vele (ezt azonban a Yandex gépi tanulásos algoritmusa tovább súlyozza.) Ha érdekel iratkozz fel a klub várólistájára.

A kiszivárgott listán letöltheted innen.

Végszó

A ChatGPT után alig két hónappal itt van nekünk a Yandex szivárogtatása. Ahogy a bevezetőben is írtam véleményem szerint ez alapjaiban fogja megváltoztatni a SEO szakmát, hiszen kezünkben lesz egy teljes lista a világ negyedik legnagyobb keresőmotorjának rangsorolásáról.

Nyilván a gépi tanulás és a mesterséges intelligencia a jövőben alaposan megkeveri kártyákat és a Yandex nem azonos a Google-lel, de mégis elképesztő hiteles információmennyiséghez jutottunk most hozzá.

Szerző: Szuhi Attila

Üdv! Szuhi Attila vagyok, az ITE.hu alapítója és főszerkesztője. Fő területem a keresőoptimalizálás és az online marketing. Speciális szakterületem a Google büntetések, a technikai SEO Audit és a linképítés.
Ha segítségre van szükséged, keress bátran.

Írd meg a véleményed!

Az e-mailcímed nem lesz nyilvános. A * jelölt mezők kötelezőek.

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

Cikkek a témában

január 29, 2023

286MEGOSZTÁSFacebookFeliratkozás Egy korábbi Yandex alkalmazott kiszivárogtatta a Yandex,

augusztus 22, 2022

286MEGOSZTÁSFacebookFeliratkozás Megmutatom, hogy hogyan tudod a helyesírást ellenőrizni

május 12, 2022

286MEGOSZTÁSFacebookFeliratkozás A Google a közeljövőben bevezeti az MST-skálát,

április 11, 2022

286MEGOSZTÁSFacebookFeliratkozás Ha internetes keresés, akkor Google! Vagy mégsem?


INGYENES!

TÖLTSD LE A GOOGLE 100 SEO TANÁCSÁT

A Google 100 legfontosabb keresőoptimalizálási tanácsa!