A ChatGPT megjelenése után robbanásszerű érdeklődés van a mesterséges intelligencia iránt. A Google sincs elmaradva ezen a téren, bár lépéshátrányba került.
Ebben a cikkben összefoglalom, hogy állnak a Google mesterséges intelligencia kutatásai és alkalmazásai, kifejezetten a Google Keresésre fókuszálva. A jobb érthetőség kedvéért időrendben haladok.
A Google elsősorban azért használja a mesterséges intelligenciát, hogy jobban megértse az emberi nyelvet. Ennek köszönhetően:
- jobban megérti a felhasználók keresési szándékát, így pontosabb találatokat tud adni nekik
- jobban megérti a weboldalak tartalmát, és tudja értékelni a tartalom minőségét, hasznosságát
A mesterséges intelligencia megjelenése a Google keresőjében: a RankBrain
A Google 2015-ben vezette be először a mesterséges intelligencia használatát a keresőben. Ez volt a RankBrain algoritmus.
A Rank Brain algoritmus elsődleges feladata, hogy megértse a felhasználó keresési szándékát. A Google-ba érkező keresések 15%-a évek óta teljesen új, olyan, amit a keresőmotor sosem látott. Ezeknél felismerni a keresési szándékot igen nehéz feladat.
A RankBrain algoritmus segít meghatározni a konkrét keresés tágabb összefüggéseit és azt, hogy az hogyan kapcsolódik a valós világ dolgaihoz (az un. entitásokhoz).
A Rankbrain indulásakor csak azon kereséseknél alkalmazták, amely teljesen új volt a keresőmotor számára, ma már azonban széles körben, sok lekérdezésben, minden nyelven és régióban használják. Magyarul is.
A RankBrain segíti a Google-t a keresési eredmények rangsorolásában, és része a rangsorolási algoritmusnak.
Íme egy, a Google által megadott példa a RankBrain használatára: ha a „hogyan nevezzük a táplálkozási lánc legmagasabb szintjén lévő elemét?” kifejezésre keresünk, a Google rendszerei a különböző oldalakon található szavak láttán megtanulják, hogy a táplálkozási lánc fogalmának köze lehet az állatokhoz, de nem az emberhez. Azáltal, hogy megérti és megfelelteti ezeket a szavakat a kapcsolódó fogalmakkal, a RankBrain segít a Google-nek megérteni, hogy a felhasználó által keresett fogalom a „csúcsragadozó”.
Látható, hogy a Google RankBrain már nem karaktereket és szavakat keres, hanem értelmezi azok jelentését.
Néhány adat a Rankbrain mesterséges intelligenciáról:
- Elindítás éve: 2015
- Rangsoroláshoz használják: Igen
- A lekérdezés és a tartalom nyelvét vizsgálja
- Minden nyelven működik
- Nagyon gyakran használják számos lekérdezéshez
Megjelenik a neurális illesztés 2018-ban
A neural matching, vagy magyarul neurális illesztés volt a következő mesterséges intelligencia, amelyet a Google a kereséseknél alkalmazott.
2018-ban jelent meg, majd 2019-ben a helyi keresési eredményekre is kiterjesztették. A Neurális illesztés segít a Google-nak megérteni, hogy a szavak hogyan kapcsolódnak fogalmakhoz. A Google elmondása szerint ez egyfajta „szuper-szinoníma rendszerként is értelmezhető”
Egy példával élve, ha azt mondjuk, hogy „Az erő legyen veled”, akokr a Google tudni fogja, hogy a Csillagok háborúja témáról van szó.
Ma a neurális illesztést sok, ha nem a legtöbb lekérdezésnél használják, minden nyelven, minden régióban, a keresés legtöbb vertikális területén. A neurális megfeleltetés kifejezetten segíti a Google-t a keresési eredmények rangsorolásában, és része a rangsorolási algoritmusnak.
A Neurális illesztés adatai:
- Elindítás éve: 2018
- Rangsoroláshoz használt: Igen
- A lekérdezés és a tartalom nyelvét vizsgálja
- Minden nyelv esetében működik
- Nagyon gyakran használják számos lekérdezéshez
A Google Bert-algoritmus
A BERT, Bidirectional Encoder Representations from Transformers, 2019-ben érkezett meg.
Ez egy neurális hálózat alapú technika amely természetes nyelvek feldolgozását segíti.
A Google elmondta, hogy a BERT segít a Google-nek megérteni, hogy a szavak kombinációi hogyan fejeznek ki különböző jelentéseket és szándékokat, többek között a szavak sorrendjét is vizsgálja egy oldalon, így még a látszólag jelentéktelen szavakkal is számolnak a lekérdezésekben.
Amikor a BERT elindult, az összes angol nyelvű lekérdezés 10%-ában használták. Ma már a legtöbb lekérdezésben használják, és minden nyelven támogatott. A BERT segíti a Google-t a keresési eredmények rangsorolásában, és része a rangsorolási algoritmusnak.
Főbb adatok a BERT mesterséges intelligenciáról:
- Elindítás éve: 2019
- Rangsoroláshoz használt: Igen
- A lekérdezés és a tartalom nyelvét vizsgálja
- Minden nyelven működik, de a Google szerint a BERT „szinte minden angol nyelvű lekérdezésnél kritikus szerepet játszik”.
- Nagyon gyakran használják számos lekérdezéshez
A Google MUM mesterséges intelligenciája
A MUM, azaz a Multitask Unified Model a Google egyik legújabb mesterséges intelligenciája a keresésben. A MUM-ot 2021-ben vezették be, majd 2021 végén ismét kibővítették több alkalmazáshoz, és a jövőben sok ígéretes felhasználási lehetőséget kínál.
A Mum a T5 modellen alapul (Text-To-Text Transfer Transformer) és a Google elmondása szerint 1000-szer erősebb, mint elődje a BERT.
A Google szerint a MUM nemcsak a nyelvek megértésében, hanem a nyelvek generálásában is segíti a Google-t, így új kifejezések és nyelvek variációinak megértéséhez is használható.
Képes dokumentumokat összegezni, kérdésekre válaszolni és e tekintetben képes arra amire a ChatGPT.
A MUM-ot hivatalosan nem használják rangsorolási célokra a Google keresőben, de minden nyelvet és régiót támogat.
- Elindítás éve: 2021
- Rangsoroláshoz használják: Nem
- Nem lekérdezés- vagy nyelvspecifikus
- Minden nyelven működik, de a Google jelenleg nem használja rangsorolási célokra.
- Korlátozott számú célra használják
A Google LaMDA mesterséges intelligenciája
A Google 2021 tavaszán jelentette be a LaMDA modelljét. A LaMDA-t (Language Models for Dialog Application) azért hozták létre, hogy a szoftverek jobban részt tudjanak venni egy gördülékeny és természetes beszélgetésben. A LaMDA a Google Transformer nyílt-kódú neurális hálózatán alapszik.
E tekintetben tehát a LaMDA hasonlít leginkább az OpenAI Chatbotjához.
A LaMDA ugyanazon a transzformátor-architektúrán alapul, mint más nyelvi modellek, például a BERT és a GPT-3. A képzésének köszönhetően azonban a LaMDA képes megérteni az árnyalt kérdéseket és a több különböző témát felölelő beszélgetéseket.
A LaMDA 1,56 trillió szóval képezték és 137 milliárd paraméterrel rendelkezik.
A Google Lamda chatbotja körül botrány tört ki, amikor egy Google alkalmazott Blake Lemoine nyilvánosságra hozta a beszélgetését a Chatbot-tal és azt állította, hogy az egy 7-8 éves gyermek szellemi és érzelmi képességeivel rendelkezik és hogy érző entitásról van szó.
Aki használta a ChatGPT-t annak ez talán nem megdöbbentő állítás.
A Google PaLM mesterséges intelligenciája
A PaLM nyelvi mesterséges intelligencia-modell mely hatalmas, nagy teljesítményű, és egy nagyszabású elképzelés első építőköve.
A PaLM 540 milliárd paraméterével az egyik legnagyobb a maga nemében. A Google testvérvállalata, a Deepmind 2021 decemberében mutatta be a Gopher nevű, 280 milliárd paramétert tartalmazó modellt, amely számos nyelvi feladatban képes volt legyőzni az OpenAI jól ismert, 175 milliárd paramétert tartalmazó GPT-3 nyelvi AI-ját. Az Nvidia és a Microsoft közösen képezte ki az 530 milliárd paraméteres Megatron modellt. Mindezek a rendszerek a Transformer architektúrán alapulnak.
A PaLM-ot magas minőségű webes dokumentumokból, könyvekből és GitHub kódokból tanították.
A modell például állítólag képes megkülönböztetni okot és okozatot, megérti a kifejezések kombinációit a megfelelő összefüggésekben, és még egy filmet is képes kitalálni az emojik alapján.
Google és a DeepMind Sparrow Chatbotja
A DeepMind a Google mesterséges intelligencia fejlesztéssel foglalkozó leányvállalata, ahol olyan fejlesztések történnek, amelyek aztán alkalmazhatóak a google termékeiben, akár a keresésben is.
A Google ezidáig nem állt elő olyan mesterséges intelligencia alkalmazással, mint az OpenAI ChatGPT-je, elsősorban biztonsági okokból.
A ChatGPT körül kialakul hype miatt azonban a Google-nál „vörös-kódot” adtak ki, mivel a nyelvi modelleken alapuló Chatbotok elképzelhető konkurenciát jelentenek a Google keresője számára.
A Google bejelentette, hogy 2023-ban több mint 20 új szolgáltatással lép elő, amelyek mestersége intelligencián alapulnak majd.
Ezek egyike lehet a DeepMind Sparrow elnevezésű ChatBot-ja, amely 2022 őszén jelent meg, nem publikus formában. A hírek szerint ez lesz elérhető a nyilvánosság számára is 2023-ban.
A Sparrow a DeepMind Chinchilla nyelvi modelljén alapul és bár kevesebb paraméterrel rendelkezik, mint az OpenAI GPT-je, azonban rengeteg adattal lett betanítva és a Google-n keresztül hozzáfér az internethez, így naprakész adatokat tud adni.