Mi az a Google LaMDA?
A LaMDA, azaz a Language Model for Dialogue Applications (Nyelvi modell a párbeszédes alkalmazásokhoz) a Google által kifejlesztett neurális társalgási nyelvi modellek családja.
A Google a LaMDA első generációját a 2021-es Google I/O Keynote konferencián jelentették be, míg a LaMDA második generációját egy évvel ezt követően.
A LaMDÁ-t 1,56 trillió szóval képezték ki, amely a szabad webről és egyéb dokumentumokból származott.
A LaMDA a szakmai közvéleményen túl akkor kapott nagy figyelmet, amikor a Google egyik mérnöke, Blake Lemoine azt állította, hogy a chatbot tudatára ébredt érző lénnyé vált. Lemoine-t a Google felfüggesztette és a szakma nem adott hitelt a szavainak, de felmerült a kérdés, hogy mennyire ellenőrizhető, egy számítógép mesterséges intelligenciája.
2023 február 7-én a Google bejelentette, hogy a LaMDA nyelvi modellnek egy egyszerűsített változatára alapozva elindítja a Google Bard-ot, amely egy mesterséges intelligencia alapú dialógusokra képes chatbot.
A Bard a Google válasza a OpenaAI ChatGPT rendkívüli népszerűségére.
Mi az a nyelvi modell?
A mesterséges intelligenciában a nyelvi modell egy olyan számítási modell, amelyet arra használnak, hogy megjósolják egy természetes nyelvben található szavak sorozatának valószínűségét. A nyelvi modell célja, hogy bizonyos kontextus mellett valószínűséget rendeljen minden lehetséges szósorozathoz, és ezt felhasználva olyan új szöveget hozzon létre vagy ismerjen fel, amely stílusában és jelentésében hasonlít a ahhoz a szöveghez, amelyből tanult. A nyelvi modelleket számos alkalmazásban használják, például gépi fordításban, szövegosztályozásban, beszédfelismerésben stb.
MI/
AI
hírlevél
Iratkozz fel most a mesterséges intelligencia alkalmazási lehetőségeivel foglalkozó hírlevelemre
0% spam, csak MI Adatvédelem és ÁSZF
Hogyan működik a LaMDA?
A LaMDA egy csak-dekódoló transzformátor nyelvi modellt használ. Előzetesen egy 1,56 trillió szóból álló, dokumentumokat és párbeszédeket egyaránt tartalmazó szövegen képzik ki, majd manuálisan ellenőrzött módszerekkel finomítják, hogy a párbeszédek megfeleljenek az érzékenység, az érdekesség és a biztonsági szempontoknak.
A Google tesztjei szerint a LaMDA válaszai meghaladták egy átlagos ember válaszait érdekességi szempontból. A ténybeli pontosságot az biztosítja, hogy a LaMDA együttműködik egy külső információgyűjtő rendszerrel.
Három különböző modellt teszteltek, a legnagyobb modell 137 milliárd nem beágyazott paraméterrel rendelkezett. A „paraméter” olyan értéket jelent, amelyet a modell a tanulás során önállóan változtathat. A paraméterek a modellnek a korábbi képzési adatokból tanult részei, és lényegében meghatározzák a modell készségét egy problémára, például a szöveggenerálásra.
A Google LaMDA történelme
A LaMDA első generációja
A Google a 2021. május 18-i Google I/O keynote során jelentette be a LaMDA beszélgető neurális nyelvi modellt, amely mögött mesterséges intelligencia áll. 2017-ben a Google Research által kifejlesztett Transformer neurális hálózati architektúrára építve a LaMDA-t emberi párbeszédeken és történeteken képezték ki, így képes nyílt végű beszélgetésekben részt venni. A Google szerint a LaMDA által generált válaszok garantáltan „értelmesek, érdekesek és a kontextusra jellemzőek”.
A LaMDA annyiban hasonlít a Google BERT és MUM modelljeihez, hogy képes szavakat olvasni, megérti a szavak közötti kapcsolatot egy mondatban, és képes előrejelezni a következő szót egy szövegben.
Ugyanakkor a LaMDA modellt kifejezetten párbeszédeken képezték, és képes specifikus és értelmes válaszokat adni a túl általános válaszok helyett, amelyek nem elégítik ki a felhasználót.
A Google blogbejegyzése szerint a LaMDA nem csak specifikus és értelmes válaszokat ad, de a arra is törekedtek, hogy a modell meglepő, érdekes, szellemes és váratlan válaszokat adjon, amellett, hogy ténybelileg helyes válaszokat ad.
A Google a LaMDA modellt nem integrálta a keresőjébe és algoritmusaiba.
A LaMDA második generációja
A Google 2022. május 11-én (szintén a Google I/I keynote konferencián) mutatta be a LaMDA 2-t, amely a LaMDA utódjaként szolgál.
A modell új verziója számos forrásból merít szövegpéldákat, és ezek segítségével egyedi „természetes beszélgetéseket” fogalmaz meg olyan témákról, amelyekre nem feltétlenül volt betanítva.
Emellett a Google elindította az AI Test Kitchen-t, egy LaMDA 2 által működtetett mobilalkalmazást. Az eredetileg csak a Google alkalmazottai számára elérhető alkalmazás 2022 augusztusától kezdve bárki számára elérhető, aki feliratkozik a várólistára.
Viták a LaMDA-2 körül
A LaMDA-2 akkor kapott nagyobb nyilvánosságot, amikor a Google egyik mérnöke Blair Lemoine kiszivárogtatott egy a LaMDA-2-vel folytatott párbeszédet. Lemoine azt állította, hogy a beszélgetés során arra következtetésre jutott, hogy a mesterséges intelligencia öntudattal rendelkezik és egy gyermek szintjén képes kifejezni az érzéseit és gondolatait.
Lemoine állítása szerint, ha nem tudná, hogy egy chatbottal beszélget, az lenne az érzése, hogy egy 7-8 éves gyerekkel kommunikál, aki történetesen sokat tud a fizikáról.
A Google tagadta az állításokat és Lemoine-t felfüggesztették az állásából, mivel megszegte a cég szabályzatát.
Az IT szakmán belül nagyjából egyetértés volt, hogy Lemoine félreértelmezte a tapasztalatait, de élénk vitát generált azzal kapcsolatban, hogy vajon a tesztjeink képesek lennének-e azonosítani egy öntudatra ébredő mesterséges intelligenciát.
Google Bard
2023 február 6-án a Google bejelentette, hogy a LaMDA modelljére építve elindítja a Google Bard-ot, ami egy chatbot. Induláskor ez csak néhány felhasználó számára elérhető, akik visszajelzést adnak a modellről és a Google ez alapján finomhangolja a Chatbotot.
Majd az ígéretek szerint ez néhány héten belül elérhető lesz a széles nyilvánosság számára is. A Google hangsúlyozza, hogy a Bard egy kísérleti alkalmazás, amit a felhasználók visszajelzései alapján fejleszt majd.
A Bard-ot már indulása előtt komoly kritikák érték, mivel a közzétett képernyőmentések alapján úgy tűnik, hogy a normál webes találatokat lejjebb szorítja, ugyanakkor válaszaiban nem hivatkozik forrásokra.