Ugrás a tartalomra

A mesterséges intelligencia fejlesztését célzó együttműködést indít az NYTK és az Országos Széchényi Könyvtár

Hírek

A mesterséges intelligencia hazai fejlesztését célzó együttműködési megállapodást írt alá Prószéky Gábor, az ELKH Nyelvtudományi Kutatóközpont (NYTK) főigazgatója és Rózsa Dávid, az Országos Széchényi Könyvtár (OSZK) főigazgatója 2023. június 21-én. Az innovációs együttműködés nagy nyelvi modellek építését és nyelvfeldolgozó eszközök létrehozását állítja a középpontba.

A megállapodás értelmében az OSZK számos nagy méretű szövegállományt – köztük a Magyar Elektronikus Könyvtárban (MEK) és az Elektronikus Periodika Archívumban (EPA) elérhető szöveges dokumentumokat, a webarchívumok szöveges állományait, valamint az OSZK Digitális Bölcsészeti Központ (DBK) dHUpla adatbázisában szereplő anyagokat – átad az NYTK-nak, amelynek kutatói e szövegeket is felhasználhatják nagy nyelvi modelljeik építéséhez. Az NYTK szakembereinek már van tapasztalata a nyelvi modellek fejlesztése terén, hiszen ők alakították ki a ChatGPT-hez hasonló funkciókkal rendelkező, magyar nyelvű szöveges anyagokon tanult Puli-GPT-t.

Az NYTK a nemzeti könyvtár szövegei alapján létrehozott nyelvfeldolgozó eszközöket az OSZK számára is hozzáférhetővé teszi. Ezek segítségével többek között a nyelvfelismerés és a webarchiválási tevékenység keretében keletkezett hatalmas mennyiségű tartalom feldolgozása is automatizálhatóvá válik.

A nemzeti könyvtár és az NYTK szakemberei emellett közösen dolgozzák fel és teszik elérhetővé a Magyar Nagylexikon tizenkilenc kötetének anyagát, amely a Magyarországon készített legfrissebb egyetemes magyar nyelvű enciklopédia. A terjedelmes dokumentumot egyrészt egy webes lekérdezőfelületen olvashatóvá és kereshetővé teszik a felhasználók számára, másrészt származtatott erőforrások készülnek belőle, amelyeket a mesterségesintelligencia-kutatással foglalkozó szakemberek kiválóan tudnak majd hasznosítani egyéb eszközök fejlesztéséhez.

Az aláíráson részt vett továbbá a DBK-ból Tamásné Kovács Adrienn igazgató, Mihály Eszter és Simon Eszter munkatársak, továbbá az NYTK képviseletében Lipp Veronika, a Lexikológiai Intézet igazgatója, Váradi Tamás főigazgató-helyettes, a Nyelvtechnológiai és Alkalmazott Nyelvészeti Intézet igazgatója, valamint Simon László, a Lexikai tudásreprezentáció kutatócsoport vezetője is.