Ugrás a tartalomra

Új szint a magyar nyelvi mesterségesintelligencia-kutatásban

Hírek

Az ELKH Nyelvtudományi Kutatóközpont (NYTK) kutatói két, világszínvonalon is jelentős nyelvmodellt fejlesztettek ki az ELKH infrastruktúra-fejlesztési pályázatán elnyert szuperszámítógépeken, neurális technológiát használó gépi tanulási algoritmusok segítségével.

A magyar nyelvre elkészült első GPT-3 típusú mesterséges intelligencia, a HILANCO-GPTX a Nyelvtudományi Kutatóközpont és a Pécsi Tudományegyetem közös fejlesztéseként született meg. Az angol és magyar nyelven egyaránt folyékony kommunikációra és szövegelőállításra is alkalmas rendszer akár még programkódot is képes generálni. Ennek a kétnyelvű rendszernek a betanításához a fejlesztők egy 102 milliárd szavas angol és egy 25 milliárd szavas magyar szövegkorpuszt használtak fel. A három hónapon át tartó gépi tanulás eredményeképpen létrejött nyelvi mesterséges intelligencia mindkét nyelven jól szerkesztett mondatokat képes alkotni, sőt akár még fordítani is tud a két nyelv között.

A Nyelvtudományi Kutatóközpont munkatársai a fenti technológiát és szuperszámítógép-rendszert használva elkészítettek egy az előzőnél is nagyobb magyar nyelvű anyagon tanított nyelvmodellt, a PULI GPT-3SX-et. Ez egy 32 milliárd szóból álló, csak magyar nyelvű szövegeket tartalmazó anyagon tanult magyarul.

Nonprofit kutatás-fejlesztési célokra mindkét nyelvmodell ingyenesen elérhető, demó változatuk kipróbálható:

  • a HILANCO-GPTX itt;
  • a PULI GPT-3SX itt.

Az NYTK kutatói e két rendszerről és más új kutatási eredményeikről Mesterséges intelligencia és a magyar nyelv címmel rendezvényt szerveznek 2022. november 23-án 16 órakor az MTA Székház Dísztermében. A Magyar Tudomány Ünnepe programsorozat keretében tartandó eseményre a kutatók a témához kapcsolódó előadásokkal és bemutatóval készülnek.

Az eseményről bővebb információt találnak annak hivatalos weboldalán.