Egyetem

Az SZTE kutatói magyar nyelvi elemzőrendszert készítettek

2022. április 26., kedd

Az SZTE kutatói magyar nyelvi elemzőrendszert készítettek

A HuSpaCy egy olyan magyar nyelvi elemzőrendszert, amely a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében valósult meg a fejlesztés, és a Szegedi Tudományegyetem kutatói készítették el. Szabadon hozzáférhetővé tették a mesterséges intelligencián alapuló nyelvi elemzőrendszert.

A SZTAKI közleményében felidézik, hogy a magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak.

Farkas Richárd, az SZTE kutatója elmondta, hogy a kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítették el. Kiemelte, hogy erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek által is értelmezhető nyelvtani szimbólumokra építenek, így