Nová naděje pro ohroženou romštinu

V letošním roce byl zahájen projekt „Sběr a zpracování jazykových dat s cílem vytvořit jazykové technologie pro revitalizaci romštiny“, jehož cílem je vybudovat digitální korpus romštiny (DKR) - archiv ohroženého jazyka, který bude vhodný pro postupnou tvorbu počítačových programů sloužících jazykové revitalizaci.

Výzkumný tým se chce zaměřit na více romských dialektů a postupně vytvářet počítačové programy sloužící jazykové revitalizaci. Nejprve budou zmapovány dostupné jazykové zdroje a budou shromážděny do jednoho repositoria (DKR, viz výše). Dále budou kategorizovány, katalogizovány a vyhodnoceny z hlediska vhodnosti pro daný záměr. Souběžně bude mapováno technologické zázemí zvláště se zaměřením na možnosti vytvoření neuronálního strojového překladu.

Výsledky tohoto projektu budou v další etapě sloužit k tvorbě digitálních nástrojů, které by měly pomáhat mluvčím romštiny k uchovávání a oživování jejich jazyka a jeho předávání mladším generacím. Veřejná část digitálního korpusu romštiny umožní běžným uživatelům tohoto jazyka vyhledávat výskyty a formy výrazů, někdy už zapomenuté, dále syntaktické vazby a sémantické vztahy, otázky spojené s pravopisem a podobně. Pro učitele romštiny bude DKR představovat důležitý zdroj v případě, že budou potřebovat dohledat autentické romské texty/věty. Překladatelům mezi romštinou a dalšími jazyky korpus umožní ověřování jazykových forem a stavu úzu romštiny. Lingvistům umožní frekvenční rešerše, stane se tedy základem pro další kvantitativní výzkum jazyka a podpoří další materiálově (empiricky) zaměřené studie. Uvedení metainformací u jednotlivých segmentů korpusu umožní filtrovat data podle synchronní, či diachronní perspektivy (temporální třídění), čili bude možné vyfiltrovat nejnovější úzus a odlišit jej od starších formulací. - Soupis sebraných elektronických zdrojů (na webové stránce projektu) umožní jak běžným uživatelům romštiny, tak odborné veřejnosti získat přehled o dostupných dílčích zdrojích pro jejich další případné rešerše.

Hlavním řešitelem je PhDr. Tomáš Svoboda, Ph.D. z Ústavu translatologie Filozofické fakulty Univerzity Karlovy. Hlavním spoluřešitelem je Mgr. Zbyněk Andrš, Ph.D. z Katedry sociální a kulturní antropologie Univerzity Pardubice.

Projekt byl podpořen Úřadem vlády ČR v rámci programu EC - Podpora implementace Evropské charty regionálních či menšinových jazyků.

Podporují nás

Bader Philanthropies, Inc. Úřad vlády ČR MHMP MKČR MŠMT Americké velvyslanectví v Praze Česko-německý fond budoucnosti Goethe Institut