Kas ir MuLa korpuss i deļkuo tys vajadzeigs?

Kas ir MuLa korpuss i deļkuo tys vajadzeigs?

Rokstu sagataveja: portals lakuga.lv

Nacionaluo korpusu kolekceja (NKK) ir daudzveideigu, vysaida veida institucejuos izstruoduotu tekstu i runys korpusu kūpums. Vairums korpusu ir gramatiski markāti i īkļauti vīnuotuos mekliešonys sistemā. Taida veida korpusi ir vajadzeigi lingvistiskom analizem i volūdys tehnologeju izstruodei. Vīns nu NKK paveidu ir “Myusu dīnu latgalīšu tekstu korpuss 2022” (MuLa), kurs ir veiduots, paplašynojūt 2012. godā veiduotū tekstu korpusu ar jaunim olūtim, kuru raksteiba vysvaira atbiļst 2007. godā pījimtajim pareizraksteibys nūsacejumim. Sasazynuojom ar MuLa korpusu projekta zynuotniskū asisteņti Annu Brišku, kab izvaicuotu vaira par projekta atteisteibys gaitu.

2021. godā MuLa veiduotuoji veice anketiešonu, ar mierki nūskaidruot, kas i deļkuo lītoj MuLa korpusu, skaidroj projekta zynuotniskuo asisteņte Anna Briška. Uzrunuotuo mierkauditoreja beja baltu volūdu pietnīki Latvejā i cytuos zemēs, Rēzeknis Tehnologeju akademejis škārsteikla lopys apmaklātuoji, školuotuoji, ari portala lakuga.lv veiduotuoji i skaiteituoji. Tyka sajimtys 214 respondentu atbiļdis. Tūs vydā beja 15 respondenti, kuri korpusu lītoj pietnīcyskūs nūlyukūs. Itei grupa ari īsyuteja vierteigus īsacejumus par tū, kū korpusā vajadzātum uzlobuot. Sovūtīs 43 respondenti par korpusu beja dzierdiejuši, tok tū nalītoj, vairums aptaujis dalinīku par korpusu īprīšk nabeja dzierdiejuši i tū nalītoj. Anketiešonys rezultati ir publicāti zynuotniskūs rokstu izdavuma “Letonika” jaunuokajā numerī ITE.

“Ka MuLa 2012 beja apmāram 1 miļjons vuordlītuojumu, tod niule MuLa 2022 ir divejis reizis leluoks – tymā ir ap 2 miļjonu vuordlītuojumu, nu jauna tyka dalykti teksti, kas ir publicāti, suocūt ar 2012. gods rudini leidz 2021. gods decembram. Teksti tyka papyldynuoti vysuos trejuos lelajuos grupuos – informativī teksti, literarī teksti, tehniskī i specialī teksti,” stuosta Anna Briška.

MuLa 2022 tekstu korpusa saturu veiduoja eksperti nu Rēzeknis Tehnologeju akademejis (Sanita Martena, Antra Kļavinska, Anna Briška, konsuļtante Nicole Nau), Latvejis Universitatis Matematikys i Informatikys instituta (LU MII) (Ilze Sperga). LU MII nūdrūsynoj korpusa tehniskū izveidi i uzturiešonu. MuLa runys korpusa (daīmams ITE) komanda RTA: Sanita Martena, Nicole Nau, Antra Kļavinska, Angelika Juško-Štekele, Armands Kuociņš-Kūceņš, Ausma Sprukte, Anna Briška.

Karteņa: Pīmārs nu MuLa korpusa tekstu mekliešonys.

Tikū kai ir nūsasliedzs div godu projekts “Humanitarūs zineibu digitalī resursi: integraceja i atteisteiba”, kas aizasuoka 2020. gods oktobrī i kū eistynuoja Rēzeknis Tehnologeju akademejis pietnīku dorba grupa kūpdarbeibā ar vēļ ostonim partnerim. Tok niu dorbs pi latgalīšu volūdys korpusu (MuLa i MuLaR) turpynojās ari projektā “Latvīšu volūdys daudzveideiba laikā i telpā”, kas tyka suokts pārņ decembrī i nūsaslēgs 2024. gods beiguos.


Print Friendly, PDF & Email