Euskararen Erreferentzia Corpus “irekia” aurkeztu du Euskaltzaindiak

2025-04-02

Euskaltzaindiak euskararen corpus “erakusgarria, orekatua eta kalitatezkoa” aurkeztu du Bilbon. Hizkuntza-, literatura- edo ikerketa-helburuetarako corpus estandar moduan erabiltzeko sortu da, eta hemen dago eskuragarri.

Erreferentzia-corpusa irekia eta kolektiboa da Euskal Herriko 68 erakunde pribatu eta publikorekin batera egin duelako Euskaltzaindiak, baita hedabide nagusiekin eta gizarte-haibat eragile batera ere.

Euskaltzaindiaren webgunean jasotzen denez, “euskararen egunean eguneko erabileraren berri izateko eta hizkuntza-teknologiek ekartzen dizkiguten erronkei aurre egiteko, corpus handiago eta orekatuago baten beharraz jabetuta zegoen Euskaltzaindia”.

Hala, corpus handiago horren xedea ondokoa da: “Analisi linguistikorako, ikasketa automatikorako edo hizkuntza-ikerketetan hipotesiak baliozkotzeko tresna funtsezkoa da, baina baita hizkuntza-, literatura- edo ikerketa-helburuetarako corpus estandar edo erreferente gisa erabil litekeena ere. ‘Egungo’ egoera islatzen duen neurrian, hizkuntzaren irakaskuntzan jarduten dutenek, zuzentzaileek… erabilgarri izango dute EEC, lexiko- (orokorra zein terminologikoa) eta gramatika-zalantzak argitzeko, eta, jakina, corpus handi horietarako eredu egokiak balioztatzeko ere bai”.

EECren datu orokorrak: 123.124 dokumentu, 154,21 milioi testu-hitz, 129.817 lema (2000. urtetik hasi eta 2023ra bitartean euskaraz idatzitako edo ekoitzitako testuetatik hartuak).

Informazio gehiago, hemen.