Murdekorpuse hetkeseis
Murdekorpuse hetkeseis (eesti murded)
See, kui palju materjali erinevatelt murdealadelt ja murrakutest on korpusesse kaasatud, sõltub sellest, 1) kui palju üldse on aegade jooksul tehtud salvestisi eri aladelt ning kui palju neid on juba eelnevalt transkribeeritud, 2) kui suure alaga on tegu (suuremate alade kohta on reeglina rohkem materjali, nt keskmurde või läänemurde alalt), 3) kui kaugele on korpuse arendamisega jõutud. Korpusesse lisatakse tekste pidevalt.
Järgnevas tabelis on esitatud sõnade arv eesti murrete korpuses 17.11.2015 seisuga. Erinevused foneetilises transkriptsioonis tekstide ja märgendatud tekstide vahel tulenevad metoodikast: fon. tr. tekstides on kokku leotud kogu faili sõnade arv, märgendatud tekstides ainult keelejuhi sõnade arv, sest ainult keelejuhi sõnad on saanud märgendi. Täpsem info korpuse seisu kohta on saadaval siin.
Murre |
Foneetilises tr. sõnu |
Morf märgendatud sõnu |
Idamurre |
66180 |
50570 |
keelesaared |
24268 |
0 |
Keskmurre |
215206 |
150754 |
Kirdemurre |
76104 |
56525 |
Läänemurre |
305041 |
193381 |
Mulgi |
83335 |
65432 |
Rannamurre |
103048 |
57128 |
Saarte |
317069 |
201184 |
Setu |
108653 |
71769 |
Tartu |
89216 |
64519 |
Võru |
152673 |
96818 |
Eesti murded kokku |
1540793 |
1008080 |
Järgnev joonis illustreerib, millal on murdekorpuse tekstid salvestatud.
Järgnev kaart illustreerib, kui palju teksti on eri kihelkondadest kaasatud (morf. märgendatud tekstide põhjal) ning mis alad on seni katmata. Kaardi aluseks on morf. märgendatud tekstid 1.07.2015 seisuga (kaardi on teinud Kristel Uiboaed).
Kaardil on esitatud eesti murrete andmestiku kogumispunktid ehk külad (morf tekstide põhjal, 19.01.2016 seisuga, sh liivi ja vadja külad). Kaardi on teinud Kristel Uiboaed.