Keelekogud
TÜ eesti ja üldkeelteaduse instituudis hoitakse, luuakse ja koostatakse mitut sorti keelekogusid. Suurem osa keelekogusid on erinevatel koostamispõhimõtetel loodud korpused. Väga palju erinevat keelematerjali (salvestusi, kirjalikke ülestähendusi, fotosid ja käsikirjalisi ülevaateid) on koondatud Eesti murrete ja sugulaskeelte arhiivi.
Korpused ja keelekogud (tähestiku järjekorras)
Nimi |
Lühikirjeldus |
---|---|
Eesti ja soome-ugri keeleteaduse bibliograafia | Uurali keeleteaduse bibliograafilised andmebaasid BSU ja URBIS (Uralic Bibliographical Survey) sisaldavad viiteid keeleteadusliku ja uurali keeli puudutava trükisõna ning uurimuste kohta. BSU katab vahemikku 1917-1991 ja sisaldab 75 361 kirjet, URBIS vahemikku 1988-2012 ja sisaldab 13 207 kirjet. (Alates 2019. aastast ei ole bibliograafia andmebaasi kasutajaliides tehnilistel põhjustel kättesaadav; suurem osa eesti keelt ja Eesti autoreid puudutavast materjalist on andmebaasis ISE) |
Eesti keele spontaanse kõne foneetiline korpus | Kõrge kvaliteediga salvestatud spontaanne kõne, mis on märgendatud hääliku-, silbi- ja sõnatasandil. |
Eesti kooliõpilaste kirjalik tekstikorpus kontakt: Kadri Sõrmus <kadri.sormus [ät] ut.ee> |
Eesti koolilapse keelekasutuse uurimiseks koostatud tekstide kogu koosneb eksami-, kooli- ja võistluskirjanditest. |
Eesti keele koondkorpus | Kajastab tänapäeva kirjaliku eesti keelt. Koosneb eesti ilu-, ajakirjanduslikest, teadus ja populaarteaduslikest, uue meedia ja muudest tekstidest. Palju erinevaid allkorpuseid. |
Eesti murrete ja sugulaskeelte arhiiv | Eesti ja sugulaskeelte salvestised, kirjapanekud, ülevaated ja käsikirjalised tööd. |
Eesti murrete korpus | Sisaldab tekste kõigist eesti murretest ja lähisugulaskeeltest tekse (vadja, liivi ja isuri). Traditsioonilised murdeintervjuud, kõnelejateks vanemad inimesed, on transkribeeritud ja morfoloogiliselt märgendatud. |
Eesti vana kirjakeele korpus | Sisaldab olulisemaid tekste 16.--19. sajandist (u 2 miljonit tekstisõna). Tekstid on arvutisse sisestatud autorite kirjaviisi muutmata. Vanemad tekstid on morfoloogiliselt märgendatud. |
Liivi-eesti-läti sõnaraamat | Liivi-eesti-läti sõnaraamat, koostanud Tiit-Rein Viitso. |
Multimodaalse suhtluse andmebaas ehk MUSU Kontakt: Silvi Tenjes <silvi.tenjes [ät] ut.ee> |
Korpuses on erinevates kommunikatiivsetes situatsioonides salvestatud ja/või kajastatud materjal. Korpuses on kaks allkorpust: interaktiivsete suhtlussituatsioonide korpus (ISU) ja kontekstualiseeritud kirjalike tekstide korpus (KOK). |
Tartu ülikooli suulise eesti keele korpus | Korpus koosneb suhtlussituatsioonide salvestustest ja nende litereeringutest. Iga salvestatud suhtlussituatsiooni juurde kuulub taustakirjeldus, mis annab infot situatsiooni tüübi, osalejate sotsiaalsete omaduste, suhtlusvaldkonna jms kohta. |
Tartu ülikooli süstemaatiline netiallkeelte korpus Kontakt: Anni Oja <anni.oja [ät] ut.ee> |
Korpus sisaldab nii kirjaliku kui suulise netikeele oluliste allkeelte materjale, mis on kogutud süstemaatiliselt ja millele on lisatud vajalikud taustakirjeldused ja vahendid keelematerjali leidmiseks ja analüüsimiseks. |
Võru kirjakeele korpus | Võro ja seto keele korpus |
Kontakt: Kristiina Praakli <kristiina.praakli [ät] ut.ee> |
Sisaldab TÜ eesti keelt teise keelena õppijate loodud kirjalikke tekste. Paralleelkorpus koosneb B1 ja B2 kirjaliku keeleoskustasemega üliõpilaste kirjalike tööde vigaste lausetest. |