Opintojakson tiedot
Näytä opetus ja tentit
406372 Ohjelmointi ja luonnollisen kielen käsittely 2 (CLT238), 5 op 
Tunniste 406372  Voimassaolo 01.08.2012 -
Nimi Ohjelmointi ja luonnollisen kielen käsittely 2 (CLT238)  Lyhenne CLT238 
Laajuus5 op   
OpiskelumuotoAineopinnot
LajiOpintojakso   
  ArvosteluYleinen asteikko 
  ei
    Voidaan suorittaa useastiei
Vastuuyksikkö Kieliteknologia 

Kuvaus
Kohderyhmä 

opintojakso on pakollinen pää- ja sivuaineopiskelijoille

 
Ajoitus 

toisen opiskeluvuoden keväällä

 
Tavoite 

Opiskelija oppii käyttämään laajaa valikoimaa NLTK:n korpuksiin ja koneoppimiseen perustuvia menetelmiä, sekä sääntöpohjaisia jäsennysmenetelmiä

 
Edeltävät opinnot 

CLT237 Ohjelmointi ja luonnollisen kielen käsittely 1  tai vastaavat tiedot

 
Sisältö 

Kurssilla opetetaan kieliteknologian keskeiset jäsennysmenetelmät kuten esim. n-grammeihin perustuva jäsentäminen, jäsentimien evaluointi, koneoppiminen, tilastollisen luokittimen opettaminen, dokumenttien luokitteleminen, luokittimien evaluointi, pätkäjäsentäminen, pintasyntaksin mukainen jäsentäminen, pätkäjäsentimien evaluointi, nimettyjen kohteiden tunnistaminen teksteistä, tiedon eristäminen, jäsentäminen yhteydestä riippumattomat (context free) kieliopit, osittava (top-down) ja kokoava (bottom-up) jäsentämien, taulukkojäsennys (chart parsing), pääsana-määritesuhteet, piirrepohjaiset kieliopit, piirrerakenteet ja unifikaatio, rakenteisten dokumenttien käsittely (XML) ja konversiot tiedostomuotojen välillä (mm. CSV).

 
Oppimateriaali ja kirjallisuus 

verkkomateriaalia ja Stephen Bird, Ewan Klein, Edward Loper, Natural Language Processing with Python (vapaasti verkossa luettavissa).

 
Arviointi 

yleinen arviointiasteikko

 
Suoritustavat 

harjoituksia ja harjoitustyö

 
Vastuuhenkilö 

yliopistonlehtori

 


Meneillään oleva ja tuleva opetus
Ei opetusta WebOodissa

Tulevat tentit
Ei tenttejä WebOodissa