Opintojakson tiedot
Näytä opetus ja tentit
404731 Tilastolliset jäsennysmenetelmät (CLT350), 3 op 
Tunniste 404731  Voimassaolo 01.08.2009 -
Nimi Tilastolliset jäsennysmenetelmät (CLT350)  Lyhenne CLT350 
Laajuus3 op   
OpiskelumuotoSyventävät opinnot
LajiOpintojakso   
  ArvosteluYleinen asteikko 
  ei
    Voidaan suorittaa useastiei
Vastuuyksikkö Kieliteknologia 

Kuvaus
Kohderyhmä 

Opintojakso on pakollinen pää- ja sivuaineopiskelijoille.

 
Tavoite 

Osallistujat oppivat soveltamaan tilastollisia menetelmiä erilaisiin luonnollisen kielen käsittely osatehtäviin sekä saavat alustavan käsityksen näiden menetelmien perustana olevasta todennäköisyyslaskennasta, tilastotieteestä ja koneoppimisesta.

 
Edeltävät opinnot 

CLT237 (Ohjelmointi ja luonnollisen kielen käsittely 1) ja CLT238 (Ohjelmointi ja luonnollisen kielen käsittely 2) tai vastaavat tiedot

 
Sisältö 

Kurssin kohteina ovat esim. saneistus (tokenization), virkkeiksi jakaminen, dokumenttien luokittelu, oikeinkirjoituksen korjaaminen, tiedon eristäminen, jäsentäminen ja automaattinen kysymyksiin vastaaminen sekä kielimallien ja perustavanlaatuisten algoritmien kuten n-grammeihin perustuvat kielimallit, naiivit Bayesin ja entropiaan perustuvat luokittimet, Markovin piilomallit sekä probabilistinen dependenssijäsentäminen ja lausekerakennekielioppien mukainen jäsentäminen.

 
Oppimateriaali ja kirjallisuus 

Verkkomateriaalia ja osia teoksista: Stephen Bird, Ewan Klein and Edward Loper, Natural Language Processing with Python (vapaasti verkossa luettavissa), Chris Manning and Hinrich Schütze, Foundations of Statistical Natural Language Processing (MIT Press, 1999).

 
Arviointi 

Yleinen arviointiasteikko.

 
Suoritustavat 

harjoituksia ja harjoitustyö

 
Vastuuhenkilö 

Yliopistonlehtori

 


Meneillään oleva ja tuleva opetus
Ei opetusta WebOodissa

Tulevat tentit
Ei tenttejä WebOodissa