Õppeaine lühikirjeldus
Tegemist on rakendusliku statistikakursusega, kus:
- Probleemipüstitusena kasutatakse huvitavaid päriselulisi andmestikke.
- Rakendatakse sobivaid statistilisi meetodeid, et püstitatud küsimustele vastust leida.
- Saadud tulemuste teistele kommunikeerimiseks illustreeritakse neid sobivate joonistega.
Järgnev skeem võtab lühidalt kokku õppeaine olemuse.
Õppeaine eesmärgid
- Tutvustada üliõpilastele, milliseid huvitavaid probleeme saab statistika abil lahendada erinevates valdkondades (näiteks bioteadustes, majanduses, juuras), ning harjutada nende lahendamist.
- Õppida visualiseerimismeetodeid andmetest ülevaate saamiseks, tulemuste tõlgendamiseks ja nende sisu edasi andmiseks.
- Tutvustada tarkvara R võimalusi reprodutseeritava analüüsi läbiviimiseks ning tulemuste visualiseerimiseks.
Miks on kursuses olulisel kohal andmeanalüüsi reprodutseeritavus ja visualiseerimine?
-
Reprodutseeritav analüüs:
Kas enamik teadusartiklitest on valed?
Teadusajakirjas Nature on olnud palju juttu reprodutseeritavuse kriisist: publitseeritud analüüsitulemusi on raske taastekitada.
Tihti isegi siis, kui kasutatakse samu andmestikke (näiteks Harvardi majandusteadlaste artikkel, mida käsitleme õppeaine raames). -
Visualiseerimine:
Kõige parema ülevaate andmetest saab visualiseerimise abil ning sageli on joonised parimaks viisiks, kuidas statistik saab oma töö tulemusi teistele kommunikeerida.
Tähtis on analüüsitulemuste kommunikeerimine ja müümine.
(Bank of America kvantitatiivne analüütik ja TÜ statistika vilistlane A. Sepp)
Sihtgrupp
Kursus on mõeldud statistikahuvilistele üliõpilastele, kes on tuttavad tarkvaraga R. Kui sa ei ole võtnud rangelt soovituslikku eeldusainet “Rakendustarkvara: R”, aga soovid seda ainet õppida, siis soovitame iseseisvalt R-i õppida “Rakendustarkvara: R” õppematerjalide abil.
Õppetöö korraldus
Õppeaines toimub kokku 9 praktikumi. Kuna aines on kasutusel pööratud klassiruumi meetod, siis on loengute asemel ette nähtud iganädalane iseseisev töö. See võib sisaldada mõne artikliga tutvumist, veebiloengu vaatamist vms. Arutelu iseseisvalt õpitu kohta ning praktikumid toimuvad klassiruumis.
Lisaks praktikumidele sisaldab õppeaine järgnevaid komponente:
- Kodutööd: Kokku antakse 8 kodutööd (igaüks 25 punkti).
- Kodutöö sisaldab enamasti andmete analüüsimist, visualiseerimist jne. Iga kodutöö tulemuseks on knitr-i raport koos R-i koodi ning kommentaaridega.
- Kodutöö võib sisaldada ka küsimusi iseseisvalt õpitu (näiteks videoloengu) kohta.
- Projekt: Lisaks tuleb läbi viia üks praktiline andmeanalüüs ning kirjutada populaarteaduslikus vormis artikkel saadud tulemustest. Artikkel on illustreeritud asjakohaste joonistega ning on arusaadav ka mittestatistikule. Projekti võib teha kas üksinda või paaristööna. Tulemusi on vaja esitleda suulisel kaitsmisel. Soovi korral võib tutvuda eelmise aasta projektidega.
Aine läbimiseks on vaja:
- kodutööde eest saada vähemalt 75% punktidest (on vaja saada vähemalt 150 punkti 200st võimalikust),
- koostada projekt ning seda esitleda.
Õppeaines (3 EAP) ette nähtud 78 tundi tööd jaguneb järgnevalt:
- praktikumid kokku 13.5 tundi (9 praktikumi, igaüks 1.5 tundi)
- kodutööd kokku 40 tundi (8 kodutööd, igaüks 5 tundi)
- projekti koostamine 23 tundi
- projekti esitlemine 1.5 tundi
Tunniplaan
Õppeaine toimub 2015/2016. õppeaasta kevadsemestril.
- Praktikumid kolmapäeviti kell 12.15 ruumis 203 (nädalatel 24 - 25, 27 - 32).
Kontakt ja küsimused
- Mark Gimbutas
- Siim Viigand
Meiega saab ühendust aadressidel markgimbutas [at] gmail.com ja siim.viigand [at] gmail.com