Õppeaine lühikirjeldus
Tegemist on rakendusliku statistikakursusega, kus:
- Probleemipüstitusena kasutatakse huvitavaid päriselulisi andmestikke.
- Rakendatakse sobivaid statistilisi meetodeid, et püstitatud küsimustele vastust leida.
- Saadud tulemuste teistele kommunikeerimiseks illustreeritakse neid sobivate joonistega.
Järgnev skeem võtab lühidalt kokku õppeaine olemuse.
Õppeaine eesmärgid
- Tutvustada üliõpilastele, milliseid huvitavaid probleeme saab statistika abil lahendada erinevates valdkondades (näiteks bioteadustes, majanduses, juuras), ning harjutada nende lahendamist.
- Õppida visualiseerimismeetodeid andmetest ülevaate saamiseks, tulemuste tõlgendamiseks ja nende sisu edasi andmiseks.
- Tutvustada tarkvara R võimalusi reprodutseeritava analüüsi läbiviimiseks ning tulemuste visualiseerimiseks.
Miks on kursuses olulisel kohal andmeanalüüsi reprodutseeritavus ja visualiseerimine?
-
Reprodutseeritav analüüs:
Kas enamik teadusartiklitest on valed?
Teadusajakirjas Nature on olnud palju juttu reprodutseeritavuse kriisist: publitseeritud analüüsitulemusi on raske taastekitada.
Tihti isegi siis, kui kasutatakse samu andmestikke (näiteks Harvardi majandusteadlaste artikkel, mida käsitleme õppeaine raames). -
Visualiseerimine:
Kõige parema ülevaate andmetest saab visualiseerimise abil ning sageli on joonised parimaks viisiks, kuidas statistik saab oma töö tulemusi teistele kommunikeerida.
Tähtis on analüüsitulemuste kommunikeerimine ja müümine.
(Bank of America kvantitatiivne analüütik ja TÜ statistika vilistlane A. Sepp)
Sihtgrupp
- Kursus on mõeldud statistikahuvilistele üliõpilastele, kes on tuttavad tarkvaraga R.
Õppetöö korraldus
Õppeaines toimub kokku 9 praktikumi. Kuna aines on kasutusel pööratud klassiruumi meetod, siis on loengute asemel ette nähtud iganädalane iseseisev töö. See võib sisaldada mõne artikliga tutvumist, veebiloengu vaatamist vms. Arutelu iseseisvalt õpitu kohta ning praktikumid toimuvad klassiruumis.
Lisaks praktikumidele sisaldab õppeaine järgnevaid komponente:
- Kodutööd: Kokku antakse 8 kodutööd (igaüks 25 punkti).
- Kodutöö sisaldab enamasti andmete analüüsimist, visualiseerimist jne. Iga kodutöö tulemuseks on knitr-i raport koos R-i koodi ning kommentaaridega.
- Kodutöö võib sisaldada ka küsimusi iseseisvalt õpitu (näiteks videoloengu) kohta.
- Projekt: Lisaks tuleb läbi viia üks praktiline andmeanalüüs ning kirjutada populaarteaduslikus vormis artikkel saadud tulemustest. Artikkel on illustreeritud asjakohaste joonistega ning on arusaadav ka mittestatistikule. Projekti võib teha kas üksinda või paaristööna. Tulemusi on vaja esitleda suulisel kaitsmisel.
Aine läbimiseks on vaja:
- kodutööde eest saada vähemalt 75% punktidest (on vaja saada vähemalt 150 punkti 200st võimalikust),
- koostada projekt ning seda esitleda.
Õppeaines (3 EAP) ette nähtud 78 tundi tööd jaguneb järgnevalt:
- praktikumid kokku 13.5 tundi (9 praktikumi, igaüks 1.5 tundi)
- kodutööd kokku 40 tundi (8 kodutööd, igaüks 5 tundi)
- projekti koostamine 23 tundi
- projekti esitlemine 1.5 tundi
Tunniplaan
Õppeaine toimub 2014/2015. õppeaasta kevadsemestril.
- Praktikumid teisipäeviti kell 14.15 ruumis 203
(nädalatel 24 - 25, 27 - 33). - Konsultatsioon esmaspäeviti kell 14.15 ruumis 512.
Kontakt ja küsimused
- Kaspar Märtens
- Tanel Pärnamaa
Meiega saab ühendust aadressil: andmeteadus [at] gmail.com