Statistiline andmeteadus ja visualiseerimine MTMS.01.100     Praktikumid     Projektid

Õppeaine lühikirjeldus

Tegemist on rakendusliku statistikakursusega, kus:

  • Probleemipüstitusena kasutatakse huvitavaid päriselulisi andmestikke.
  • Rakendatakse sobivaid statistilisi meetodeid, et püstitatud küsimustele vastust leida.
  • Saadud tulemuste teistele kommunikeerimiseks illustreeritakse neid sobivate joonistega.

Järgnev skeem võtab lühidalt kokku õppeaine olemuse.

skeem

Õppeaine eesmärgid

  • Tutvustada üliõpilastele, milliseid huvitavaid probleeme saab statistika abil lahendada erinevates valdkondades (näiteks bioteadustes, majanduses, juuras), ning harjutada nende lahendamist.
  • Õppida visualiseerimismeetodeid andmetest ülevaate saamiseks, tulemuste tõlgendamiseks ja nende sisu edasi andmiseks.
  • Tutvustada tarkvara R võimalusi reprodutseeritava analüüsi läbiviimiseks ning tulemuste visualiseerimiseks.

Miks on kursuses olulisel kohal andmeanalüüsi reprodutseeritavus ja visualiseerimine?

  • Reprodutseeritav analüüs:

    Kas enamik teadusartiklitest on valed?

    Teadusajakirjas Nature on olnud palju juttu reprodutseeritavuse kriisist: publitseeritud analüüsitulemusi on raske taastekitada.
    Tihti isegi siis, kui kasutatakse samu andmestikke (näiteks Harvardi majandusteadlaste artikkel, mida käsitleme õppeaine raames).

  • Visualiseerimine:

    Kõige parema ülevaate andmetest saab visualiseerimise abil ning sageli on joonised parimaks viisiks, kuidas statistik saab oma töö tulemusi teistele kommunikeerida.

    Tähtis on analüüsitulemuste kommunikeerimine ja müümine.
    (Bank of America kvantitatiivne analüütik ja TÜ statistika vilistlane A. Sepp)

Sihtgrupp

Kursus on mõeldud statistikahuvilistele üliõpilastele, kes on tuttavad tarkvaraga R. Kui sa ei ole võtnud rangelt soovituslikku eeldusainet “Rakendustarkvara: R”, aga soovid seda ainet õppida, siis soovitame iseseisvalt R-i õppida “Rakendustarkvara: R” õppematerjalide abil.

Õppetöö korraldus

Õppeaines toimub kokku 9 praktikumi. Kuna aines on kasutusel pööratud klassiruumi meetod, siis on loengute asemel ette nähtud iganädalane iseseisev töö. See võib sisaldada mõne artikliga tutvumist, veebiloengu vaatamist vms. Arutelu iseseisvalt õpitu kohta ning praktikumid toimuvad klassiruumis.

Lisaks praktikumidele sisaldab õppeaine järgnevaid komponente:

  • Kodutööd: Kokku antakse 8 kodutööd (igaüks 25 punkti).
    • Kodutöö sisaldab enamasti andmete analüüsimist, visualiseerimist jne. Iga kodutöö tulemuseks on knitr-i raport koos R-i koodi ning kommentaaridega.
    • Kodutöö võib sisaldada ka küsimusi iseseisvalt õpitu (näiteks videoloengu) kohta.
  • Projekt: Lisaks tuleb läbi viia üks praktiline andmeanalüüs ning kirjutada populaarteaduslikus vormis artikkel saadud tulemustest. Artikkel on illustreeritud asjakohaste joonistega ning on arusaadav ka mittestatistikule. Projekti võib teha kas üksinda või paaristööna. Tulemusi on vaja esitleda suulisel kaitsmisel. Soovi korral võib tutvuda eelmise aasta projektidega.

Aine läbimiseks on vaja:

  1. kodutööde eest saada vähemalt 75% punktidest (on vaja saada vähemalt 150 punkti 200st võimalikust),
  2. koostada projekt ning seda esitleda.

Õppeaines (3 EAP) ette nähtud 78 tundi tööd jaguneb järgnevalt:

  • praktikumid kokku 13.5 tundi (9 praktikumi, igaüks 1.5 tundi)
  • kodutööd kokku 40 tundi (8 kodutööd, igaüks 5 tundi)
  • projekti koostamine 23 tundi
  • projekti esitlemine 1.5 tundi

Tunniplaan

Õppeaine toimub 2015/2016. õppeaasta kevadsemestril.

  • Praktikumid kolmapäeviti kell 12.15 ruumis 203 (nädalatel 24 - 25, 27 - 32).

Kontakt ja küsimused

  • Mark Gimbutas
  • Siim Viigand

Meiega saab ühendust aadressidel markgimbutas [at] gmail.com ja siim.viigand [at] gmail.com