Statistiline andmeteadus ja visualiseerimine MTMS.01.100     Praktikumid     Projektid

Kodutöö

Tähtaeg: 05.04.2016 kell 23:59.

I osa

(19 punkti) Lahenda praktikumis alustatud biomarkerite ülesanded.

II osa

Järgmises praktikumis tegeleme dopingutesti uurimisega. Järgnev video ja artikkel annavad sissejuhatuse teemasse.

(2 punkti) Vaata videot The tradeoff between sensitivity and specificity statistilise testi tundlikkuse ja spetsiifilisuse kohta.

  • Mida näitab statistilise testi tundlikkus (sensitivity)? Kuidas saavutada 100% tundlikkus?
  • Miks räägitakse kompromissi leidmisest tundlikkuse ja spetsiifilisuse vahel (tradeoff between sensitivity and specificity)?

(4 punkti) Loe Krista Fischeri ja Donald A. Berry artiklit Statisticians Introduce Science to International Doping Agency: The Andrus Veerpalu Case ning vasta järgmistele küsimustele.

  • Sportlase verest mõõdeti kasvuhormooni (hGH) kahte isovormi recGH ja pitGH. Millist teststatistikut kasutati? (Vihje: testi nimetati hGH Isoform Ratio Test)
  • Artiklis (sektsioonis The hGH Doping Test) on välja toodud neli eeldust, mis peaksid dopingutesti korral olema täidetud. Nimeta nende seast kaks ning selgita kummagi kohta lühidalt, miks need olulised on.
  • Oleme koostanud skeemi, mis võtab kokku artiklis kirjeldatud protsessi otsustuspiiride paikapanekust ja verifitseerimisest. Täida skeemis olevad lüngad a ja b.
  • Millised statistilised möödapanekud esinesid kasvuhormooni dopingutestis? Nimeta kaks.

Mida on vaja esitada?

  • I osa kohta tuleb esitada nii andmeanalüüsi raport (html või pdf formaadis) kui ka selle lähtekood .Rmd failina.
  • II osa vastused tuleb kirjutada meili sisusse või esitada tekstifailina. Lisaks palun kirjuta, kui palju aega kulus I ja II osa peale. Kas logistiline regressioon ja mitmese testimise korrektsioon olid sinu jaoks uued mõisted? Kuivõrd arusaadav oli nende idee? Mida arvad ülesannetest (kasulikkus, huvitavus)?

Lahendused saata meili peale: markgimbutas@gmail.com