Statistiline andmeteadus ja visualiseerimine MTMS.01.100     Praktikumid     Projektid     Huvitavat materjali

<!DOCTYPE html>

Kodutöö

Kodutöö

I osa

Ülesanne 1.1 (1 punkt)

Vaata videot hierarhilise klasterdamise kohta.

Mida (uut) said teada hierarhilisest klasterdamisest?

Ülesanne 1.2 (1 punkt)

Vaata Johns Hopkinsi videot logistilise regressiooni kohta.

Nimeta üks põhjus, miks lineaarne regressioon ei ole mõistlik valik binaarse y-tunnuse modelleerimiseks?

Ülesanne 1.3 (2 punkti)

Joonista R-is logistiliste kõverate \[y = \frac{e^{\beta_0 + \beta_1 x}}{1 + e^{\beta_0 + \beta_1 x}}\] graafikud:

  • Ühel joonisel \(\beta_0 \in \{-1, 0, 1\}\) ja \(\beta_1 = 1\).
  • Teisel joonisel \(\beta_0 = 0\) ja \(\beta_1 \in \{0.5, 1, 2\}\).

Selgita, millist mõju omab \(\beta_0\) ja millist \(\beta_1\) muutmine.

# Ülesanne 1.3
# sinu kood + kommentaar

Ülesanne 1.4 (1 punkt)

Loe artiklit http://www.postimees.ee/2721878/hoiatus-meie-vereproovist

Nimeta jutuks olnud teadusartikli põhitulemus.

Soovitame sul katsuda jõudu tutvuda ka teadusartikli endaga Biomarker Profiling by Nuclear Magnetic Resonance Spectroscopy for the Prediction of All-Cause Mortality: An Observational Study of 17,345 Persons. Järgmises praktikumis kasutame sedasama andmestikku, millel see artikkel põhineb.

II osa

(10 punkti) Lahenda praktikumis alustatud käsitsi kirjutatud numbrite ülesanded.

III osa

(10 punkti) Analüüsi riigikogu hääletusmustreid.

Mida on vaja esitada?

  • I, II ja III osa kohta tuleb esitada vastustega Jupyter fail.
  • Lisaks võiksid mainida, kui palju aega kulus I, II ja III osa peale. Mida arvad ülesannetest?

Lahendused esitada Moodle keskkonna kaudu.