Statistiline andmeteadus ja visualiseerimine MTMS.01.100     Praktikumid     Projektid     Huvitavat materjali

Kodutöö

Kodutöö

I osa

(21 punkti) Lahenda praktikumis alustatud andmete veebist kraapimise ülesanded.

II osa

Järgmises praktikumis kasutame peakomponentanalüüsi, seetõttu seisneb kodutöö II osa peakomponentanalüüsiga tutvumises.

(2 punkti) Vaata videot PCA 1: curse of dimensionality

  • Selgita, mida tähendab, et andmestiku tegelik dimensionaalsus võib olla väiksem kui tunnuste arv andmestikus. Too kaks näidet.

(1 punkt) Vaata videot PCA 3: direction of greatest variance

  • Kuidas valitakse esimese peakomponendi suund (st millise kriteeriumi järgi valitakse esimene peakomponent)?

(1 punkt) Vaata Stanfordi masinõppe kursuse videot Principal Component Analysis Problem Formulation

  • Mida uut said siit videost teada lisaks eelnevale kahele? Kumb meeldis rohkem?

Lisaks võid uurida Explained Visually: Principal Component Analysis

Projekti teema otsimine (5 boonuspunkti)

Mõtle välja enda projekti teema ja postita see Moodle’s projekti foorumisse. Kirjuta lühike ülevaade, milles projekt seisneb, kust andmed saad jne. Too välja ka kaasüliõpilaste nimed kellega koos projekti teete. Projekti juhendi leiad siit. See “boonusülesanne” jääb üles projekti teemade fikseerimise tähtajani (vt. Moodle’st või projekti juhendist).

Mida on vaja esitada?

Lahendused esitada Moodle keskkonna kaudu.