<!DOCTYPE html>
Kodutöö
I osa
(21 punkti) Lahenda praktikumis alustatud andmete veebist kraapimise ülesanded.
II osa
Järgmises praktikumis kasutame peakomponentanalüüsi, seetõttu seisneb kodutöö II osa peakomponentanalüüsiga tutvumises.
(2 punkti) Vaata videot PCA 1: curse of dimensionality
- Selgita, mida tähendab, et andmestiku tegelik dimensionaalsus võib olla väiksem kui tunnuste arv andmestikus. Too kaks näidet.
(1 punkt) Vaata videot PCA 3: direction of greatest variance
- Kuidas valitakse esimese peakomponendi suund (st millise kriteeriumi järgi valitakse esimene peakomponent)?
(1 punkt) Vaata Stanfordi masinõppe kursuse videot Principal Component Analysis Problem Formulation
- Mida uut said siit videost teada lisaks eelnevale kahele? Kumb meeldis rohkem?
Lisaks võid uurida Explained Visually: Principal Component Analysis
Mida on vaja esitada?
- I ja II osa kohta tuleb esitada vastustega Jupyter fail.
Lahendused esitada Moodle keskkonna kaudu.