Statistiline andmeteadus ja visualiseerimine MTMS.01.100     Praktikumid     Projektid

Paul Butler oli 2010. aasta lõpus Facebookis praktikal. Ta visualiseeris sotsiaalvõrgustiku andmeid tõmmates jooni sõprade asukohtade vahel.

Joonis on atraktiivne ja annab hästi edasi FB visiooni. Seda sama joonist näidatakse igapäevaselt FB kontoris hiigelsuurelt ekraanilt ja kasutati näiteks FB aktsiaemissiooni prospektis, et meelde tuletada või selgitada ettevõtte missiooni. Paul tegi selle joonise kasutades R-i. Kuna FB meile andmeid ei andnud, vaatame selles kodutöös, kuidas lennuliiklus ühendab maailma.

Tutvumine andmestikuga

Laadi alla andmestikud airports.csv ja flights.csv ning loe need töökeskkonda.

Andmestikus airports.csv on informatsioon lennujaamade kohta. Selles on järgnevad tunnused:

  • id - lennujaama id
  • name - lennujaama nimi
  • city - millises linnas asub lennujaam
  • country - millises riigis asub lennujaam
  • lat - lennujaama asukoha laiuskraad
  • lon - lennujaama asukoha pikkuskraad

Andmestik flights.csv sisaldab infot lendude kohta. Selles on järgnevad tunnused:

  • airline - lennukompanii lühend
  • airline_id - lennukompanii id
  • source_airport - lähtekoha lennujaama lühend
  • source_airport_id - lähtekoha lennujaama lühend
  • dest_airport - sihtkoha lennujaama lühend
  • dest_airport_id - sithkoha lennujaama id

Suurringjoon

Paul Butler kasutas suurringjooni, et visualiseerida ühendusi sõprade vahel. Kahe punkti lühim vahemaa keral avaldub suurringjoone kaudu. Kui tuult ja muid sarnaseid tegureid mitte arvestada, lendavad lennukid pikki vahemaid suurringjoonte marsruutide kaudu.

Järgneval joonisel on see tähistatud punase joonega.

Näide1: suurringjoon R-is

Näide, kuidas joonistada suurringjoont R-is. Ühendame Liivi 2 maja Facebooki peakontoriga kasutades baasgraafika võimalusi.

library(maps)
library(geosphere)

map("world", col="#f2f2f2", fill=TRUE, border=NA)

lat_liivi = 58.379491
lon_liivi = 26.713199
lat_fb = 37.485245
lon_fb = -122.148807

gc_points = gcIntermediate(c(lon_liivi, lat_liivi), c(lon_fb, lat_fb), 
                           n=50, addStartEnd=TRUE)
lines(gc_points)

Näide2: suurringjoon R-is

Ühendame Liivi 2 maja Eyjafjallajökulliga kasutades ggmap() funktsiooni. Loe rohkem ggmap() funktsiooni kohta siit.

library(ggmap)

lat_liivi = 58.379491
lon_liivi = 26.713199
lat_eyjafjallajokull = 63.37120
lon_eyjafjallajokull = -19.36480

map <- get_map(location = 'Europe', zoom = 3 ,source = "google")
a <- ggmap(map)

gc_points = gcIntermediate(c(lon_liivi, lat_liivi), 
                           c(lon_eyjafjallajokull, lat_eyjafjallajokull), 
                           n=50, addStartEnd=TRUE)
gc = data.frame(gc_points)

a <- a + geom_path(data = gc, aes(x = lon, y = lat), 
                   colour = 'red',size=1.5)
a

Näide3: suurringjoon R-is

Ühendame Liivi 2 maja maailma suurima pitsa sünnikohaga kasutades leaflet paketti. Loe rohkem leaflet’i kohta siit.

library(leaflet)
lat_liivi = 58.379491
lon_liivi = 26.713199
lat_pitsa = 41.535158
lon_pitsa = 12.306798

m = leaflet() #koordinaatsüsteemis sisse lugemine

m = addTiles(m) #kaardikihtide lisamine

#suurringjoone punktid
gc_points = gcIntermediate(c(lon_liivi, lat_liivi), 
                           c(lon_pitsa, lat_pitsa), 
                           n=50, addStartEnd=TRUE)
gc = data.frame(gc_points)

m = m %>% #punktide lisamine kaardile
  addCircles(lng = lon_liivi, lat = lat_liivi, color = 'red', weight = 3) %>%
  addCircles(lng = lon_pitsa, lat = lat_pitsa, color = 'red', weight = 3)

m = m %>% #joonte lisamine kaardile
  addPolylines(lng = gc$lon, lat = gc$lat, weight = 5, color = 'red')

m = m %>% 
  setView(lng = 0, lat = 50, zoom = 3) %>% 
  addProviderTiles("Esri.WorldImagery") #geoloogiline
m

Ülesanne 1 (5 punkti)

Visualiseeri suurringjoonte abil ühendusi, kuhu saab Tallinna lennujaamast otselennuga. Võid kasutada vabalt valitud meetodit eelnevalt toodud näidete seast.

Näpunäited:

  • Kuna otselennuga saab Tallinnast vaid Euroopasse, siis kanna joonisele vaid Euroopa kaart.
  • Tallinna lennujaama kood on 415 (mille võid leida, kui uurid andmestikust airports Eesti lennujaamu).
  • Sihtkohtade lennujaamad leiad andmestikust flights.csv.
  • Lennujaamade koordinaadid leiad andmestikus airports.csv.
# sinu kood

Ülesanne 2 (9 punkti)

Visualiseeri ühendusi, kuhu saab Tallinna lennujaamast otselennu või ühe vahepeatusega. Võid kasutada esimeses ning kolmandas näites tutvustatud võimalusi.

Näpunäited:

  • Et esimesel juhul värve läbipaistvaks muuta, lisa värvikoodile lõppu läbipaistvuse intensiivsus. Näiteks kasuta funktsiooni lines korral argumenti col="#00000010", et muuta mustade (värvikood #000000) joonte läbipaistvus 10%-ni. Teisel juhul võid kasutada funktsiooni addPolylines korral argumente weight=0.7 ja opacity=0.3.

  • Visualiseeri ühendusi Tallinn - vahelennujaam - lõpp-punkt. Tingimata pole tarvis mitu korda joonistada Tallinn - vahelennujaam ühendusi, need võid joonistada ka ühe korra.

# sinu kood

Sinu joonis võiks tulla umbes selline:

või selline:

Boonusülesanne 1 (1 punkt) - Juhuslik ekslemine eralennukiga

Alusta Tallinna lennujaamast. Vali kõikvõimalikest lennujaamadest juhuslikult üks ja lenda sinna. Vali nüüd juhuslikult järgmine sihtpunkt ning lenda sinna. Jätka seda protsessi 100 korral ja visualiseeri läbitud teekonda.

# sinu kood

Boonusülesanne 2 (2 punkti) - Juhuslik ekslemine kasutades kommertsliine

Alusta Tallinna lennujaamast. Vali võimalikest sihtkohtadest üks ja lenda sinna. Vali selle lennujaama võimalikest sihtkohtadest juhuslikult järgmine ning lenda sinna. Jätka seda protsessi 100 korral ja visualiseeri läbitud teekonda.

# sinu kood