Detail kurzu

Programovací jazyk R II.- Manipulácia s dátami a vizualizácia

IT LEARNING SLOVAKIA, s.r.o.

Popis kurzu

Analytik strávi 80% času nad úpravou a čistením dát a iba 20% samotným modelovaním. Z tohto dôvodu je mimoriadne dôležité dôkladne poznať metódy, ktoré predchádzajú samotnému modelovaniu. Kurz je určený pre tých, ktorí už ovládajú základné prvky jazyka R, akými sú rôzne dátové typy, cykly, funkcie, a chcú sa naučiť pracovať s dátami a vizualizovať ich. Počas kurzu pracujeme s niekoľkými datasetmi a najmodernejšími nástrojmi, akými sú napríklad prostredie RStudio a balíky dplyr, tidyr, ggplot2, readr, rvest, a magrittr. Tematicky je kurz rozdelený do troch častí. Prvá časť sa zaoberá načítavaním dát z rôznych zdrojov do programu R, ako aj exportovaním dát. Okrem štandartných tabuľkových formátov (EXCEL, csv) si ukážeme aj manipuláciu s dátami v iných formátoch (json), v databázach, ako aj s dátami, ktoré sa nachádzajú na internete (tzv. scrapovanie dát). Druhá časť kurzu obsahuje prehľad najpoužívanejších funkcií na manipuláciu s dátami - výber stĺpcov a riadkov, vytváranie nových stĺpcov, agregovanie dát, čistenie dát, zmena formátu dát, spájanie viacerých tabuliek. Tretia časť je venovaná vizualizácii dát, pričom sa v nej venujeme širokej škále základných ako aj pokročilejších grafov.

Obsah kurzu

Importovanie a exportovanie dát

 

Dáta zo súborov
  • excel
  • csv
  • json

 

Dáta z databáz
  • úvod do databáz
  • rôzne typy databáz
  • načítavanie a ukladanie dát do databáz

 

Dáta z internetu
  • načítavanie dát z internetu
  • scrapovanie ľubovoľných dát z webových stránok
  • scrapovanie tabuliek z webových stránok

 

Manipulácia s dátami

 

Operácie s jednou tabuľkou
  • filtrovanie dát
  • usporiadanie dát
  • agregovanie dát
  • transformovanie dát
  • vytváranie nových premenných
  • pivotovanie

 

Operácie s viacerými tabuľkami
  • joinovanie dát z rôznych tabuliek
  • spájanie dát po riadkoch a po stĺpcoch

 

Vizualizácia dát

 

Úvod do vizualizácie dát
  • Rôzne prístupy k vizualizácii dát - base, lattice, ggplot2

 

Základné typy grafov
  • histogram
  • boxplot
  • čiarový graf
  • stĺpcový graf
  • scattetplot
  • jitter plot

 

Pokročilé typy grafov
  • kombinovanie viacerých grafov v jednej vizualizácii
  • rozdelenie grafu na podskupiny v dátach
  • automatické tvorenie grafov
  • interaktívne grafy

 

Prispôsobenie grafu
  • logaritmická os
  • vyhladenie grafu
  • manipulácia s osami
  • prispôsobenie legendy
  • prispôsobenie farieb
  • exportovanie grafu

Cieľová skupina

mierne pokročilý
Hodnotenie




Organizátor