Detail kurzu

Programovací jazyk R III. - Modelovanie

IT LEARNING SLOVAKIA, s.r.o.

Popis kurzu

Modelovanie predstavuje zvyčajne poslednú a najzaujímavejšiu časť v procese analýzy dát. Počas kurzu si na konkrétnych datasetoch ukážeme širokú škálu rôznych modelov. Kurz predpokladá základné znalosti programu R (dátové typy, funkcie, podmienky) ako aj základné znalosti na manipuláciu a vizualizáciu dát. Počas kurzu si ukážeme najdôležitejšie štatistické ukazovatele (priemer, medián, kvartily, rôzne korelačné koeficienty, hypotézy a intervaly spoľahlivosti), techniky na redukciu premenných (faktorová analýza), identifikáciu klastrov v dátach (metódy kmeans, DBSCAN), ako aj modely na prediktívne modelovanie (regresia, klasifikácia) a prácu s časovými radmi. Počas kurzu pracujeme s niekoľkými datasetmi a najmodernejšími nástrojmi, akými sú napríklad prostredie RStudio a balíky dplyr, ggplot2, caret, prophet.

Obsah kurzu

Jednorozmerné dáta
  • nominálne, ordinálne, a numerické dáta
  • miery polohy - priemer, modus, medián, kvartily
  • miery variability
  • vizualizácia jednorozmerných dát

 

Dvojrozmerné dáta
  • práca s dvojrozmernými dátami
  • Pearsonov, Spearmanov, a Kendallov koeficient
  • MIC koeficient
  • vizualizácia dvojrozmerných dát

 

Testovanie hypotéz
  • dôvody na štatistické testy
  • predpoklady štatistického testu
  • interpretácia výsledku testu
  • p-hodnota
  • najpoužívanejšie testy - t-test, ANOVA, korelačný test, chí-kvadrát test
  • intervaly spoľahlivosti

 

Redukcia premenných
  • dôvody a vhodné dáta na redukciu premenných
  • určenie optimálneho počtu nových premenných
  • redukcia dimenzie pomocou faktorovej analýzy
  • vizualizácia a interpretácia výsledkov faktorovej analýzy

 

Analýza zhlukov (segmentovanie, klastrovanie)
  • koeficienty podobnosti dvoch objektov
  • zhlukovanie vs redukcia premenných
  • určenie optimálneho počtu zhlukov
  • porovnanie rôznych zhlukovacích algoritmov
  • zhlukovanie metódou k-means

 

Prediktívne modelovanie
  • základné typy predikcií - regresia, klasifikácia
  • prediktívne modely
  • krížová validácia
  • meranie presnosti predikcie
  • predpovedanie na nových dátach

 

Časové rady
  • úvod do časových radov
  • rôzne typy časových radov
  • zobrazenie priebehu časového radu
  • vyhladzovanie radu
  • dekompozícia radu
  • predpovedanie budúcich hodnôt

Cieľová skupina

mierne pokročilý
Hodnotenie




Organizátor