Popis kurzu Business Analytik pre Data Science 2 (machine learning)
Ste pripravení prehĺbiť svoje vedomosti o Data Science? V tomto kurze sa naučíte vytvárať atribúty pre machine learningové modely, pochopíte princípy strojového učenia, spoznáte rôzne rodiny modelov a naučíte sa ich správne používať. Taktiež pochopíte ako vyhodnotiť kvalitu prediktívnych modelov a ako vyzerá proces nasadenia modelu do reálneho sveta, v ktorom môže byť využívaný a prinášať skutočnú hodnotu.
Upozornenie: V tomto kurze sa NEbudeme učiť “hands-on” Data Science. Tento kurz je pre Vás teda vhodný aj keď nemáte v budúcnosti plány programovať v Pythone alebo SQL-ku. Ak takéto plány máte, tak Vás kurz naučí mnoho veľmi potrebných konceptov, ktoré v budúcnosti určite aj prakticky implementujete. Tento kurz je prirodzeným pokračovaním kurzu Business Analytik pre Data Science 1 (definovanie projektu).
Čo sa v kurze Business Analytik pre Data Science 2 naučíte?
Prejdime si jednotlivými kapitolami, ktoré na Vás v kurze Business Analytik pre Data Science II. čakajú:
Inferencia a prediktívne modelovanie
Keď už máme poňatie o našich dátach, využitie machine learningu a prediktívneho modelovania môže byť hodnotné. V tejto časti kurzu si uvedieme základné princípy prediktívneho modelovania. Napríklad, povieme si prečo je dôležité nechať si časť našich historických dát “bokom” a neučiť sa z nich (takzvaný holdout set). Existujú taktiež rôzne filozofie využitia prediktívnych modelov - môžeme sa, napríklad, snažiť o vytvorenie jednoduchého modelu alebo modelu, ktorý bude mať veľmi vysokú presnosť. Existuje veľa rôznych “rodín” modelov strojového učenia, ktoré môžeme použiť, a preto si ich predstavíme (PS: toto je naozaj zábavná časť kurzu :) ). Predstavíme si lineárne modely, rozhodovacie stromy, náhodné lesy a dokonca aj neurónové siete! Všetky tieto znalosti použijeme v nasledujúcej časti kurzu.
Klasifikačné a regresné problémy
Je čas ísť do hĺbky strojového učenia a prediktívneho modelovania. Zameriame sa na dva základné problémy, s ktorými sa pri supervised learningu môžeme stretnúť. Tými sú klasifikačný a regresný problém. Na vyriešenie klasifikačného problému vybudujeme rozhodovací strom a na vyriešenie regresného problému zas lineárnu regresiu. V oboch prípadoch sa pozrieme do srdca týchto machine learningových modelov, kde sa nachádza takzvaná “cost function”. No a nakoniec sa musíme zamyslieť ako vyhodnotiť presnosť a úspešnosť týchto modelov. Povieme si teda, napríklad, o nástrojoch ako “confusion matrix” alebo “residual analysis”.
Uvedenie modelu “do produkcie”
Počas kurzu sme už vytvorili rôzne modely Data Science - od vizualizácií až po modely strojového učenia. Ak ich však necháme takpovediac “na papieri”, tak z nich, samozrejme, žiadny úžitok nebude. Potrebujeme ich využívať v praxi a dať ich do produkcie. Tento posledný krok však nie je úplne priamočiary. Náš model potrebujeme chápať ako experiment a rátať napríklad s tým, že sa rôzne veci môžu pokaziť. Nemusíte sa však báť, o všetkom podstatnom si povieme v poslednej časti kurzu!
Čo po kurze Business Analytik pre Data Science II. dokážete a čo si odnesiete?
- Znalosť o základných princípoch prediktívneho modelovania - napríklad, čo je to holdout set alebo aký je rozdiel medzi “statistical learning” a “machine learning”.
- Vedomosť o srdci každého prediktívneho modelu - “cost function” a ako ju model využíva pri učení sa z dát.
- Základnú znalosť o lineárnych modeloch, neurónových sieťach, rozhodovacích stromoch, distance-based modeloch, ensemble modeloch, algoritmoch na detekciu anomálií a redukciu dimenzionality.
- Schopnosť vyhodnotiť kvalitu klasifikačného a regresného modelu.
- Základnú znalosť o procese nasadzovania machine learning modelu do reálneho sveta.
Má kurz Business Analytika pre Data Science II. vstupné požiadavky?
- zvládali stredoškolskú matematiku,
- vedeli základné informácie o tom, čo je data science, machine learning, databáza alebo štatistika,
- vedeli o základných štatistických nástrojoch ako počítanie priemeru alebo smerodajnej odchýlky,
Čo všetko v kurze Business Analytik pre Data Science II. dostanete?
-
videotutoriály o Business Analytik pre Data Science 2 (machine learning),
- moderované diskusné fórum, v ktorom na vaše otázky odpovedá lektor Róbert Barcík,
-
certifikát o absolvovaní online kurzu Business Analytik pre Data Science 2 (machine learning),
-
garancia vrátenia peňazí do 14 dní v prípade nespokojnosti s kurzom.