Popis kurzu Pokročilý Machine Learning v Pythone
Chceš posunúť svoje zručnosti v Machine Learningu na úroveň profesionála? Tento kurz ťa tam dostane! Kurz Pokročilý Machine Learning v Pythone je navrhnutý pre každého, kto už ovláda základy, no chce sa naučiť používať techniky, ktoré v praxi využívajú tí najlepší data scientisti na svete.
V dnešnom svete údajov už nestačí vedieť napísať jednoduchý lineárny model. Firmy hľadajú odborníkov, ktorí rozumejú pokročilým algoritmom, dokážu optimalizovať modely pre produkčné prostredie a riešia reálne business problémy s measuriteľným dopadom. Tento kurz ti dáva presne tie zručnosti, po ktorých najviac volajú zamestnávatelia.
Čo sa v kurze Pokročilý Machine Learning v Pythone naučíte?
1. Distance-based learning: Algoritmy založené na meraní vzdialeností
Zamysleli ste sa niekedy, ako Netflix vie, aký film vám odporučiť, alebo ako e-shop navrhne produkty, ktoré vás okamžite zaujmú? Odpoveď sa skrýva v Distance-based learningu. V kurze sa naučíš ako vytvárať a používať algoritmy založené na meraní vzdialeností, ktoré sú základom mnohých moderných aplikácií, od personalizácie obsahu až po odhaľovanie podvodných transakcií. Ukážeme si štandardné riešenia aj pokročilé a kreatívne prístupy, ktoré ti umožnia zvládnuť akýkoľvek dataset, s ktorým sa stretneš.
2. Nevybalansované dáta
Nevybalansované dáta stretneš v praxi takmer všade. A hoci sa na prvý pohľad nemusia zdať ako veľký problém, môžu mať naozaj negatívny vplyv na tvoj prediktívny model. V tejto kapitole si najskôr presne ukážeme, v čom spočíva ich nebezpečenstvo a prečo sa pri nich nemôžeme spoliehať na bežné metriky, ako je presnosť (accuracy). Následne sa pozrieme na dve konkrétne riešenia, ktorými sú Oversampling a Undersampling.
3. Ensemble modely
V poslednej kapitole sa naučíš používať Ensemble modely, pričom začneme s Bagging prístupom, ktorý ponúka extrémne robustné modely, odolné aj voči drobným zmenám v dátach. Detailne sa pozrieme sa najpopulárnejšie algoritmy ako je napríklad ExtraTrees Ensemble, ktorý je ideálny pre väčšinu štandardných problémov. V rámci unsupervised learningu si ukážeme použitie algoritmu Isolation Forest.
Ďalej prejdeme k Boostingu, kedy sa modely učia z chýb predchádzajúcich modelov. Budeme sa venovať moderným a v praxi využívaným algoritmom ako sú XGBoost, LightGBM a CatBoost.
Kurz zavŕšime technikou Stacking, kedy budeme kombinovať viaceré typy modelov a ich výsledky skombinujeme pomocou špeciálneho “meta-modelu”. Prejdeme si základné prístupy ako Soft Voting, ale aj pokročilé implementácie ako Stacked generalization, Deep Ensemble modely alebo Model Distillation.
Pre koho je tento kurz vhodný?
Kurz Pokročilý Machine Learning v Pythone je určený pre každého, kto už má
základy Machine Learningu a chce sa posunúť na profesionálnu úroveň. Je ideálny pre:
-
Študentov a absolventov s teoretickými vedomosťami, ktorí chcú získať praktické zručnosti pre riešenie reálnych problémov.
-
Junior Data Scientistov, ktorí chcú prekonať časté výzvy v praxi, ako sú nevybalansované dáta alebo komplexné zmiešané datasety.
-
Analytikov a programátorov, ktorí chcú rozšíriť svoje zručnosti a začať budovať robustné a spoľahlivé prediktívne modely, ktoré sú využiteľné v reálnom svete.
Tento kurz odporúčame najmä pre absolventov nášho kurzu
"Machine Learning v Pythone", kde získali pevný základ v oblasti tvorby prediktívnych modelov, spracovania dát a základných metrík vyhodnocovania modelov.
Čo po kurze dokážete a čo si odnesiete?
Po absolvovaní kurzu budete vedieť:
- Navrhovať a implementovať distance-based modely
- Identifikovať a efektívne riešiť problém nevybalansovaných dát, ktorý často spôsobuje nespoľahlivé predikcie v reálnych projektoch.
- Používať Oversampling a Undersampling techniky
- Vytvárať a aplikovať ensemble modely ako ExtraTrees a rozumieť, kedy je tento prístup vhodný
- Ovládať pokročilé boosting algoritmy (XGBoost, LightGBM a CatBoost), ktoré patria k najpoužívanejším v priemysle.
- Kombinovať viacero modelov pomocou Stackingu a využívať techniky ako Soft Voting, Stacked generalization či Dynamic Ensembles.
- Implementovať moderné koncepty ako Deep Ensembles, Snapshot Ensembling a Model Distillation, čo sú metódy využívané v špičkovom výskume aj v praxi.
Čo je potrebné na absolvovanie kurzu?
- Základná znalosť angličtiny: Minimálne pasívna znalosť na úrovni čítania textu keďže pre knižnice, o ktorých sa budeme učiť sú vytvorené dokumentácie v anglickom jazyku. Všetky video tutoriály sú však v slovenskom jazyku.
- Stabilné internetové pripojenie.
- Aktualizovaný internetový prehliadač Google Chrome, Microsoft Edge alebo Mozilla Firefox.
Čo všetko dostanete?
-
3 Jupyter notebooky, v ktorých si nielen prakticky vyskúšate jednotlivé koncepty, ale môžete ich používať ako osobnú referenciu vo vašom (budúcom) zamestnaní
-
video tutoriály o Pokročilom Machine Learningu v Pythone
-
certifikát o absolvovaní online kurzu Pokročilý Machine Learning v Pythone
- moderované diskusné fórum, v ktorom na vaše otázky odpovedá autor kurzu Róbert Barcík,
-
garancia vrátenia peňazí do 14 dní v prípade nespokojnosti s kurzom