Popis online kurzu Pokročilé vytváranie atribútov pre Machine Learning v Pythone
Kurz Pokročilé vytváranie atribútov pre Machine Learning v Pythone je určený pre tých, ktorí sa chcú v oblasti prípravy dát pre strojové učenie posunúť na vyššiu úroveň. Zameriavame sa v ňom na pokročilé techniky transformácie dát, ktoré výrazne zlepšujú výkonnosť prediktívnych modelov.
Čo sa v kurze Pokročilé vytváranie atribútov pre Machine Learning v Pythone naučíte
Celkový obsah kurzu je rozdelený do troch hlavných častí: Kategorické atribúty, Numerické atribúty a Ostatné atribúty. Každá časť prináša praktické, pokročilé techniky, ktoré si spoločne vysvetlíme na konkrétnych príkladoch v Pythone.
Kategorické atribúty
Na začiatku kurzu sa vrátime k základným metódam enkódovania kategorických dát, ktoré už poznáte, a na ktoré budeme následne nadväzovať.
Naučíte sa:
-
Enkódovanie pomocou sumárnej štatistiky, kde kategórie nahradíme štatistickými vlastnosťami zo vstupného atribútu.
-
Základný Target Encoding, teda nahrádzanie kategórií očakávanou hodnotou cieľovej premennej.
-
Weight of Evidence (WoE) a Leave-one-out Encoding, dve pokročilé techniky využívané hlavne vo finančníctve a risk modelovaní.
-
Použitie CatBoost Encoderu, ktorý kombinuje výhody viacerých prístupov.
-
Feature Cross, teda tvorbu interakcií medzi kategorickými atribútmi, čo môže výrazne zlepšiť schopnosti modelov zachytiť komplexné vzory v dátach.
- V bonusovej sekcii si ukážeme aj menej tradičné metódy ako String Similarity Encoding, Binary Encoding, Hashing Encoder, Polynomial Encoding či Helmert Encoding.
Tieto techniky vám umožnia pracovať s kategorickými dátami omnoho flexibilnejšie a efektívnejšie.
Numerické atribúty
V druhej časti kurzu sa venujeme numerickým dátam a ich pokročilej transformácii.
Naučíte sa:
-
Stabilizovať rozptyl numerických dát, aby modely lepšie generalizovali.
- Používať polynómy a splines, ktoré sú špecifické pre zlepšovanie výkonu lineárnych modelov.
-
Diskretizovať numerické atribúty – meniť číselné dáta na kategórie tam, kde je to výhodné.
- Vytvárať interakcie medzi numerickými atribútmi, čím rozšírime priestor modelu na zachytávanie zložitých vzťahov.
- A na záver tejto časti si vysvetlíme techniky na redukciu dimenzionality, ktoré vám pomôžu zjednodušiť model a zlepšiť jeho výkonnosť.
Ostatné atribúty
V poslednej časti kurzu sa zameriame na špeciálne typy atribútov a techniky.
Naučíte sa:
-
Tvorbu cyklických atribútov, ktoré sú nevyhnutné napríklad pri práci s dátami obsahujúcimi časové alebo sezónne prvky (mesiace, dni v týždni a pod.).
-
Vyjadrovať extrémnosť pozorovaní, čo vám umožní efektívne pracovať s anomáliami a špecifickými dátovými bodmi.
- V praktických odporúčaniach na záver kurzu si zhrnieme, kedy ktoré techniky využiť a ako ich správne aplikovať.
Pre koho je kurz Pokročilé vytváranie atribútov pre Machine Learning v Pythone vhodný
Tento kurz je určený pre všetkých, ktorí už ovládajú základy Machine Learningu a Vytvárania atribútov pre Machine Learning
Kurz je ideálny pre dátových analytikov, dátových vedcov, Machine Learning inžinierov a všetkých pokročilých používateľov Pythonu, ktorí sa chcú naučiť, ako z dostupných dát vytvoriť ešte silnejšie atribúty pre modelovanie.
Čo po kurze dokážete a čo si odnesiete?
- Budete vedieť enkódovať kategorické dáta pomocou pokročilých techník, ktoré sa využívajú v reálnom svete.
- Zvládnete efektívne vytvárať a kombinovať numerické atribúty na zlepšenie výkonnosti modelov.
- Naučíte sa detekovať cyklické vzory a správne ich spracovať.
- Budete ovládať techniky na zníženie počtu atribútov bez straty výkonnosti modelu.
- Budete vedieť správne vyhodnotiť, ktoré metódy sú vhodné pre rôzne typy problémov.
Kurz vám poskytne praktické zručnosti, ktoré sú okamžite aplikovateľné v reálnych Data Science projektoch.
Má kurz Pokročilé vytváranie atribútov pre Machine Learning v Pythone vstupné požiadavky?
Na úspešné absolvovanie tohto kurzu by ste mali:
- zvládať prácu v Jupyter notebookoch,
- ovládať knižnice pandas a numpy,
- mať základné znalosti štatistiky a strojového učenia,
- poznať základné techniky vytvárania atribútov (feature engineering).
Čo je potrebné na absolvovanie kurzu?
- Základná znalosť angličtiny: Minimálne pasívna znalosť na úrovni čítania textu pretože praktický Jupyter notebook aj dokumentácie sú v anglickom jazyku. Všetky video tutoriály sú však v slovenskom jazyku.
- Stabilné internetové pripojenie. Pre sledovanie video lekcií či prácu na cvičeniach je internetové pripojenie neustále potrebné.
- Aktualizovaný internetový prehliadač Google Chrome, Microsoft Edge alebo Mozilla Firefox.
Čo všetko s kurzom Pokročilé vytváranie atribútov pre Machine Learning v Pythone získate
-
Rozsiahly, praktický Jupyter notebook, v ktorom si nielen prakticky vyskúšate jednotlivé koncepty, ale môžete ho používať ako osobnú referenciu vo vašom (budúcom) zamestnaní,
-
video tutoriály o Pokročilom vytváraní atribútov pre Machine Learning v Pythone
- moderované diskusné fórum, v ktorom na vaše otázky odpovedá autor kurzu Róbert Barcík,
-
certifikát o absolvovaní online kurzu Pokročilé vytváranie atribútov pre Machine Learning v Pythone
-
garancia vrátenia peňazí do 14 dní v prípade nespokojnosti s kurzom.