Pokročilé vytváranie atribútov pre Machine Learning v Pythone

2h 29min
Čas
17
Kapitol
Programovanie
Kategória
-
Hodnotenie
Pokročilý
Level
slovenský
Jazyk kurzu

Popis online kurzu Pokročilé vytváranie atribútov pre Machine Learning v Pythone

Kurz Pokročilé vytváranie atribútov pre Machine Learning v Pythone je určený pre tých, ktorí sa chcú v oblasti prípravy dát pre strojové učenie posunúť na vyššiu úroveň. Zameriavame sa v ňom na pokročilé techniky transformácie dát, ktoré výrazne zlepšujú výkonnosť prediktívnych modelov.

Kurz je ideálnym pokračovaním pre absolventov našich kurzov Machine Learning v Pythone a Vytváranie atribútov pre Machine Learning v Pythone, alebo pre všetkých, ktorí už majú základné skúsenosti s tvorbou atribútov a základmi strojového učenia.

Čo sa v kurze Pokročilé vytváranie atribútov pre Machine Learning v Pythone naučíte


Celkový obsah kurzu je rozdelený do troch hlavných častí: Kategorické atribúty, Numerické atribúty a Ostatné atribúty. Každá časť prináša praktické, pokročilé techniky, ktoré si spoločne vysvetlíme na konkrétnych príkladoch v Pythone.

Kategorické atribúty


Na začiatku kurzu sa vrátime k základným metódam enkódovania kategorických dát, ktoré už poznáte, a na ktoré budeme následne nadväzovať.

Naučíte sa:
  • Enkódovanie pomocou sumárnej štatistiky, kde kategórie nahradíme štatistickými vlastnosťami zo vstupného atribútu.
  • Základný Target Encoding, teda nahrádzanie kategórií očakávanou hodnotou cieľovej premennej.
  • Weight of Evidence (WoE) a Leave-one-out Encoding, dve pokročilé techniky využívané hlavne vo finančníctve a risk modelovaní.
  • Použitie CatBoost Encoderu, ktorý kombinuje výhody viacerých prístupov.
  • Feature Cross, teda tvorbu interakcií medzi kategorickými atribútmi, čo môže výrazne zlepšiť schopnosti modelov zachytiť komplexné vzory v dátach.
  • V bonusovej sekcii si ukážeme aj menej tradičné metódy ako String Similarity Encoding, Binary Encoding, Hashing Encoder, Polynomial Encoding či Helmert Encoding.

Tieto techniky vám umožnia pracovať s kategorickými dátami omnoho flexibilnejšie a efektívnejšie.

Numerické atribúty


V druhej časti kurzu sa venujeme numerickým dátam a ich pokročilej transformácii.

Naučíte sa:
  • Stabilizovať rozptyl numerických dát, aby modely lepšie generalizovali.
  • Používať polynómy a splines, ktoré sú špecifické pre zlepšovanie výkonu lineárnych modelov.
  • Diskretizovať numerické atribúty – meniť číselné dáta na kategórie tam, kde je to výhodné.
  • Vytvárať interakcie medzi numerickými atribútmi, čím rozšírime priestor modelu na zachytávanie zložitých vzťahov.
  • A na záver tejto časti si vysvetlíme techniky na redukciu dimenzionality, ktoré vám pomôžu zjednodušiť model a zlepšiť jeho výkonnosť.

Ostatné atribúty


V poslednej časti kurzu sa zameriame na špeciálne typy atribútov a techniky.

Naučíte sa:
  • Tvorbu cyklických atribútov, ktoré sú nevyhnutné napríklad pri práci s dátami obsahujúcimi časové alebo sezónne prvky (mesiace, dni v týždni a pod.).
  • Vyjadrovať extrémnosť pozorovaní, čo vám umožní efektívne pracovať s anomáliami a špecifickými dátovými bodmi.
  • V praktických odporúčaniach na záver kurzu si zhrnieme, kedy ktoré techniky využiť a ako ich správne aplikovať.

Pre koho je kurz Pokročilé vytváranie atribútov pre Machine Learning v Pythone vhodný


Tento kurz je určený pre všetkých, ktorí už ovládajú základy Machine Learningu a Vytvárania atribútov pre Machine Learning

Kurz je ideálny pre dátových analytikov, dátových vedcov, Machine Learning inžinierov a všetkých pokročilých používateľov Pythonu, ktorí sa chcú naučiť, ako z dostupných dát vytvoriť ešte silnejšie atribúty pre modelovanie.

Čo po kurze dokážete a čo si odnesiete?


  • Budete vedieť enkódovať kategorické dáta pomocou pokročilých techník, ktoré sa využívajú v reálnom svete.
  • Zvládnete efektívne vytvárať a kombinovať numerické atribúty na zlepšenie výkonnosti modelov.
  • Naučíte sa detekovať cyklické vzory a správne ich spracovať.
  • Budete ovládať techniky na zníženie počtu atribútov bez straty výkonnosti modelu.
  • Budete vedieť správne vyhodnotiť, ktoré metódy sú vhodné pre rôzne typy problémov.

Kurz vám poskytne praktické zručnosti, ktoré sú okamžite aplikovateľné v reálnych Data Science projektoch.

Má kurz Pokročilé vytváranie atribútov pre Machine Learning v Pythone vstupné požiadavky?


Na úspešné absolvovanie tohto kurzu by ste mali:

  • zvládať prácu v Jupyter notebookoch,
  • ovládať knižnice pandas a numpy,
  • mať základné znalosti štatistiky a strojového učenia,
  • poznať základné techniky vytvárania atribútov (feature engineering).

Ak tieto znalosti zatiaľ nemáte, môžete ich získať v našich kurzoch: Machine Learning v Pythone a Vytváranie atribútov pre Machine Learning v Pythone.

Čo je potrebné na absolvovanie kurzu?

  • Základná znalosť angličtiny: Minimálne pasívna znalosť na úrovni čítania textu pretože praktický Jupyter notebook aj dokumentácie sú v anglickom jazyku. Všetky video tutoriály sú však v slovenskom jazyku.
  • Stabilné internetové pripojenie. Pre sledovanie video lekcií či prácu na cvičeniach je internetové pripojenie neustále potrebné.
  • Aktualizovaný internetový prehliadač Google Chrome, Microsoft Edge alebo Mozilla Firefox.

Čo všetko s kurzom Pokročilé vytváranie atribútov pre Machine Learning v Pythone získate

  • Rozsiahly, praktický Jupyter notebook, v ktorom si nielen prakticky vyskúšate jednotlivé koncepty, ale môžete ho používať ako osobnú referenciu vo vašom (budúcom) zamestnaní,
  • video tutoriály o Pokročilom vytváraní atribútov pre Machine Learning v Pythone
  • moderované diskusné fórum, v ktorom na vaše otázky odpovedá autor kurzu Róbert Barcík,
  • certifikát o absolvovaní online kurzu  Pokročilé vytváranie atribútov pre Machine Learning v Pythone
  • garancia vrátenia peňazí do 14 dní v prípade nespokojnosti s kurzom.

Zoznam kapitol

Vitajte v kurze!
Úvod do kurzu
Dostupné len po zakúpení prístupu
Materiály na stiahnutie
Dostupné len po zakúpení prístupu
Kategorické atribúty
Dôležité zopakovanie si základných metód
Dostupné len po zakúpení prístupu
Enkódovanie cez sumárnu štatistiku vstupu
Dostupné len po zakúpení prístupu
Target Encoding - najzákladnejšia forma
Dostupné len po zakúpení prístupu
Metódy “Weight of Evidence” a Leave-one-out Encoding
Dostupné len po zakúpení prístupu
Transformer CatBoost Encoder
Dostupné len po zakúpení prístupu
Feature Cross - Interakcie kategorických atribútov
Dostupné len po zakúpení prístupu
Bonusové metódy na enkódovanie
Dostupné len po zakúpení prístupu
Numerické atribúty
Stabilizovanie rozptylu
Dostupné len po zakúpení prístupu
Techniky špecifické pre linárne modely: Polynomials a Splines
Dostupné len po zakúpení prístupu
Diskretizácia
Dostupné len po zakúpení prístupu
Interakcie numerických atribútov
Dostupné len po zakúpení prístupu
Redukcia dimenzionality
Dostupné len po zakúpení prístupu
Ostatné atribúty
Cyklické atribúty
Dostupné len po zakúpení prístupu
Vyjadrenie extrémnosti pozorovania
Dostupné len po zakúpení prístupu
Praktické odporúčania
Dostupné len po zakúpení prístupu

Pozri aj tieto kurzy

12 Online kurzov
1 Príspevkov