Machine Learning v Pythone

10h
Čas
87
Kapitol
Programovanie
Kategória
-
Hodnotenie
Pokročilý
Level
slovenský
Jazyk kurzu

Popis kurzu Machine Learning v Pythone

Sú data scientisti čarodejníci keď tvrdia, že dokážu predpovedať budúcnosť? To rozhodne nie. :) Jednoducho vidia vo svojom okolí “funkciu” a odhadnú ju pomocou prediktívneho modelu. Napríklad, zozbierajú dáta o počasí a pomocou nich predpovedajú koľko ľudí sa rozhodne kúpiť si zmrzlinu v nasledujúci deň. 

V tomto kurze sa naučíte vytvárať prediktívne modely pomocou strojového učenia (machine learning)! Po absolvovaní kurzu budete vedieť všetko potrebné na vybratie vhodného prediktívneho modelu, jeho správne vytvorenie a vyhodnotenie jeho úspešnosti. 

Vieme, že najlepšie sa človek naučí nové zručnosti ich praktizovaním, a preto je pre vás pripravených 15 praktických programovacích cvičení v Jupyter notebookoch s úlohami a vysvetleniami jednotlivých konceptov.

Čo sa v kurze Machine Learning v Pythone naučíte

Celkový obsah kurzu je 10 hodín. Prostredie, v ktorom budete počas kurzu programovať sa nazýva Jupyter notebooky s Pythonom. Nižšie je uvedený zoznam oblastí, ktorým sa v kurze venujeme:

  • “Prvotný (baseline) model”: Na začiatku si povieme, čo vás v kurze čaká a rovno začneme aj s učením! Ukážeme si základný baseline model, ktorým môžeme začať prediktívne modelovanie.
  • “Evaluácia modelu a kompozitný kód”: Vytvoríme si náš prvý prediktívny model a povieme si o rôznych metrikách, pomocou ktorých hodnotíme jeho predpovede. Taktiež sa naučíme písať profesionálny kód, ktorý sa používa v reálnom svete.
  • “Rozhodovacie stromy a tuning hyperparametrov”: V tejto časti sa naučíte o modeli s názvom “rozhodovací strom”, ktorý dokáže predpovedať medzi dvoma cieľovými kategóriami. Na zlepšenie výkonnosti modelu sa naučíme kontrolovať nastavenia, takzvané hyperparametre. 
  • “Náhodný les a kNN algoritmus”: Keď sme sa už naučili ako funguje “rozhodovací strom”, môžeme na našich vedomostiach stavať a posunúť sa k modelu “náhodného lesa”, ktorý sa bežne používa v praxi. Taktiež si ukážeme model s názvom kNN, ktorý na vytvorenie predpovedí využíva algoritmus “najbližších susedov” a jeho brata - rNN model. 
  • “Lineárna regresia”: Touto časťou prechádzame do oblasti lineárnych modelov.  Naučíme sa o jednom z najdôležitejších modelov s názvom lineárna regresia, pomocou ktorej vytvoríme predpovede a budeme pozorovať aký efekt majú vstupné dáta na vytvorenú predpoveď.
  • “Regularizované modely”: V tejto časti sa naučíme o 3 regularizovaných modeloch, ktoré sú variáciami lineárnej regresie: Lasso, Ridge a Elastic Net. Tieto modely sú veľmi užitočné, napríklad, v regulovaných prostrediach ako je bankovníctvo alebo poisťovníctvo.
  • “Logistická regresia”: Ďalším z lineárnych modelov je logistická regresia, ktorá dokáže predpovedať dve alebo viac cieľových kategórií. Ukážeme si tiež ako použiť výstupy z tohto modelu. Zhrnieme si aj predpoklady lineárnych modelov, ktoré nám môžu pomôcť zlepšiť výkonnosť modelu. 
  • “Clustering-zhlukovanie”: V tejto časti sa naučíme o modeloch kMeans a DBSCAN, ktoré fungujú na princípe “zhlukovania dát” s podobnými vlastnosťami a na základe týchto skupín vytvárajú predpovede.
  • “Redukcia dimenzionality a detekcia anomálií”: Vysvetlíme si ako fungujú algoritmy, ktoré redukujú dimenzionalitu vstupných dát. Taktiež si ukážeme ako nám machine learning pomáha pre detekovaní anomálií v dátach.

Pre koho je kurz Machine Learning v Pythone vhodný 

Začnime pomyselným “strašiakom” - matematikou. Mnoho ľudí má z modelov strojového učenia a umelej inteligencie príliš veľký rešpekt. Majú pocit, že musia skvelo zvládať matematiku, aby tieto modely mohli pochopiť a používať. Túto obavu však vôbec nemusíte mať. :) Všetky metódy v kurze budú vysvetľované veľmi intuitívne a vizuálne. V kurze sa nachádza minimum rôznych matematických zápisov a rovníc. Počas kurzu nazrieme “pod kapotu” rôznych modelov a metód a pochopíme ako fungujú aj bez komplexných matematických zápisov. Zároveň si však povieme o všetkých dôležitých predpokladoch, ktoré musíme splniť, aby sa v našom modeli niečo nepokazilo.

Kurz je priamym pokračovaním nášho kurzu Vytváranie atribútov pre Machine Learning v Pythone, v ktorom učíme o správnej príprave dát pre machine learning modely. Odporúčame teda najprv absolvovať tento kurz, aby ste získali potrebné základy práce so scikit-learn knižnicou. Okrem toho sa, prosím, uistite, že spĺňate vstupné požiadavky popísané nižšie:

  • zvládate prácu s Jupyter notebookmi,
  • dokážete pracovať s knižnicou pandas a spracovávať v nej dáta,
  • viete čo sú Numpy polia a zvládate základné operácie s nimi,
  • máte základný konceptuálny prehľad o svete Data Science a prístupoch zmeny dát na hodnotné informácie (opis, objavovanie, inferencia, prediktívne modelovanie),
  • zvládate stredoškolskú matematiku a základy deskriptívnej štatistiky (priemer, medián, modus, variabilita, atď.).

Čo po kurze dokážete a čo si odnesiete?

V posledných rokoch firmy ponúkajú mnoho pozícií s názvom “Data Scientist”. Zvyčajnou požiadavkou je schopnosť aplikovať prediktívne modelovanie v Pythone. Presne túto schopnosť získate v kurze. Absolventi tohto kurzu častokrát fungujú na pozícií “Junior Data Scientist”, prípadne sú v roli “experimentátorov”. Experimentujú s rôznymi dátami vo firmách a vytvárajú jednoduché prototypy modelov strojového učenia. Ak sa nejaký z týchto experimentov vydarí, začnú spolupracovať so skúsenejšími data scientistmi na vytvorení kompletného produktu dátovej vedy z ich skorého prototypu.

Z kurzu si odnesiete praktické skúsenosti s vytváraním modelov strojového učenia nad štrukturovanými dátami. Budete vedieť ako fungujú algoritmy prediktívnych modelov a ovládať rôzne evaluačné techniky na základe použitého modelu. 

V prípade, že smerujete v budúcnosti do Data Science pozície, ktorá si vyžaduje aj prácu so spracovaním obrázkov a textu pomocou machine learning-u, môžete priamo pokračovať do ďalšieho kurzu s názvom “Neurónové siete, machine learning pre text a obrázky”.

Čo je potrebné na absolvovanie kurzu Machine Learning v Pythone

  • Vlastný laptop. Firemný laptop môže spôsobovať problémy, napríklad, pri prístupoch na Google Drive prostredie alebo pri inštalácii knižníc.
  • Základná znalosť angličtiny: Minimálne pasívna znalosť na úrovni čítania textu keďže pre knižnice, o ktorých sa budeme učiť sú vytvorené dokumentácie v anglickom jazyku. Všetky video tutoriály sú však v slovenskom jazyku.
  • Stabilné internetové pripojenie. Pre sledovanie video lekcií či prácu na cvičeniach je internetové pripojenie neustále potrebné.
  • Aktualizovaný internetový prehliadač Google Chrome, Microsoft Edge alebo Mozilla Firefox.
  • (odporúčané) Google účet. S Jupyter notebookmi odporúčame pracovať v prostredí Google Colaboratory. V prípade, že Google účet nemáte a ani si ho nechcete zakladať, bude k dispozícii druhá alternatíva na lokálnu prácu s Jupyter notebookmi.

Čo všetko s kurzom Machine Learning v Pythone získate

  • 15 Jupyter notebookov, v ktorých si nielen prakticky vyskúšate jednotlivé koncepty, ale môžete ich používať ako osobnú referenciu vo vašom (budúcom) zamestnaní,
  • video tutoriály o Machine Learningu v Pythone,
  • moderované diskusné fórum, v ktorom na vaše otázky odpovedá autor kurzu Róbert Barcík,
  • certifikát o absolvovaní online kurzu Machine Learning v Pythone,
  • garancia vrátenia peňazí do 14 dní v prípade nespokojnosti s kurzom.

Zoznam kapitol

Vitajte v kurze!
O tomto kurze
Dostupné len po zakúpení prístupu
Nastavovanie prostredia a materiály na stiahnutie
Dostupné len po zakúpení prístupu
1. Prvotný (baseline) model
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Základná intuícia prvotného modelu
Dostupné len po zakúpení prístupu
Dummy classifier a Dummy regressor
Dostupné len po zakúpení prístupu
Baseline model založený na heuristike
Dostupné len po zakúpení prístupu
2. Evaluácia modelu
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Tréningové, zadržané a produkčné dáta
Dostupné len po zakúpení prístupu
Krížová validácia (cross validation)
Dostupné len po zakúpení prístupu
Obšírna intuícia
Dostupné len po zakúpení prístupu
Vypočítanie CV metrík
Dostupné len po zakúpení prístupu
Iterátory pre krížovú validáciu
Dostupné len po zakúpení prístupu
Vyhodnotenie klasifikačného modelu
Dostupné len po zakúpení prístupu
Vyhodnotenie regresného modelu
Dostupné len po zakúpení prístupu
Je náš model dostatočné dobrý?
Dostupné len po zakúpení prístupu
3. Prahové hodnoty a krivky
Prahové hodnoty a krivky
Dostupné len po zakúpení prístupu
4. Kompozitný kód
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
ColumnTransformer
Dostupné len po zakúpení prístupu
Vyberanie atribútov v ColumnTransformeri
Dostupné len po zakúpení prístupu
Pipeline
Dostupné len po zakúpení prístupu
Komplexnejšie kompozity
Dostupné len po zakúpení prístupu
5. Tuning hyperparametrov
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Hyperparameter grid
Dostupné len po zakúpení prístupu
Odhadovanie času hľadania
Dostupné len po zakúpení prístupu
Kompozity a tuning hyperparametrov
Dostupné len po zakúpení prístupu
6. Rozhodovací strom (Decision Tree)
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Úvod do rozhodovacích stromov
Dostupné len po zakúpení prístupu
Predikovanie pomocou rozhodovacieho stromu
Dostupné len po zakúpení prístupu
Rozhodovacie stromy pre regresné problémy
Dostupné len po zakúpení prístupu
Hyperparametre rozhodovacích stromov
Dostupné len po zakúpení prístupu
7. Náhodný les (Random Forest)
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Prístup ensemble modelov
Dostupné len po zakúpení prístupu
Hyperparametre náhodného lesa
Dostupné len po zakúpení prístupu
Dôležitosť atribútov v náhodnom lese
Dostupné len po zakúpení prístupu
8. Algoritmy založené na meraní vzdialenosti
Vitajte v kapitole!
Dostupné len po zakúpení prístupu
Intuícia modelov založených na vzdialenosti
Dostupné len po zakúpení prístupu
kNN (k-Nearest Neighbors) algoritmus
Dostupné len po zakúpení prístupu
Rôzne spôsoby merania vzdialenosti
Dostupné len po zakúpení prístupu
rNN (Radius-nearest Neighbors) algoritmus
Dostupné len po zakúpení prístupu
9. Základy nevybalansovaných dát
Nevybalansované dáta
Dostupné len po zakúpení prístupu
10. Lineárna regresia
Úvod do lineárnych modelov
Dostupné len po zakúpení prístupu
Uvedenie do problému
Dostupné len po zakúpení prístupu
Viacnásobná lineárna regresia
Dostupné len po zakúpení prístupu
Chyby lineárnej regresie
Dostupné len po zakúpení prístupu
Regresné metriky
Dostupné len po zakúpení prístupu
Trénovanie lineárnej regresie
Dostupné len po zakúpení prístupu
Odľahlé hodnoty (outliers)
Dostupné len po zakúpení prístupu
Interpretácia lineárnej regresie a ako interpretovať prienik
Dostupné len po zakúpení prístupu
Interpretácia sklonu jednoduchej lineárnej regresie
Dostupné len po zakúpení prístupu
Interpretácia sklonu vo viacnásobnej lineárnej regresii
Dostupné len po zakúpení prístupu
Porovnávanie vplyvu vstupných premenných na výstup
Dostupné len po zakúpení prístupu
Interpretácia koeficientov kategorických premenných
Dostupné len po zakúpení prístupu
Interpretácia premenných v modeli so zmiešanými typmi premenných
Dostupné len po zakúpení prístupu
Zhrnutie
Dostupné len po zakúpení prístupu
11. Regularizované lineárne modely
Polynomiálna regresia
Dostupné len po zakúpení prístupu
Kolinearita - polynomiálna regresia
Dostupné len po zakúpení prístupu
Kolinearita - dummy pasca
Dostupné len po zakúpení prístupu
Pretrénovanie / podtrénovanie
Dostupné len po zakúpení prístupu
Regularizácia
Dostupné len po zakúpení prístupu
Alpha
Dostupné len po zakúpení prístupu
Regularizované modely
Dostupné len po zakúpení prístupu
Ktorý regularizovaný model si vybrať
Dostupné len po zakúpení prístupu
12. Logistická regresia
Úvod do logistickej regresie
Dostupné len po zakúpení prístupu
Klasifikačný problém a príklady použitia
Dostupné len po zakúpení prístupu
Binárna logistická regresia
Dostupné len po zakúpení prístupu
Binárna logistická regresia - predpovede triedy
Dostupné len po zakúpení prístupu
Polynomiálna logistická regresia
Dostupné len po zakúpení prístupu
Koeficienty
Dostupné len po zakúpení prístupu
Nákladová funkcia
Dostupné len po zakúpení prístupu
Viactriedna klasifikácia
Dostupné len po zakúpení prístupu
Príprava dát
Dostupné len po zakúpení prístupu
13. Zhlukovanie
Úvod do učenia bez učiteľa
Dostupné len po zakúpení prístupu
Úvod do zhlukovania
Dostupné len po zakúpení prístupu
K-means
Dostupné len po zakúpení prístupu
K-means tipy
Dostupné len po zakúpení prístupu
DBSCAN
Dostupné len po zakúpení prístupu
DBSCAN tipy
Dostupné len po zakúpení prístupu
14. Redukcia dimenzionality
Úvod do redukcie dimenzionality
Dostupné len po zakúpení prístupu
PCA
Dostupné len po zakúpení prístupu
PCA tipy
Dostupné len po zakúpení prístupu
Učenie manifoldu
Dostupné len po zakúpení prístupu
15. Detekcia anomálií
Úvod do detekcie anomálií
Dostupné len po zakúpení prístupu
Faktor lokálnej odľahlej hodnoty (Local Outlier Factor)
Dostupné len po zakúpení prístupu
Izolujúci les (Isolation Forest)
Dostupné len po zakúpení prístupu
Čo ďalej?
Diskusia a hodnotenie
Dostupné len po zakúpení prístupu
Gratulujem! Čo ďalej?
Dostupné len po zakúpení prístupu

Pozri aj tieto kurzy

10 Online kurzov
1 Príspevkov
Prejsť na kanál