Popis online kurzu Spracovanie dát v Pythone
Na to, aby sme vedeli z dát získať užitočné informácie, ich potrebujeme správne vyčistiť a spracovať. Táto schopnosť je veľmi dôležitá pre každého dátového analytika či dátového vedca a vy ju môžete získať v tomto kurze! Naučíte sa ako zoskupovať a agregovať dáta, spojiť rôzne tabuľky do jedného celku, transformovať dáta podľa vašich potrieb, upravovať textové údaje a vyriešiť chýbajúce hodnoty v datasete.
Vieme, že najlepšie sa človek naučí nové zručnosti ich praktizovaním, a preto je pre vás pripravených 5 praktických programovacích cvičení v Jupyter notebookoch s úlohami a vysvetleniami jednotlivých konceptov.
Čo sa v kurze Spracovanie dát v Pythone naučíte
Celkový obsah kurzu sú 2 hodiny. Prostredie, v ktorom budete počas kurzu programovať sa nazýva Jupyter notebooky s Pythonom. Na spracovanie dát budeme používať Python knižnicu pandas, ktorá je základným nástrojom každého dátového analytika. Nižšie je uvedený zoznam oblastí, ktorým sa v kurze venujeme:
-
Agregácia dát: Aby sme našim dátam lepšie porozumeli, naučíme sa ich správne zoskupovať a agregovať pomocou rôznych štatistík. Ukážeme si techniky, pomocou ktorých vieme zistiť, napríklad, koľko zákazníkov navštívilo náš obchod každý deň alebo ktoré produkty sú najpredávanejšie. Pomocou funkcií ako sú groupby a agg si vytvoríme sety, ktoré môžeme efektívne analyzovať aj vizualizovať.
-
Zlučovanie dát: Dáta sa častokrát nachádzajú v separátnych tabuľkách. Napríklad, v jednej tabuľke máme osobné údaje zákazníkov, v druhej ich objednávky z e-shopu. Ak chceme tieto dáta analyzovať, potrebujeme tabuľky spojiť. V tejto časti si teda vysvetlíme rôzne typy spojenia tabuliek ako sú merge a join na vytvorenie komplexnejšieho datasetu, ktoré bude obsahovať všetky potrebné dáta na podrobnú analýzu.
-
Transformovanie dát: V tejto kapitole sa naučíte, ako môžeme transformovať dáta pomocou funkcií ako sú map, apply a lambda. Tieto techniky nám umožnia prispôsobiť dáta presne podľa našich potrieb.
-
Práca s textovými dátami: Práca s textovými dátami môže byť zložitá a vyžaduje špeciálne techniky na ich správne spracovanie. V tejto časti sa naučíte metódy na upravovanie a čistenie textových dát ako je odstránenie problémových neviditeľných znakov, oddelenie textov či nahradenie určitých slov novými.
-
Práca s chýbajúcimi hodnotami: Chýbajúce hodnoty nám môžu spôsobovať problémy pri analýze dát. Preto sa naučíme ako identifikovať štandardné aj neštandardné chýbajúce dáta. Následne sa pozrieme na rôzne metódy, ako tieto hodnoty z datasetu odstrániť alebo nahradiť konštantnou či vypočítanou hodnotou.
Pre koho je kurz Spracovanie dát v Pythone vhodný?
Kurz Spracovanie dát v Pythone je ideálny pre každého, kto chce získať praktické zručnosti v spracovaní a analýze dát pomocou Pythonu. Pre úspešné absolvovanie tohto kurzu sa, prosím, uistite, že spĺňate nasledujúce požiadavky:
- máte znalosť o základných štatistických metódach ako počítanie priemeru, minima, maxima alebo smerodajnej odchýlky,
- máte základné znalosti práce v Pythone,
- máte základné znalosti práce s pandas knižnicou, ako sú základné operácie a manipulácia dataframes,
- máte základné znalosti práce s numpy knižnicou.
Pokiaľ nemáte vyššie uvedené znalosti a skúsenosti, odporúčame si najprv prejsť náš úvodný kurz do Pythonu s názvom “
Úvod do Pythonu pre Data Science”, v ktorom sa naučíte potrebné základy.
Čo po kurze dokážete a čo si odnesiete?
Dáta sú všade okolo nás, bez ohľadu na to, v akom odvetví pracujete alebo by ste chceli pracovať. Schopnosť efektívne upravovať a analyzovať dáta je jednou z najdôležitejších a najžiadanejších zručností. Online kurz Spracovanie dát v Pythone vás naučí, ako dáta upraviť do podoby vhodnej na ich analýzu a získavanie užitočných informácií.
Čo je potrebné na absolvovanie kurzu Spracovanie dát v Pythone?
-
Vlastný laptop. Firemný laptop môže spôsobovať problémy, napríklad, pri prístupoch na Google Drive prostredie alebo pri inštalácii knižníc.
-
Základná znalosť angličtiny: Minimálne pasívna znalosť na úrovni čítania textu keďže pre knižnice, o ktorých sa budeme učiť sú vytvorené dokumentácie v anglickom jazyku. Všetky video tutoriály sú však v slovenskom jazyku.
-
Stabilné internetové pripojenie. Pre sledovanie video lekcií či prácu na cvičeniach je internetové pripojenie neustále potrebné.
-
Aktualizovaný internetový prehliadač Google Chrome, Microsoft Edge alebo Mozilla Firefox.
- (odporúčané) Google účet. S Jupyter notebookmi odporúčame pracovať v prostredí Google Colaboratory. V prípade, že Google účet nemáte a ani si ho nechcete zakladať, bude k dispozícii druhá alternatíva na lokálnu prácu s Jupyter notebookmi.
Čo všetko s kurzom Spracovanie dát v Pythone získate
-
5 Jupyter notebookov, v ktorých si nielen prakticky vyskúšate jednotlivé koncepty, ale môžete ich používať ako osobnú referenciu vo vašom (budúcom) zamestnaní,
-
video tutoriály o Spracovaní dát v Pythone,
-
certifikát o absolvovaní online kurzu Spracovanie dát v Pythone,
-
garancia vrátenia peňazí do 14 dní v prípade nespokojnosti s kurzom.