Tečaj "Podatkovni analitik" - tečaj 96.000 rub. iz delavnice Yandex, usposabljanje 7 mesecev, datum 7. december 2023.
Miscellanea / / December 02, 2023
Podatkovni analitik črpa pomen iz številk in vrednosti: vidi trende, napove dogodke in pomaga podjetju razumeti stranke, optimizirati procese in rasti.
Trg potrebuje strokovnjake, ki znajo koristno uporabljati podatke. Študija kadrovskega podjetja Ancor za september 2022 je pokazala, da 45 % ruskih podjetij išče analitike, ki bi se pridružili svoji ekipi.
Veščine, ki se jih boste naučili na tečaju
Naziv delovnega mesta
Analitik, podatkovni analitik, podatkovni analitik
Razvojne možnosti: Produktni analitik, tržni analitik, BI analitik, specialist za podatkovne znanosti
Tu so tehnologije in orodja, ki jih boste uporabljali:
Python
Jupyter Notebook
SQL
PostgreSQL
Tableau
A/B testi
Začnite služiti denar z analizo
Začeli boste z mladinskega položaja, potem pa le še naprej. Vzpenjali se boste po karierni lestvici in rasli v vrednosti. In nekega dne zate ne bo cene.
Celoten program tečaja podatkovne analitike
Redno ga posodabljamo, da zagotovimo, da ustreza potrebam industrije in delodajalcev.
Z drugimi besedami, naučiš se samo tistega, kar ti bo zagotovo koristilo pri delu.
Brezplačni del - 1 teden
Brezplačen uvod: Osnove Pythona in analiza podatkov
Naučite se osnovnih konceptov analize podatkov in razumejte, kaj počnejo podatkovni analitiki in podatkovni znanstveniki.
• moskovski Catnamycs. Prikaz podatkov na zaslonu. datoteke CSV. Delo s tabelami. Toplotne karte. Množenje stolpca s celim številom.
• Napake v kodi. Sintaksne napake. Napake pri poimenovanju. Napake pri deljenju z ničlo. Napake pri uvozu modula.
• Spremenljivke in podatkovni tipi. Spremenljivke. Vrste podatkov. Aritmetične operacije s števili in nizi.
• Kako postavljati hipoteze. Hipoteze. HADI cikli. Analitično razmišljanje. Branje grafov.
• Kaj počnejo podatkovni znanstveniki. Naloge analitika. Razjasnitev nalog. Razgradnja. Faze projekta.
• Preverjanje konverzij. Pretvorba. Raziskovanje podatkov. Oblikovanje sklepov.
• Povračilo oglaševalskih akcij. Stolpčni grafikon. Razlika elementov. Indeksiranje v stolpcih.
• Strojno učenje in podatkovna znanost. Usposabljanje strojnega učenja. Iskanje edinstvenih vrednosti v stolpcih. Logično indeksiranje. Združevanje vrednosti v tabelo. Napake pri napovedovanju.
• Končni projekt. Segmentacija uporabnikov.
PythonPandasErrorsSeabornHypothesesConversionVariablesData TypesHeatmaps
1 sprint 3 tedne
Osnovni Python
Poglobite se v programski jezik Python in knjižnico Pandas.
• Spremenljivke in podatkovni tipi. Jezik Python. Spremenljivke. Prikaz podatkov na zaslonu. Prikaz predmetov na zaslonu. Obravnava napak, poskusi... razen operaterja. Vrste podatkov. Pretvorbe podatkovnih vrst.
• Črte. Indeksi v vrsticah. Izrezi črt. Operacije na nizih. Metode nizov. Oblikovanje nizov, metoda format(), f-nizi.
• Seznami. Indeksi v seznamih. Seznam rezin. Dodajanje predmetov na seznam. Odstranjevanje elementov seznama. Seštevanje in množenje seznamov. • Razvrščanje seznamov. Poiščite elemente na seznamu. Razdelitev niza v seznam nizov, združevanje seznama nizov v niz.
• Zanka za. Cikli. Naštevanje elementov. Ponavljanje indeksov elementov. Obdelava elementov seznama z uporabo zank: iskanje vsote in produkta elementov.
• Ugnezdeni seznami. Vrtanje po ugnezdenih seznamih s štetjem vrednosti. Dodajanje elementov na ugnezdene sezname. Razvrščanje ugnezdenih seznamov.
• Pogojni operator. Medtem ko zanka. Logični podatkovni tip. Logične vrednosti. Logični izrazi. Sestavljeni logični izrazi. Pogojni stavek if...elif...else. Razvejanje. Filtriranje seznamov s pogojnim operatorjem. Medtem ko zanka.
• Funkcije. Dodeljevanje funkcij. Parametri in argumenti. Parametri s privzetimi vrednostmi. Pozicijski in imenovani argumenti. Vrnitev rezultata iz funkcije.
• Slovarji. Ključi in vrednosti. Iskanje vrednosti po ključu. Dodajanje elementov v slovar. Seznam slovarjev. Lep izpis slovarjev.
• Knjižnica Pandas. Branje datotek csv. Dataframe. Konstruktor podatkovnega okvirja. Tiskanje prve in zadnje vrstice podatkovnega okvira. Indeksiranje v podatkovnih okvirih. Indeksiranje v stolpcih serije.
• Predobdelava podatkov. Načelo GIGO. Preimenovanje stolpcev podatkovnega okvira. Obravnava manjkajočih vrednosti. Ravnanje z eksplicitnimi in implicitnimi dvojniki.
• Analiza podatkov in predstavitev rezultatov. Združevanje podatkov. Razvrščanje podatkov. Osnove deskriptivne statistike.
• Jupyter Notebook - zvezek v celico. Jupyter Notebook vmesnik. Bližnjice Jupyter Notebook.
LoopsPythonPandasStringsListsFunctionsDictionariesDataFrameSvariablesDataTypesConditional Statement
Projekt
Primerjajte uporabniške podatke Yandex Music glede na mesto in dan v tednu.
2 sprint 2 tedna
Predobdelava podatkov
Naučite se očistiti podatke iz izstopajočih vrednosti, izpustov in dvojnikov ter pretvoriti različne formate podatkov.
• Delo z izkaznicami. Pretvorba. Piškotki. Kategorične in kvantitativne spremenljivke. Ravnanje z vrzelmi v kategoričnih spremenljivkah. Ravnanje z vrzelmi v kvantitativnih spremenljivkah. Obravnava vrzeli v kvantitativnih spremenljivkah po kategorijah.
• Spreminjanje tipov podatkov. Branje datotek Excel. Pretvori serijo v številsko vrsto. Številski modul, metoda abs(). Delo z datumom in uro. Obravnava napak, poskusi... razen operaterja. Spajanje podatkovnih okvirov, metoda merge(). Vrtilne tabele.
• Iskanje dvojnikov. Iskanje dvojnikov, občutljivo na velike in male črke.
• Kategorizacija podatkov. Razgradnja tabel. Kategorizacija po številčnih razponih. Kategorizirajte na podlagi več vrednosti na vrstico.
• Sistematično in kritično mišljenje pri delu analitika. Sistemsko razmišljanje. Vzroki za napake v podatkih. Kritično razmišljanje.
PythonPandasGap handlingObdelava podatkovDuplicate processingKategorizacija podatkov
Projekt
Analizirati podatke o bančnih komitentih in ugotoviti delež kreditno sposobnih.
3 sprint 2 tedna
Raziskovalna analiza podatkov
Naučite se osnov verjetnosti in statistike. Uporabite jih za raziskovanje osnovnih lastnosti podatkov, iskanje vzorcev, porazdelitev in anomalij. Spoznajte knjižnico Matplotlib. Rišite diagrame in vadite analizo grafov.
• Prvi grafi in zaključki. Uporaba vrtilnih tabel. Stolpični diagram. Distribucije. Diagram obsega.
• Študija podatkovnih rezin. Metoda query(). Delo z datumom in uro. Risanje grafov z metodo plot(). Occamova britvica.
• Delo z več viri podatkov. Podatkovna rezina, ki temelji na zunanjih objektih. Dodajanje novih stolpcev v podatkovni okvir. Dodajanje podatkov iz drugih podatkovnih okvirov. Preimenovanje stolpcev. Združevanje tabel z uporabo metod merge() in join().
• Razmerja podatkov. Graf raztrosa. Korelacija spremenljivk. Matrika razpršitve.
• Validacija rezultatov. Utrjevanje skupin. Razdelitev podatkov v skupine.
PythonPandasMatplotlibHistogrami Podatkovne rezine Analiza podatkov ScatterplotScatterplot Vizualizacija podatkov Opisna statistika
Projekt
Raziščite arhiv oglasov za prodajo nepremičnin v Sankt Peterburgu in Leningradski regiji.
4 sprint 3 tedne
Statistična analiza podatkov
Naučite se analizirati razmerja v podatkih z uporabo statističnih metod. Naučite se, kaj so statistična pomembnost in hipoteze.
• Kombinatorika. Kombinacije. Pravilo množenja. Preureditve. Število permutacij. Umestitve. Število umestitev. Kombinacije. Število kombinacij.
• Teorija verjetnosti. Eksperimentirajte. Verjetnostni prostor. Dogodki. Verjetnost. Dogodki, ki se križajo in se med seboj izključujejo. Euler-Vennov diagram. Zakon velikih števil.
• Opisna statistika. Kategorične in kvantitativne spremenljivke. Način in mediana. Povprečna vrednost. Razpršenost. Standardni odklon. Kvartili in percentili. Diagram obsega. Stolpčni grafikon. Frekvenčna gostota. Stolpični diagram.
• Naključne spremenljivke. Diskretna naključna spremenljivka. Porazdelitev verjetnosti za diskretno naključno spremenljivko. Kumulativna funkcija (distribucijska funkcija) diskretne naključne spremenljivke. Matematično pričakovanje diskretne naključne spremenljivke. Disperzija diskretne slučajne spremenljivke.
• Distribucije. Bernoullijev poskus. Binomski eksperiment. Binomska porazdelitev. Neprekinjena enakomerna porazdelitev. Normalna porazdelitev. Standardna normalna porazdelitev. CDF in PPF za normalno porazdelitev. Poissonova porazdelitev. Približek ene porazdelitve z drugo.
• Preizkušanje hipotez. Splošna populacija. Vzorec. Porazdelitev vzorčenja. Centralni mejni izrek. Enostranske in dvostranske hipoteze. P-vrednost. Testiranje enostranskih in dvostranskih hipotez za en vzorec. Testiranje hipoteze o enakosti povprečij dveh splošnih populacij. Testiranje hipoteze o enakosti povprečij za odvisne vzorce.
ScipyNumpyPythonPandasMatplotlibKombinatorika Distribucije Preizkušanje hipotez Teorija verjetnosti
Projekt
Preizkusite hipoteze o storitvi izposoje skuterjev, ki vam bodo pomagale pri rasti vašega podjetja.
Ekstra sprint
Teorija verjetnosti
Spomnite se ali prepoznajte osnovne pojme teorije verjetnosti: neodvisni, nasprotni, nekompatibilni dogodki itd. Na preprostih primerih in zabavnih nalogah boste vadili delo s številkami in gradili logiko rešitev.
To je izbirni sprint. To pomeni, da vsak študent sam izbere eno od možnosti:
• Obvladajte dodatni sprint 10 kratkih lekcij, obnovite teorijo in rešite probleme.
• Odprite samo blok z nalogami za razgovor, priklic vaje brez teorije.
• Popolnoma izpustite tečaj ali se nanj vrnite, ko je čas in potreba.
Python Dogodki VerjetnostBayesov izrek Naključne spremenljivke Teorija verjetnosti Statistična analiza podatkov
5 sprintov 1 teden
Končni projekt prvega modula
Naučite se izvajati predhodne raziskave podatkov ter oblikovati in testirati hipoteze.
ScipyNumpyPythonPandasMatplotlib Analiza podatkov Preizkušanje hipotez Obdelava podatkov
Projekt
Poiščite vzorce v podatkih o prodaji iger.
6 sprint 2 tedna
Osnovni SQL
Naučite se osnov strukturiranega poizvedbenega jezika SQL in relacijske algebre za delo z bazami podatkov. Seznanite se z značilnostmi dela v PostgreSQL, priljubljenem sistemu za upravljanje baz podatkov (DBMS). Naučite se pisati poizvedbe različnih stopenj kompleksnosti in prevesti poslovne probleme v SQL. Delali boste z bazo podatkov spletne trgovine, ki je specializirana za filme in glasbo.
• Uvod v baze podatkov. Sistemi za upravljanje baz podatkov (DBMS). jezik SQL. SQL poizvedbe. Oblikovanje poizvedb SQL.
• Podatkovne rezine v SQL. Vrste podatkov v PostgreSQL. Pretvorba podatkovnega tipa. stavek WHERE. Logični operatorji. Podatkovne rezine. Operatorji IN, LIKE, BETWEEN. Delo z datumom in uro. Obravnava manjkajočih vrednosti. Pogojna konstrukcija CASE.
• Združevalne funkcije. Združevanje in razvrščanje podatkov. Matematične operacije. Funkcije združevanja. Združevanje podatkov. Razvrščanje podatkov. Filtriranje po zbirnih podatkih, operater HAVING.
• Relacije med tabelami. Vrste povezav tabel. ER diagrami. Preimenovanje polj in tabel. Vzdevki. Združevanje tabel. Vrste spojev: NOTRANJI SPOJ, LEVI SPOJ, DESNI SPOJ, POLNI ZUNANJI SPOJ. Alternativni tipi sindikatov UNION in UNION ALL.
• Podpoizvedbe in skupni izrazi tabele. Podpoizvedbe. Podpoizvedbe v FROM. Podpoizvedbe v WHERE. Kombinacija združevanj in podpoizvedb. Skupni tabelni izrazi (CTE). Spremenljivost zahtev.
SQLDBMSPostgreSQLPodpoizvedbeBaze podatkovSQL poizvedbe Filtriranje podatkov Razvrščanje podatkovZdruževanje podatkovZdruževanje tabel Skupni izrazi tabel
Projekt
Napisali boste niz poizvedb različnih zahtevnosti v bazo podatkov, ki hrani podatke o tveganih vlagateljih, startupih in naložbah vanje.
7 sprint 3 tedne
Analiza kazalnikov poslovanja
Preberite, kaj so meritve v poslu. Naučite se uporabljati orodja za analizo podatkov v poslovanju: kohortna analiza, prodajni lijak in ekonomika enote.
• Metrike in tokovi. Pretvorba. lijaki. Marketinški lijak. Vtisi. Kliki. CTR Produktni tok.
• Kohortna analiza. Uporabniški profil. stopnja zadrževanja. Stopnja odliva. Horizont analize. Vizualizacija kohortne analize. Analiza zadrževanja naključnih kohort. Konverzija v kohortni analizi. Izračun metrik v Pythonu.
• Ekonomika enote. Meritve LTV, CAC, ROI. ARPU, ARPPU. Izračun metrik v Pythonu. Napredna vizualizacija metrik. Sharey parameter. Drseče povprečje.
• Meritve po meri. Ocena aktivnosti uporabnika. Uporabniška seja. Preiskava anomalije.
Metrike Tokovi Konverzija Ekonomika enote Kohortna analiza Meritve izdelka Meritve trženja
Projekt
Na podlagi podatkov razumejte vedenje uporabnikov ter analizirajte dobičkonosnost strank in donosnost naložbe v oglaševanje, da pripravite priporočila za oddelek za trženje.
8 sprint 2 tedna
Napredni SQL
Opravili boste dodatni tečaj dela z bazami podatkov in se še bolj približali poslu. Z uporabo jezika SQL boste analizirali izračun glavnih poslovnih metrik, s katerimi ste se seznanili v sprintu “Analiza poslovnih kazalnikov”. Razmislite o delu s kompleksnim orodjem, kot so okenske funkcije. Naučite se spreminjati vsebino baz podatkov lokalno, brez simulatorja, z uporabo posebnih odjemalskih programov in knjižnic za Python.
• Izračun kazalnikov poslovanja. Podatkovna shema. Pretvorba. LTV. ARPU. ARPPU. ROI. Izračun z uporabo SQL.
• Združevanje okenskih funkcij. NAD izražanjem. PARTICIJA PO parametru okna.
• Funkcije razvrščanja oken. Funkcije rangiranja. Operater okna ORDER BY. ROW_NUMBER(). RANK(). DENSE_RANK(). NTILE(). Okenski operaterji skupaj s funkcijami razvrščanja.
• Funkcije odmika okna. Kumulativne vrednosti. Funkcije zamika. VODITE(). LAG(). Funkcije in vzdevki oken.
• Kohortna analiza. Stopnja zadrževanja, stopnja opuščanja. LTV.
• Namestitev in konfiguracija baze podatkov in odjemalca baze podatkov. Odjemalec baze podatkov. Namestitev PostgreSQL. Namestitev DBeaverja. DBeaver vmesnik. Izdelava baze podatkov. Uvajanje izpisa baze podatkov. Nalaganje rezultatov poizvedbe. Predstavitev rezultatov poizvedbe.
SQLDBMSMetricsPostgreSQLDatabasesSQL poizvedbeOkenske funkcijeKohortna analiza
Projekt
Z uporabo Pythona in SQL se povežite z bazo podatkov, izračunajte in vizualizirajte ključne metrike v sistemu programskih storitev Q&A.
9 sprint 2 tedna
Odločanje v poslu
Izvedeli boste, kaj je A/B testiranje in razumeli, v katerih primerih se uporablja. Naučite se oblikovati A/B testiranje in oceniti njegove rezultate.
• Osnove preizkušanja hipotez v poslovanju. Vodilne metrike. Osnove eksperimentov. Generiranje hipotez. Prednostno določanje meritev. Izbira metode za izvedbo poskusa. Kvalitativne metode za preverjanje hipotez. Kvantitativne metode za preverjanje hipotez. Prednosti in slabosti A/B testov.
• Prioritizacija hipotez. okvir RICE. Parameter dosega. Parameter vpliva. Parameter zaupanja. Parameter prizadevanj.
• Priprava na izvedbo A/B testa. A/A test. Napake tipa I in II. Moč statističnega testa. Pomen statističnega testa. Večkratne primerjave, metode za zmanjšanje verjetnosti napake. Izračun velikosti vzorca in trajanja A/B testa. Grafična analiza metrik.
• Analiza rezultatov A/B testov. Preizkušanje hipoteze o enakosti deležev. Shapiro-Wilkov test za testiranje normalnosti podatkov. Neparametrični statistični testi. Mann-Whitneyjev test. Stabilnost kumulativne metrike. Analiza izstopov in izbruhov.
• Vedenjski algoritmi. Dejstva, čustva, ocene. Pojasnite svoje stališče.
A/B testiranje Prioritizacija hipotez Priprava na A/B testiranje Analiza rezultatov A/B testiranja Analiza rezultatov A/B testiranja
Projekt
Analizirajte rezultate A/B testiranja v veliki spletni trgovini.
10 sprint 1 teden
Končni projekt drugega modula
Naučite se testirati statistične hipoteze z uporabo A/B testiranja ter pripravite zaključke in priporočila v obliki analitičnega poročila.
Prodajni lijakA/B testiranje Obdelava podatkov Analiza raziskovalnih podatkov
Projekt
Raziščite prodajni lijak in analizirajte rezultate A/B testiranja v mobilni aplikaciji.
11 sprint 2 tedna
Kako povedati zgodbo s podatki
Naučili se boste pravilno prikazati rezultate svojih raziskav z uporabo grafov, najpomembnejših številk in njihove pravilne interpretacije. Spoznajte knjižnici Seaborn in Plotly.
• Komu, kako, kaj in zakaj povedati. Predstavitev rezultatov raziskave. Ciljno občinstvo pripovedovalca. Kaj in zakaj povedati podatkovnemu analitiku.
• Knjižnica Seaborn. Knjižnica Seaborn kot razširitev knjižnice Matplotlib. metoda jointplot(). Barvni razponi. Slogi grafikonov. Vizualizacija distribucij.
• Plotly knjižnica. Interaktivni grafi. Črtni graf. Stolpčni grafikon. Krožni diagram. Likasti grafikon.
• Vizualizacija podatkov v geoanalitiki. Geoanalitika. Knjižnica Folij. Prikaz zemljevida. Nastavitev oznak z določenimi koordinatami. Ustvarjanje grozdov točk. Ikone po meri za označevalce. Horoplet.
• Priprava predstavitve. Sklepi na podlagi študije. Sezonskost in zunanji dejavniki. Absolutne in relativne vrednosti. Simpsonov paradoks. Načela konstruiranja predstavitev. Poročila v Jupyter Notebook.
PlotlyFoliumSeabornMatplotlibPresentationGeoanalyticsVizualizacija podatkov
Projekt
Pripravite tržno študijo na podlagi odprtih podatkov o obratih javne prehrane v Moskvi, vizualizirajte pridobljene podatke.
12 sprint 2 tedna
Gradnja nadzornih plošč v Tableau
V tem sprintu boste delali s sistemom Tableau BI. Naučite se povezati s podatki in jih spreminjati, zgraditi različne vrste grafov, sestaviti nadzorne plošče in predstavitve.
• Osnove dela s Tableau. BI sistemi. Tableau. Ustvarjanje dokumenta. Shranjevanje dokumenta. Objava dokumenta.
• Delo z viri podatkov. Viri podatkov. Združevanje podatkov. Metoda odnosa. Način pridružitve. Metoda mešanja. Sindikalna metoda. Spreminjanje oblike tabele.
• Vrste podatkov. Osnovni tipi podatkov. Meritve. Ukrepi. Delo z datumom in uro. Kompleti. Skupine. Opcije. Spreminjanje formata spremenljivk. Imena mer spremenljivk, vrednosti mer, štetje.
• Tabele in izračuni. Vmesnik za urejanje listov. Vrtilne tabele. Izračunana polja. LOD izrazi.
• Filtri in sortiranje. Ukrepi za razvrščanje. Razvrščanje dimenzij. Ugnezdene vrste. Razvrščanje z uporabo parametra. Filtri.
• Vizualizacije. Kontrole vizualizacije. Toplotne karte. Tortni grafikoni. Stolpčni grafikoni. Histogrami. Diagrami razponov. Razpršeni diagram. Črtni grafi. Kombinirani grafi. Površinski grafikoni.
• Posebne vizualizacije in namigi orodij. kartice. Zemljevid znakov. Mehurčasti grafikon. Drevesni zemljevid. Diagrami krožnih pogledov. Krožni diagrami. gantogrami. Izmerite imena in izmerite vrednosti v vizualizacijah. Povratni inženiring. Namigi orodij. Namigi orodij z vizualizacijami. Mejne vrednosti na grafih. Analitična orodja v Custom.
• Predstavitve. Dodatne možnosti. Študija tipičnih parametrov. Ustvarjanje predstavitve.
• Nadzorne plošče. Nalaganje in priprava podatkov. Priprava vizualizacij. Montaža armaturne plošče. Dejanja. Predstavitev nadzorne plošče. Objava nadzorne plošče.
TableauDashboardsBI-toolsBI-toolsVizualizacija podatkov
Projekt
Raziščite zgodovino konferenc TED in na podlagi pridobljenih podatkov ustvarite nadzorno ploščo v Tableau.
Ekstra sprint
Osnove strojnega učenja
Seznanite se z osnovami strojnega učenja in spoznajte glavne naloge strojnega učenja v poslovanju.
PythonPandasSklearn Strojno učenje Naloge strojnega učenja Algoritmi strojnega učenja
Ekstra sprint
Vadite Python
Opravili boste več laboratorijskih ur z dodatnimi nalogami v programskem jeziku Python. Naučili se boste tudi pridobivanja podatkov iz spletnih virov.
Ti boš:
• v strukturi HTML strani in delovanju GET zahtev,
• naučiti se pisati preproste regularne izraze,
• spoznati API in JSON,
• narediti več zahtev na straneh in zbrati podatke.
JSONPythonREST API Spletno strganje
13 sprint 3 tedne
Diplomski projekt
Pri zadnjem projektu potrdite, da ste obvladali nov poklic. Pojasnite strankino nalogo in pojdite skozi vse faze analize podatkov. Zdaj ni pouka ali domačih nalog - vse je kot v pravi službi.
Končni sprint vključuje projektno delo, A/B testiranje in SQL naloge ter dodatno nalogo. Projekt vsebuje navedbo problema, pričakovani rezultat, nabor podatkov in njihov opis.
Naloga se nanaša na eno izmed petih poslovnih področij:
• banke,
• maloprodaja,
• igre,
• mobilne aplikacije,
• e-poslovanje.
V projektu ne bo običajnega opisa korakov. Prebrodili jih boste sami.
SQ LPython PandasTableau Nadzorne plošče Postgre SQL Dekompozicija A/B testiranje