Tečaj "Specialist podatkovnih znanosti" - tečaj 112.000 rub. iz delavnice Yandex, usposabljanje 8 mesecev, datum 30. november 2023.
Miscellanea / / November 28, 2023
Kaj počnejo podatkovni znanstveniki?
Analizirajte velike količine podatkov, razvijajte modele in uporabite strojno učenje za napovedovanje in prepoznavanje vzorcev. Potrebni so na različnih področjih, kjer je potrebno shranjevati in obdelovati podatke.
V bankah
Analizirati podatke o strankah in ugotoviti, kateri kazalci vplivajo na njihovo kreditno sposobnost, predvideti verjetnost, da stranka zapusti banko.
V industriji
S pomočjo strojnega učenja napovedujejo, kdaj bo oprema odpovedala in v katerem nahajališču bo rudarjenje prineslo največji dobiček.
V marketingu in komerciali
Pomagajo najti točke rasti z analizo sezonskosti, dnevov največje prodaje in ustvarijo sistem priporočil
V transportnem sektorju
Optimizirajte delovanje semaforjev, ocenite obremenitev cest in pomagajte prilagoditi načrte popravil
Celoten program tečaja Data Science
Redno ga posodabljamo, da zagotovimo, da ustreza potrebam industrije in delodajalcev. Z drugimi besedami, naučiš se samo tistega, kar ti bo zagotovo koristilo pri delu.
Osnove Pythona in analiza podatkov: Brezplačni uvodni tečaj:
Naučite se osnovnih konceptov analize podatkov in razumejte, kaj počnejo podatkovni analitiki in podatkovni znanstveniki. Rešite pet primerov dela s podatki iz različnih področij:
- ugotovite razlog za množično okvaro pripomočkov,
- preverite donosnost oglaševanja mobilnih aplikacij,
- najti najboljšo lokacijo za novo trgovino,
- pomoč pri izbiri razvojne strategije za zagon AI,
- oceniti učinkovitost robotov v podporni službi.
Z reševanjem primerov se boste naučili osnov Pythona in knjižnice pandas, se naučili sestaviti nekaj grafov in jih pravilno interpretirati.
Uvod v poklic “Data Science Specialist”
Kaj je specialist za podatkovne znanosti?
Kako poučujemo.
Osnovni Python:
Poglobite se v programski jezik Python in knjižnico pandas.
+1 projekt v portfelju
Primerjajte uporabniške podatke Yandex. Glasba po mestu in dnevu v tednu.
Predhodna obdelava podatkov:
Naučite se očistiti podatke iz izstopajočih vrednosti, izpustov in dvojnikov ter pretvoriti različne formate podatkov.
+1 projekt v portfelju
Analizirati podatke o bančnih komitentih in ugotoviti delež kreditno sposobnih.
Raziskovalna analiza podatkov:
Naučite se osnov verjetnosti in statistike. Uporabite jih za raziskovanje osnovnih lastnosti podatkov, iskanje vzorcev, porazdelitev in anomalij. Spoznajte knjižnici scipy in matplotlib. Rišite diagrame in vadite analizo grafov.
+1 projekt v portfelju
Raziščite arhiv oglasov za prodajo nepremičnin v Sankt Peterburgu in Leningradski regiji.
Teorija verjetnosti. Dodatni tečaj
Spomnite se ali prepoznajte osnovne pojme teorije verjetnosti: neodvisni, nasprotni, nekompatibilni dogodki itd. Na preprostih primerih in zabavnih nalogah boste vadili delo s številkami in gradili logiko rešitev.
To je izbirni sprint. To pomeni, da vsak študent sam izbere eno od možnosti:
- Opravite dodatni tečaj desetih kratkih lekcij, obnovite teorijo in rešite probleme.
- Odprite samo blok z nalogami za razgovor, zapomnite si prakso brez teorije.
- Popolnoma preskočite tečaj ali se nanj vrnite, ko bo čas in potreba.
Končni projekt prvega modula
Naučite se izvajati predhodne raziskave podatkov ter oblikovati in testirati hipoteze.
+1 projekt v portfelju
Poiščite vzorce, ki določajo uspeh igre.
Uvod v strojno učenje:
Obvladajte osnovne koncepte strojnega učenja. Spoznajte knjižnico Scikit-Learn in jo uporabite za ustvarjanje svojega prvega projekta strojnega učenja.
+1 projekt v portfelju
Razviti sistem priporočil za tarife za mobilnega operaterja.
Usposabljanje pod mentorstvom:
Potopite se globlje v najbolj vroče področje strojnega učenja: nadzorovano učenje. Naučite se ravnati z neuravnoteženimi podatki.
+1 projekt v portfelju
Predvidite verjetnost, da stranka zapusti banko.
Strojno učenje v poslu:
Naučite se, kako strojno učenje (okr. MO) pomaga podjetju pri zbiranju podatkov in o tem, kako so meritve izdelka povezane z meritvami MO. Naučite se zagnati novo funkcionalnost storitve z uporabo ML. Preberite, kaj so poslovne metrike, KPI in A/B testiranje.
+1 projekt v portfelju
Usposobite model, ki pomaga prepoznati novo lokacijo za proizvodnjo nafte z najmanjšim tveganjem izgube.
Končni projekt drugega modula:
Pripravite podatke za strojno učenje. Z uporabo modela ocenite njegovo kakovost.
+1 projekt v portfelju
Simulirajte postopek taljenja zlate rude, da izboljšate delovanje podjetja.
Linearna algebra:
Oglejte si nekaj algoritmov, ki ste se jih do zdaj naučili, in pridobite boljše razumevanje, kako jih uporabljati. V praksi osvojite glavne pojme linearne algebre iz nič: linearni prostori, linearni operatorji, evklidski prostori.
+1 projekt v portfelju
Uporabite metodo pretvorbe podatkov za zaščito osebnih podatkov strank zavarovalnice.
Numerične metode:
Analizirali boste številne algoritme in jih prilagodili reševanju praktičnih problemov z uporabo numeričnih metod. Obvladajte približne izračune, ocene kompleksnosti algoritmov in gradientni spust. Naučite se, kako se usposabljajo nevronske mreže in kaj je gradientno povečanje.
+1 projekt v portfelju
Razvijte model za določitev stroškov rabljenega avtomobila.
Časovne serije:
Časovne vrste opisujejo, kako se parametri, kot je poraba električne energije ali število naročil taksijev, spreminjajo skozi čas. Naučili se boste analizirati serije, iskati trende in prepoznavati sezonskost. Naučite se ustvariti tabelarične podatke in problem regresije časovne vrste.
+1 projekt v portfelju
Zgradite model in predvidite največje obremenitve taksijev.
Strojno učenje za besedila:
Naučite se narediti numerične vektorje iz besedil in zanje rešiti probleme klasifikacije in regresije. Naučite se izračunati funkcije TF-IDF in se seznanite z jezikovnimi predstavitvami word2vec in BERT.
+1 projekt v portfelju
Pospešite moderiranje komentarjev v vaši skupnosti z avtomatizacijo ocen strupenosti.
Osnovni SQL:
Naučite se osnov jezika poizvedb SQL in relacijske algebre za delo z bazami podatkov. Seznanite se z značilnostmi dela v PostgreSQL, priljubljenem sistemu za upravljanje baz podatkov (skr. DBMS). Naučite se pisati poizvedbe različnih stopenj kompleksnosti in prevesti poslovne probleme v SQL.
Delali boste z bazo podatkov spletne trgovine, ki je specializirana za filme in glasbo.
+1 projekt v portfelju
Napišite vrsto poizvedb različnih kompleksnosti v bazo podatkov, ki hrani podatke o tveganih vlagateljih, startupih in naložbah vanje.
Računalniški vid:
Naučite se reševati preproste težave z računalniškim vidom z uporabo že pripravljenih nevronskih mrež in knjižnice Keras. Spoznajte poglobljeno učenje.
+1 projekt v portfelju
Izdelajte model za določitev približne starosti osebe iz fotografije.
Učenje brez nadzora:
Nenadzorovano učenje je ena od metod strojnega učenja, pri kateri sistem rešuje problem brez vnaprej označenih podatkov glede na njegove lastnosti in strukturo. Spoznajte težave z združevanjem v gruče in odkrivanjem nepravilnosti.
Diplomski projekt:
Pri zadnjem projektu potrdite, da ste obvladali nov poklic. Pojasnite strankino nalogo in pojdite skozi vse faze analize podatkov in strojnega učenja. Zdaj ni pouka ali domačih nalog - vse je kot v pravi službi.
+1 projekt v portfelju
Projekt na izbiro:
- Zgradite model, ki napoveduje odliv strank iz telekomunikacijskega podjetja.
- Zgradite model, ki napoveduje parametre tehnološkega procesa v metalurškem obratu.
D
daryamanannikova
01.10.2020 G.
Primer idealnih spletnih tečajev
V Yandex. Med delavnico študiram poklic DataScience, ki je zdaj precej modna smer, in kot se je izkazalo, je precej težko, kot pravijo, hard to learn - easy to fight. (adsbygoogle = window.adsbygoogle || []).push({}); Na moji poti je bilo veliko težav, premalo časa (sem jemala diplomo in delala), moč za razumevanje statistike me je občasno zapuščala, koronavirus nas je vse zaklenil doma ...
S
sergen355
14.07.2021 G.
Odličen izobraževalni projekt
Prednosti: lasten simulator, pregledi projektov, svetovanja, skupnost v Slacku, pomoč pri vsaki zadevi. Slabosti: edina slabost je, da pri nekaterih temah ni celotnega gradiva v simulatorju, potreben je dodaten čas za samostojno iskanje informacij.Študiral sem na Fakulteti za podatkovne znanosti. Dobra oblika usposabljanja. Nekateri pridejo, nekateri ne. Ampak zame je to največ...