MLOps - stopnja 80.000 rub. iz Otusa, usposabljanje 5 mesecev, datum 30.11.2023.
Miscellanea / / November 30, 2023
Obvladali boste vse potrebne veščine strojnega učenja za pretakanje podatkov in porazdeljena okolja. Program vključuje potrebno znanje s področij Data Science in Data Engineering, ki vam bo omogočilo obdelavo velikih podatkov in pisanje porazdeljenih algoritmov v Spark.
Vsak modul boste vadili z izpolnjevanjem domačih nalog. Na koncu usposabljanja boste imeli zaključno nalogo, ki vam bo omogočila, da povzamete vse pridobljeno znanje in ga dodate v svoj portfelj. Lahko se izvaja kot del delovnih nalog na vašem naboru podatkov ali kot učni projekt, ki temelji na podatkih, ki jih zagotovi OTUS.
Komu je ta tečaj namenjen?
Za strokovnjake za strojno učenje ali programske inženirje, ki se želijo naučiti delati z velikimi podatki. Običajno takšne naloge obstajajo v velikih IT podjetjih z obsežnim digitalnim izdelkom.
Za podatkovne znanstvenike, ki želijo okrepiti svoje spretnosti z inženirskimi veščinami. Zahvaljujoč tečaju boste sposobni obdelave podatkov in samostojnega prikaza rezultatov ML rešitev v proizvodnji.
Za učenje boste potrebovali osnovna znanja o podatkih. Predlagamo, da si ogledate zemljevid tečajev Data Science pri OTUS, da ugotovite zahtevano raven usposabljanja.
Naučil se boš:
- Uporabite standardna orodja za cevovod ML v porazdeljenem okolju;
- Razvijte lastne bloke za cevovode ML;
- Prilagodite algoritme ML porazdeljenim okoljem in orodjem za velike podatke;
- Uporabite Spark, SparkML, Spark Streaming;
- Razviti algoritme za pripravo pretočnih podatkov za strojno učenje;
- Zagotoviti nadzor kakovosti na vseh stopnjah uvedbe rešitev ML v industrijsko uporabo.
Povpraševanje po specialistih
Veščine, ki jih boste osvojili, so čim bolj uporabne in obetavne. Na trgu se pojavlja vse več digitalnih izdelkov, katerih razvoj zahteva delo z velikimi podatki in obdelavo tokov. Že zdaj se lahko strokovnjaki s takšnim naborom znanj in nekaj delovnih izkušenj kvalificirajo za 270 tisočakov plače. rubljev Drug trend - avtomatizacija procesov usposabljanja in validacije, nasprotno, na nek način razvrednoti delo klasičnega Data Scientista. Vse gre proti točki, ko lahko tudi nestrokovnjak naredi fit-predikt. Zato so tisti, ki imajo vsaj površno inženirsko znanje, že na prvem mestu.
Značilnosti tečaja
Veliko vaje pri delu s podatki
Širok nabor veščin od porazdeljenega ML in pretočne obdelave podatkov do proizvodnje
Trenutna orodja in tehnologije: Scala, Spark, Python, Docker
Komunikacija v živo s strokovnjaki prek spletnih seminarjev in klepeta Slack
4
sevedaUkvarjen z razvojem ekipe Data Science, ki zagotavlja funkcionalnost na podlagi strojnega učenja za izdelke in storitve podjetja. Kot Data Scientist je sodeloval pri razvoju Kaspersky MLAD in MDR AI Analyst. V...
Ukvarjen z razvojem ekipe Data Science, ki zagotavlja funkcionalnost na podlagi strojnega učenja za izdelke in storitve podjetja. Kot Data Scientist je sodeloval pri razvoju Kaspersky MLAD in MDR AI Analyst. Kot C++ razvijalec je sodeloval pri nastanku MaxPatrol SIEM, že vrsto let poučuje računalništvo. znanstvenih disciplin na MSTU GA Avtor serije poročil o vodenju in razvoju projektov ML, C++, DS ekipe. Član PC konference C++ Rusija. Programski menedžer
8
tečaji20+ let izkušenj pri razvojnih projektih po meri v IT. Na desetine uspešnih projektov, vključno s tistimi po državnih naročilih. Izkušnje z razvojem in implementacijo ERP sistemov, odprtokodnih rešitev, podpore visoko obremenjenim aplikacijam. Predavatelj tečajev na...
20+ let izkušenj pri razvojnih projektih po meri v IT. Na desetine uspešnih projektov, vključno s tistimi po državnih naročilih. Izkušnje z razvojem in implementacijo ERP sistemov, odprtokodnih rešitev, podpore visoko obremenjenim aplikacijam. Predavatelj tečajev Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE ter mentor tečaja HighLoad
1
dobroSpecialist za delo z velikimi podatki in strojnim učenjem. 8 let je delal na Odnoklassniki.ru. Vodil ekipo OK Data Lab (laboratorij za raziskovalce na področju velikih podatkov in strojnih...
Specialist za delo z velikimi podatki in strojnim učenjem. 8 let je delal na Odnoklassniki.ru. Vodil ekipo OK Data Lab (laboratorij za raziskovalce na področju velikih podatkov in strojnega učenja). Analiza velikih podatkov v Odnoklassniki je postala edinstvena priložnost za združevanje teoretičnega usposabljanja in znanstvene podlage z razvojem resničnih izdelkov po povpraševanju. Od leta 2019 je zaposlen v Sberbank kot generalni direktor. Deluje kot vodja grozda za razvoj platforme za priporočilne sisteme v diviziji množične personalizacije. Leta 2004 je diplomiral na St. Petersburg State University, kjer je leta 2007 zagovarjal doktorat iz formalnih logičnih metod. V zunanjem izvajanju sem delal skoraj 9 let, ne da bi izgubil stik z univerzitetnim in znanstvenim okoljem.
Osnovni uvod v začetek tečaja
-Tema 1. Gradientni spust in linearni modeli
-Tema 2. Pregled osnovnih metod in metrik strojnega učenja
-Tema 3. Razvoj pristopov k delu s podatki
-Tema 4.Osnove programiranja v Scali
Tehnološke osnove porazdeljene obdelave podatkov
-Tema 5. Porazdeljeni datotečni sistemi
-Tema 6. Upravljalci virov v porazdeljenih sistemih
-Tema 7. Razvoj masovno vzporednih in porazdeljenih računalniških ogrodij
-Tema 8. Osnove Apache Spark 1
-Tema 9. Osnove Apache Spark 2
Osnove porazdeljenega ML
-Tema 10. Prenos algoritmov ML v porazdeljeno okolje
-Tema 11.ML v Apache Spark
-Tema 12. Razvijanje lastnih blokov za SparkML
-Tema 13. Optimizacija hiperparametrov in AutoML
Pretočna obdelava
-Tema 14. Obdelava tokovnih podatkov
-Tema 15. Knjižnice tretjih oseb za uporabo s Spark
-Tema 16. Spark Streaming
-Tema 17. Strukturirano in kontinuirano pretakanje v Spark
-Tema 18. Alternativni pretočni okviri
Postavljanje ciljev in analiza rezultatov
-Tema 19. Določitev cilja projekta ML in predhodna analiza
-Tema 20. Dolgoročni cilji ML na primeru naloge zmanjšanja odliva
-Tema 21.A/B testiranje
-Tema 22. Dodatne teme
Izpis rezultatov ML v produkcijo
-Tema 23. Pristopi k uvajanju rešitev ML v produkcijo
-Tema 24. Različice, ponovljivost in spremljanje
-Tema 25. Spletno serviranje modelov
-Tema 26. Vzorci za asinhrono pretakanje ML in ETL
-Tema 27. Če potrebujete Python
ML v Pythonu v proizvodnji
-Tema 28.Produkcijska koda v Pythonu. Koda za organiziranje in pakiranje
-Tema 29. Arhitektura REST: Flask API
-Tema 30.Docker: Struktura, aplikacija, namestitev
-Tema 31.Kubernetes, orkestracija vsebnika
-Tema 32. Orodja MLOPS za Kubernetes: KubeFlow, Seldon Core. Značilnosti delovanja heterogenih sistemov v industriji.
-Tema 33. Amazon Sagemaker
-Tema 34. Storitev AWS ML
Napredne teme
-Tema 35. Nevronske mreže
-Tema 36. Porazdeljeno učenje in sklepanje nevronskih mrež
-Tema 37. Povečanje gradienta na drevesih
-Tema 38. Učenje s krepitvijo
Projektno delo
-Tema 39. Izbira teme in organizacija projektnega dela
-Tema 40. Posvetovanje o projektih in domačih nalogah
-Tema 41. Zaščita projektantskega dela