Matematika in strojno učenje za podatkovno znanost - tečaj 50.040 RUB. iz SkillFactory, usposabljanje 5,5 mesecev, datum: 13. avgust 2023.
Miscellanea / / November 29, 2023
Študirali boste lahko kjerkoli na svetu. Nove module bomo odpirali enkrat tedensko. Posebej oblikovana vsebina in dodatna gradiva vam bodo pomagala razumeti temo.
Vadba je sestavljena iz treh delov: izvedba preprostih računskih vaj; izvajanje vaj na osnovi Pythona; reševanje življenjskih problemov na področju podatkovne analize, napovedi in optimizacije.
Nenehno boste komunicirali s svojimi sošolci v zasebnih kanalih Slack. Če nečesa ne razumete ali nalogi niste kos, vam bomo pomagali ugotoviti.
Na koncu tečaja boste dobili posebno nalogo, v kateri boste lahko uporabili vse pridobljene veščine in potrdili uspešno učenje snovi.
Program tečaja matematike
1. del - Linearna algebra
- Preučujemo vektorje in vrste matrik
- Učenje izvajanja operacij na matricah
- Določanje linearne odvisnosti z matrikami
- Proučujemo inverzne, singularne in nesingularne matrike
- Preučujemo sisteme linearnih enačb, lastnih in kompleksnih števil
- Obvladovanje matrične in singularne dekompozicije
- Reševanje problemov linearne odvisnosti z uporabo matrik
- Optimizacija z uporabo metode glavne komponente
- Okrepitev matematičnih temeljev linearne regresije
2. del - Osnove matematične analize
- Preučujemo funkcije ene in več spremenljivk ter odvode
- Obvladovanje pojma gradient in gradientni spust
- Usposabljanje optimizacijskih problemov
- Proučujemo metodo Lagrangeovih množiteljev, Newtonovo metodo in simulirano žarjenje
- Probleme napovedovanja in iskanja zmagovalne strategije rešujemo z izpeljanimi in numeričnimi optimizacijskimi metodami
- Okrepitev matematike za gradientnim spuščanjem in simuliranim žarjenjem
3. del – Osnove verjetnosti in statistike
- Preučujemo splošne koncepte deskriptivne in matematične statistike
- Obvladovanje kombinatorike
- Preučujemo glavne vrste porazdelitev in korelacije
- Razumevanje Bayesovega izreka
- Učenje naivnega Bayesovega klasifikatorja
- Rešujemo probleme kombinatorike, veljavnosti in napovedovanja s pomočjo statistike in teorije verjetnosti
- Utrjujemo matematične osnove klasifikacije in logistične regresije
4. del - Časovne vrste in druge matematične metode
- Predstavljamo analizo časovnih vrst
- Obvladovanje zahtevnejših vrst regresij
- Napovedovanje proračuna z uporabo časovnih vrst
- Okrepitev matematičnih temeljev klasičnih modelov strojnega učenja
Kratek program tečaja o strojnem učenju
Pomoč mentorja med usposabljanjem
Modul 1 – Uvod v strojno učenje
Seznanimo se z glavnimi nalogami in metodami strojnega učenja, preučimo praktične primere in uporabimo osnovni algoritem za delo na ML projektu.
Rešimo več kot 50 problemov, da utrdimo temo
Modul 2 - Metode predprocesiranja podatkov
Preučujemo tipe podatkov, učimo se čistiti in obogatiti podatke, uporabljati vizualizacijo za predprocesiranje in obvladati inženiring funkcij
Rešimo več kot 60 problemov, da utrdimo temo
Modul 3 - Regresija
Obvladamo linearno in logistično regresijo, preučujemo meje uporabnosti, analitično sklepanje in regularizacijo. Učenje regresijskih modelov
Rešujemo več kot 40 problemov, da utrdimo temo
Modul 4 - Grozdenje
Obvladamo učenje brez učitelja, vadimo njegove različne metode, delamo z besedili s pomočjo ML
Rešimo več kot 50 problemov, da utrdimo temo
Modul 5 - Drevesni algoritmi: uvod v drevesa
Spoznajmo odločitvena drevesa in njihove lastnosti, obvladajmo drevesa iz knjižnice sklearn in uporabimo drevesa za reševanje regresijskega problema
Rešujemo več kot 40 problemov, da utrdimo temo
Modul 6 - Drevesni algoritmi: ansambli
Preučujemo značilnosti drevesnih ansamblov, vadimo pospeševanje, uporabljamo ansambel za gradnjo logistične regresije
Rešujemo več kot 40 problemov, da utrdimo temo
Sodelujemo na tekmovanju na kaggle za usposabljanje drevesnega modela
Modul 7 - Ocenjevanje kakovosti algoritmov
Preučujemo principe delitve vzorca, premajhnega in prevelikega opremljanja, ocenjujemo modele z uporabo različnih metrik kakovosti, učimo se vizualizirati učni proces
Ocenjevanje kakovosti več modelov ML
Rešujemo več kot 40 problemov, da utrdimo temo
Modul 8 - Časovne vrste v strojnem učenju
Spoznajmo analizo časovnih vrst v ML, osvojimo linearne modele in XGBoost, preučimo principe navzkrižne validacije in izbire parametrov
Rešimo več kot 50 problemov, da utrdimo temo
Modul 9 - Priporočilni sistemi
Preučujemo metode za gradnjo priporočilnih sistemov, obvladamo algoritem SVD, ocenjujemo kakovost priporočil šolanega modela.
Rešimo več kot 50 problemov, da utrdimo temo
Modul 10 – Končni hackathon
Uporabljamo vse preučene metode, da pridobimo maksimalno natančnost napovedi modela na Kaggle