Novo nevronsko omrežje Stable Audio ustvarja glasbo na podlagi besedilnega opisa
Miscellanea / / September 14, 2023
Od ustvarjalcev Stable Diffusion.
Stabilnost AI, znan predvsem po nevronskih mrežah za generiranje slik (Stabilna difuzija, Stabilni Doodle in ne samo), izpuščen nova nevronska mreža Stable Audio. Kot že ime pove, ustvarja zvočne posnetke.
Vse deluje približno tako kot generatorji slik na podlagi besedilnih opisov. Uporabnik določi ključne besede (na primer "melodic lo-fi hip-hop, melodic, 85 BPM" oz. »death metal z močnimi kitarskimi riffi in hitrimi bobni«), želeno trajanje in čaka na rezultat.
Za osnovo smo uporabili enak model kot pri Stable Diffusion, le da smo ga učili na glasbenih kompozicijah namesto na slikah. Skupno je dobila približno 800 tisoč skladb z glasbene strani AudioSparx - ali približno 19.500 ur različnih zvokov.
Ustvarjalci ugotavljajo, da je glavna značilnost Stable Audio zmožnost ustvarjanja skladb določene dolžine. Prej so nevronske mreže delovale samo s fiksnim trajanjem: če so bile usposobljene na 30-sekundnih zvočnih posnetkih, so lahko ustvarile samo 30-sekundne kompozicije. Da bi lahko prilagodili trajanje skladbe, so morali razvijalci spremeniti model in dodati metapodatke za začetek in konec skladbe.
Stabilni zvok je na voljo v treh modelih. Brezplačna različica vam omogoča ustvarjanje največ 20 pesmi, ki trajajo do 45 sekund na mesec. Na voljo je tudi naročnina Professional, ki vam omogoča ustvarjanje do 500 skladb do 90 sekund za 12 USD na mesec (≈1200 rubljev) in možnost Enterprise za podjetja z možnostjo individualne izbire količine in cene proizvodnje v redu. Ustvarjene glasbe ne morete uporabljati v komercialne namene brez plačane naročnine.
Kot pri drugih podobnih nevronskih omrežjih je Stable Audio bolj namenjen ustvarjalcem vsebin kot profesionalnim glasbenikom. Takšna orodja so primerna za hitro ustvarjanje glasbe v ozadju za poddaje in videoposnetke, ko nimate časa ali proračuna za sodelovanje s skladateljem. Lahko tudi nadomesti standardne zvoke, če želite edinstven smeh ali zvoke množice.
Stabilni zvok lahko preizkusite na uradni spletni strani. Morali se boste registrirati ali prijaviti z Google računom. Na začetku lahko pride do motenj v dostopu zaradi velike obremenitve strežnika.
Stabilen zvok →
Več novih nevronskih mrež🦾✨
- Virtualni asistent AIDA podjetja Sber bo diagnosticiral bolnike v moskovskih klinikah
- Nova aplikacija Artisse ustvarja kul fotografije z obrazom uporabnika
- Stability AI je predstavil chatbot Stable Chat - brezplačen analog ChatGPT