Umělá inteligence útočí na hudbu, Google přišel s MusicLM

Umělá inteligence je fenoménem digitálního věku. Zcela jistě jste zaregistrovali chatboty, kteří analyzují informace k poskytnutí souvislého textu, obrázky portrétů generované AI podle Vašich fotek a podobné další. Své místo si AI ale nachází i mimo komunikaci a grafické zpracování, a to v hudbě. Od klasické až po moderní.

Komponuje umělá inteligence geniálněji než Dvořák, Mozart či Beethoven? Tato otázka se stala v minulosti předmětem výzkumného projektu. Umělé inteligenci stačí pět not, aby napodobila styl význačného hudebního skladatele. Projekt Deutsche Telekom, který odstartoval v roce 2019 dal dohromady deset expertů z oblasti umělé inteligence a muzikologie. Výsledek? 10. symfonie k výročí 250 let od narození Ludwiga van Beethovena, kterou nikdy nenapsal. Umělá inteligence ano. Díky preciznosti algoritmů vygenerovala zcela věrohodnou skladbu. Stačilo ji dát k dispozici v počítačově čitelné verzi veškerá data a skladby, které Beethoven v minulosti napsal. AI porozuměla stylu, kterým komponoval a symfonie, jež sice zněla z počátku roboticky a strojeně, je na světě. Po drobných úpravách skladby pro orchestrální provedení hudebním skladatelem Walterem Werzovem, byla skladba dokonalým napodobením Beethovena kompozičního stylu.

Klasická hudba ale není jediná, ve které se zkouší a vyvíjí možnosti umělé inteligence. Novinkou uplatňující technologii AI v hudbě je systém MusicLM od společnosti Google, který dokáže vytvořit hudbu takřka na počkání. Jedná se o generátor, který produkuje hudbu vysoké kvality s frekvencí 24kHz, z textových popisů. Hravě si poradí například s popisem „uklidňující houslová melodie podložená zkresleným kytarovým riffem“. A to není vše. MusicLM vytvoří hudbu také z melodií, které jsou systému poskytnuty ve formě hukotu a dále textově podmíněny. Například umí zhudebnit zapískanou melodii spolu s textovým titulkem, který určuje požadovaný hudební styl. Obecně lze tuto novinku hodnotit jako převratnou a ukazující na opět vyšší vyspělost dovedností, kterých je AI schopná. V minulosti uměla AI vytvořit hudbu k obrázkům, což je ale podstatně jednodušší než vytváření hudby k textu. Obtížnost generování kvalitního a koherentního zvuku k textu tkví v tom, že není jednoduché v několika slovech verbalizovat například scénu – zvuky slyšené na letišti, zvuky slyšené v kavárně, případně definovat barvu jednotlivých vokálů či nástrojů. V neposlední řadě je málo spárovaných audio-textových dat, z kterých by se AI mohla „učit“. 

Přestože společnost Google není s tímto systémem na výzkumném trhu jediná, na podobném principu autoregresivního modelování hudebních sekvencí jsou založeny také systémy Mubert a Riffusion, je tento systém považován za nejlepší. Podle aktuálně dostupné studie MusicLM vyniká nad svými konkurenty v kvalitě hudby a její věrohodnosti, jelikož lépe zpracovává informace obsažené v textových popisech a tudíž je dokáže lépe vystihnout. Systém zvládá také vytvořit velmi detailní zvuk i pro složitější popisky, například okouzlující jazzový song se silnými basy a sólovou zpěvačkou. Tyto schopnosti činí z MusicLM systém, který je nositelem výrazného pokroku a v budoucnosti by mohl být schopen generovat melodie rozsáhlejšího charakteru využitelné pro kinematografii.

Hudba se tak stala další oblastí, ve které AI způsobuje revoluci a v budoucnu se možná stane běžnou součástí práce hudebních producentů a skladatelů, které obohatí o zvukové variace, které by je třeba nenapadly. Automaticky generovaná hudba má potenciál ale především pro tvůrce videoher a obsahu na sociálních sítích, kterým umožní využití bezplatné hudební složky k jejich produktům. Bohužel prozatím je běžná uživatelské praxe těchto systémů hudbou budoucnosti. Výzkumníci hudební generátory nedávají k dispozici veřejnosti kvůli obavám z možného zneužití autorských práv. 

V neposlední řadě nelze opomenout znepokojení hudebních profesionálů, kteří se vyjadřují o kvalitě uměle generované hudby a jejích dopadech na posluchače. Podle nich se jedná o zvukový smog – nekonečnou hudbu, kterou nebude nikdo skládat, bezobsažnou melodii, bez uměleckého záměru a kreativní složky. Posluchači tak bude v hudbě chybět jakákoliv emocionální zpráva. Závěrem tito lidé apelují, že hudební kusy nejsou pouhé kusy zvuku, ale nesou v sobě vyjádření lidské bytosti, která je napsala.

2 komentáře: „Umělá inteligence útočí na hudbu, Google přišel s MusicLM“

  1. Čas prověří, jestli uměle generovaná hudba bude konkurenceschopná s hudbou tvořenou lidmi. Nebo zda ji dokonce překoná. V současnosti umělá inteligence může konkurovat vytváření melodiím pro reklamní účely nebo jednoduchým „hitům“ atd., které jsou často kombinací již existujících prvků. To však není překvapivé. AI totiž exceluje v rychlosti generování velkého množství kombinací existujícího materiálu.

    Toto hodnocení a srovnávání nás nečeká jen v hudbě – změny se týkají i dalších uměleckých oborů – už vznikají knihy psané AI a všichni už jsme jistě viděli více či méně povedené AI obrázky.

    Nicméně, AI má své limity. Chybí jí umělecká motivace a puzení, které vyvěrá z individuálních zkušeností a životních situací. Kreativní umělci nejsou omezeni zadáním pouze kombinovat existující prvky, ale mohou volněji prozkoumávat a vyjadřovat svou vlastní osobnost a vize. Vždyť například Picasso se výtvarně vyvíjel od modrého, přes růžové, období, až po období ovlivněné Afrikou, aby pak dospěl k vlastnímu stylu- kubismu. A právě pochopení umělce skrze jeho životní kontext, je něco, co dělá umění vzrušující. Já osobně bych to asi u „umění“ produkovaného AI postrádala. Ale uvidíme, brána k nové cestě je otevřena…

    To se mi líbí

  2. Díky za zajímavý článek o MusicLM od Googlu a jeho dopadu na hudbu. Bylo poučné číst o tom, jak umělá inteligence mění tvorbu hudby a jaké to může mít důsledky pro umělce i průmysl. Oceňuju, jak je téma zprácováno a hlavně způsob, jakým jsou čtenářům přiblíženy potenciální výzvy a přínosy této technologie.

    To se mi líbí

Napsat komentář

Design a site like this with WordPress.com
Začít