Att låta AI-modeller träna sig på existerande musik för att sedan kunna skriva helt nya låtar är inget nytt. Eller att kopiera och härma artisters musik om man får lyssna på kompositörerna. Men Nvidias AI Fugatto skapar i stället ljud som aldrig existerat förr.
Även om den inte finns tillgänglig publikt än har de släppt en webbsajt full av exempel. Vad sägs exempelvis om att höra det låter när saxofoner skäller som hundar, när folk faktiskt lyckas prata under vatten eller när ambulanssirener sjunger i kör?
Fugatto har skapats för att försöka skapa ”ett meningsfullt förhållande mellan språk och ljud”. Att prata med en chattbot är en sak, men hur beskriver man egentligen ljud med hjälp av ord?
Forskarna har låtit en stor språkmodell skapa Pyton-skript som beskriver karaktären av olika ljudkällor som ”en ung yrkesarbetande man” eller ”generera en lycklig röst”. Och sedan har man möjlighet att påverka resultatet ”gör rösten lyckligare”.
Genom att skapa en stor databas av exakt beskrivna ljud kan de nu låta Fugatto använda den för att hitta på helt nya fiktiva ljud. Kanske är detta vägen framför AI att skapa något helt nytt i stället för att härma något existerande.
Läs mer på Nvidias blogg
Läs hela artikeln med LB+
Black Week erbjudande
70% På LB+ Total i 12 månader! (Spara 1 665 kr)
LB+ Total månad / 185 kr
Full tillgång till allt innehåll i 1 månad
LB+ Total 12 månader / 156 kr
Full tillgång till allt innehåll på Ljud & Bild och L&B Home i 12 månader
- Tillgång till mer än 7500 produkttester!
- Stora rabatter hos våra samarbetspartner i LB+ Fördelsklubb
- Nyhetsbrev med senaste nyheterna varje vecka
- L&B TechCast – en podd med L&B
- Inaktiverade annonser