Att låta AI-modeller träna sig på existerande musik för att sedan kunna skriva helt nya låtar är inget nytt. Eller att kopiera och härma artisters musik om man får lyssna på kompositörerna. Men Nvidias AI Fugatto skapar i stället ljud som aldrig existerat förr.
Även om den inte finns tillgänglig publikt än har de släppt en webbsajt full av exempel. Vad sägs exempelvis om att höra det låter när saxofoner skäller som hundar, när folk faktiskt lyckas prata under vatten eller när ambulanssirener sjunger i kör?
Fugatto har skapats för att försöka skapa ”ett meningsfullt förhållande mellan språk och ljud”. Att prata med en chattbot är en sak, men hur beskriver man egentligen ljud med hjälp av ord?
Forskarna har låtit en stor språkmodell skapa Pyton-skript som beskriver karaktären av olika ljudkällor som ”en ung yrkesarbetande man” eller ”generera en lycklig röst”. Och sedan har man möjlighet att påverka resultatet ”gör rösten lyckligare”.
Genom att skapa en stor databas av exakt beskrivna ljud kan de nu låta Fugatto använda den för att hitta på helt nya fiktiva ljud. Kanske är detta vägen framför AI att skapa något helt nytt i stället för att härma något existerande.
Läs mer på Nvidias blogg