Nvidias AI Fugatto skapar helt nya ljud

AI-modellen kan föreställa sig hur abstrakta koncept skulle låta.

Jonas Ekelund

2024-11-27 - 14:54

Att låta AI-modeller träna sig på existerande musik för att sedan kunna skriva helt nya låtar är inget nytt. Eller att kopiera och härma artisters musik om man får lyssna på kompositörerna. Men Nvidias AI Fugatto skapar i stället ljud som aldrig existerat förr.

Även om den inte finns tillgänglig publikt än har de släppt en webbsajt full av exempel. Vad sägs exempelvis om att höra det låter när saxofoner skäller som hundar, när folk faktiskt lyckas prata under vatten eller när ambulanssirener sjunger i kör?

Läs också Gemini Live på svenska! Nu börjar Google rulla ut AI-botten som du kan ha naturliga konversationer med även på svenska.

Fugatto har skapats för att försöka skapa ”ett meningsfullt förhållande mellan språk och ljud”. Att prata med en chattbot är en sak, men hur beskriver man egentligen ljud med hjälp av ord?

Forskarna har låtit en stor språkmodell skapa Pyton-skript som beskriver karaktären av olika ljudkällor som ”en ung yrkesarbetande man” eller ”generera en lycklig röst”. Och sedan har man möjlighet att påverka resultatet ”gör rösten lyckligare”.

Genom att skapa en stor databas av exakt beskrivna ljud kan de nu låta Fugatto använda den för att hitta på helt nya fiktiva ljud. Kanske är detta vägen framför AI att skapa något helt nytt i stället för att härma något existerande.

Läs mer på Nvidias blogg

Läs vidare ⇩