Föreställ dig att du befinner dig på en livlig flygplats, en konsert eller ett bullrigt café. Runt omkring dig finns ett kaos av ljud – andra människor som pratar, musik som spelas och alla typer av bakgrundsljud. Men tänk om du kunde välja att höra bara en persons röst tydligt mitt i allt detta brus?
Detta är visionen bakom ett nytt forskningsprojekt som leds av forskare från University of Washington och Microsoft. De har utvecklat en ny teknik som de kallar ”Look Once to Hear”, som gör att du kan fokusera på en viss persons tal och samtidigt filtrera bort alla andra ljud. Tekniken byggs sedan in i ett par AI-hörlurar.
Titta en gång för att höra tydligt
Tekniken fungerar genom att man tittar på den person man vill höra i några sekunder, samtidigt som man håller in en knapp på sidan av headsetet. Under dessa sekunder fångar två mikrofoner på höger och vänster sida upp personens unika röstavtryck, även om det finns mycket buller runt omkring.
Detta röstavtryck används sedan av en smartphone-app eller specialiserad enhet för att isolera den personens röst. Även om du tittar bort eller rör på dig kommer du att kunna höra personen tydligt, som om ni vore ensamma i rummet.
AI-headseten använder avancerad maskininlärning för att åstadkomma detta. Mikrofoninspelningarna med bakgrundsbrus bearbetas av ett neuralt nätverk som är tränat för att urskilja och förstärka målpersonens unika röstavtryck.
Många användningsområden för AI-hörlurar
Forskarna ser framför sig många potentiella användningsområden för tekniken. Den skulle kunna vara användbar för att höra en guide i ett livligt museum eller en lärare i ett klassrum med mycket bakgrundsljud. Den skulle också kunna hjälpa personer med hörselnedsättning som har svårt att följa med i samtal i bullriga miljöer. Att bygga in tekniken i hörapparater är ett naturligt nästa steg.
AI-hörlurarna är i dagsläget på prototypstadiet, men forskarna har visat att det fungerar med vanliga hörlurar kopplade till en liten dator. De hoppas att tekniken så småningom ska kunna byggas in i vanliga smartphones och trådlösa öronsnäckor.
Bättre än brusreducering
Till skillnad från konventionella brusreducerande hörlurar, som blockerar allt ljud, kan man med de nya AI-hörlurarna selektivt välja vilket ljud man vill höra. Det innebär ett betydande framsteg inom ljudbearbetning och har potential att revolutionera hur vi upplever ljud i bullriga miljöer.
Och översättning då?
När det gäller artificiell intelligens är det lätt att föreställa sig att man också kan införliva direktöversättning från ett främmande språk till det egna modersmålet. Kanske med försökspersonens egen röstsignatur? På så sätt skulle man kunna resa runt i världen utan tolk och förstå det mesta som sägs runt omkring en.
Spionage
Vi kan inte låta bli att undra om teknologin kan användas med onda avsikter. Vad är det som hindrar människor från att spionera på andra? Tja, först måste du isolera rösten hos den person du vill höra. För att göra detta måste du sitta relativt nära och personen måste tala direkt till dig. Mikrofonerna på vardera sidan av huvudet måste vara på samma avstånd från munnen som talar till dig, och sedan kan systemet separera rösten från omgivningen, där varje ljud färdas olika långt till varje öra. Om du sitter för långt bort från personen kommer fasresponsen från rösten inte att skilja sig tillräckligt mycket från den miljö du vill särskilja.
Men det hindrar dig inte från att först gå fram till personen och växla ett vänligt ord, medan en profil av rösten skapas. Och sedan kan man ta ett steg tillbaka och spionera på personen så mycket man vill.
Om den här tekniken ska användas i konsumentprodukter bör den person som ska förstås behöva ge sitt samtycke på något sätt.
Källa: dl.acm.org
Detta verkar vara ett jättestort steg, när det gäller ämnet dålig
hörsel !
Detta kommer förmodligen också till användning inom musik och
ljudtekniken.
Men som sagt, det tråkiga i allt vad teknisk utveckling gäller så
kommer det i felaktiga händer och brukas i felaktigt syfte !
Toppen…..
Denna AI-teknik kommer att vara jättebra för dålig hörsel, hoppas den också
kan användas till fördel vid musikconcerer och ljudteknik.
När dessa hörlurar används i positivt syfte är det toppen, men som all
teknisk utveckling så brukas detta i negativt syfte och då orsakar detta
stora omkostnader för att åtgärda missbruket !
Tack för ordet, har själv jobbat inom teknisk utveckling….