AI-hörlurar gör att du kan höra enskilda röster i en folkmassa

En ny typ av AI-hörlurar som kallas ”Look Once To Hear” kan helt förändra vårt sätt att lyssna och kommunicera i bullriga miljöer.

Geir Gråbein Nordby

2024-06-01 - 16:59

Föreställ dig att du befinner dig på en livlig flygplats, en konsert eller ett bullrigt café. Runt omkring dig finns ett kaos av ljud – andra människor som pratar, musik som spelas och alla typer av bakgrundsljud. Men tänk om du kunde välja att höra bara en persons röst tydligt mitt i allt detta brus?

Detta är visionen bakom ett nytt forskningsprojekt som leds av forskare från University of Washington och Microsoft. De har utvecklat en ny teknik som de kallar ”Look Once to Hear”, som gör att du kan fokusera på en viss persons tal och samtidigt filtrera bort alla andra ljud. Tekniken byggs sedan in i ett par AI-hörlurar.

Titta en gång för att höra tydligt

Tekniken fungerar genom att man tittar på den person man vill höra i några sekunder, samtidigt som man håller in en knapp på sidan av headsetet. Under dessa sekunder fångar två mikrofoner på höger och vänster sida upp personens unika röstavtryck, även om det finns mycket buller runt omkring.

Detta röstavtryck används sedan av en smartphone-app eller specialiserad enhet för att isolera den personens röst. Även om du tittar bort eller rör på dig kommer du att kunna höra personen tydligt, som om ni vore ensamma i rummet.

AI-headseten använder avancerad maskininlärning för att åstadkomma detta. Mikrofoninspelningarna med bakgrundsbrus bearbetas av ett neuralt nätverk som är tränat för att urskilja och förstärka målpersonens unika röstavtryck.

Många användningsområden för AI-hörlurar

Forskarna ser framför sig många potentiella användningsområden för tekniken. Den skulle kunna vara användbar för att höra en guide i ett livligt museum eller en lärare i ett klassrum med mycket bakgrundsljud. Den skulle också kunna hjälpa personer med hörselnedsättning som har svårt att följa med i samtal i bullriga miljöer. Att bygga in tekniken i hörapparater är ett naturligt nästa steg.

AI-hörlurarna är i dagsläget på prototypstadiet, men forskarna har visat att det fungerar med vanliga hörlurar kopplade till en liten dator. De hoppas att tekniken så småningom ska kunna byggas in i vanliga smartphones och trådlösa öronsnäckor.

Läs också Det här är inget aprilskämt! Zone är Dysons första bärbara luftrenare som renar både luften från avgaser och partiklar samtidigt som den stänger ute oönskat brus och levererar rent hifi-ljud.

Bättre än brusreducering

Till skillnad från konventionella brusreducerande hörlurar, som blockerar allt ljud, kan man med de nya AI-hörlurarna selektivt välja vilket ljud man vill höra. Det innebär ett betydande framsteg inom ljudbearbetning och har potential att revolutionera hur vi upplever ljud i bullriga miljöer.

Tekniken skiljer ut det du vill höra och filtrerar bort resten. Illustration: University of Washington

Och översättning då?

När det gäller artificiell intelligens är det lätt att föreställa sig att man också kan införliva direktöversättning från ett främmande språk till det egna modersmålet. Kanske med försökspersonens egen röstsignatur? På så sätt skulle man kunna resa runt i världen utan tolk och förstå det mesta som sägs runt omkring en.

Spionage

Vi kan inte låta bli att undra om teknologin kan användas med onda avsikter. Vad är det som hindrar människor från att spionera på andra? Tja, först måste du isolera rösten hos den person du vill höra. För att göra detta måste du sitta relativt nära och personen måste tala direkt till dig. Mikrofonerna på vardera sidan av huvudet måste vara på samma avstånd från munnen som talar till dig, och sedan kan systemet separera rösten från omgivningen, där varje ljud färdas olika långt till varje öra. Om du sitter för långt bort från personen kommer fasresponsen från rösten inte att skilja sig tillräckligt mycket från den miljö du vill särskilja.

Men det hindrar dig inte från att först gå fram till personen och växla ett vänligt ord, medan en profil av rösten skapas. Och sedan kan man ta ett steg tillbaka och spionera på personen så mycket man vill.

Om den här tekniken ska användas i konsumentprodukter bör den person som ska förstås behöva ge sitt samtycke på något sätt.

Källa: dl.acm.org

Läs vidare ⇩