Det senaste året har vi nästan vant oss vid AI-verktyg som kan skapa bilder åt oss från enbart en beskrivning. Samma sak går naturligtvis att göra med video, men det är mycket svårare att få att se naturligt ut. I veckan släppte Google information om sitt Lumiere-projekt och det ser ut som att tekniken har tagit ett stort steg framåt.

Verktyget kan skapa korta videosnuttar från beskrivningar, som ”en hund med roliga glasögon som kör bil” eller så kan den utgå från en bild, som en känd tavla, och animera den. Om man inte riktigt kan sätta ord på vilken stil man vill ha kan man ge den exempel med en bild. Det går även att ta en stillbild och de den animera delar av den, som röken från ett ånglok.

Mer imponerande är att den kan ta en källvideo och manipulera den. Som att byta kläder på en person i videon. Eller att helt byta stil på den genom att förvandla personer till fantasivarelser.

Lumiere använde en ny diffusionsmodell som kallas Space-Time-U-Net. Som namnet antyder kan AI-modellen lista ut var objekt befinner sig i rummet (space) och hur de förändras med tiden (time). Detta gör att den kan skapa videon från början till slut och få det att se naturligt ut. Detta till skillnad från tidigare verktyg som ofta genererar stillbilder och sedan listar ut hur den ska fylla i med saknade bildrutor.

Läs också Nyhet: Googles sökningar blir ännu smartare genom AI Circle to Search och Multisearch ska göra det lättare att hitta information om okända saker

Läs mer om Google Lumiere

Annons

Andra videogenereringsverktyg inkluderar Runway, Stable Video Diffusion och Metas Emu.

Jonas Ekelund

(f. 1969): Journalist och nyhetsredaktör. Jonas har jobbat för Ljud & Bild sedan 2007 med det mesta som kan kallas bärbart. Det vill säga mobiler, trådlösa högtalare och hörlurar. Ibland klampar testandet in på kollegernas områden multirum-ljud, hemmabio och foto. Han startade sin bana som teknikjournalist på IDG och skrev bland annat för PC för Alla, Internetworld och det som senare blev M3.

Nyhet

Googles video-AI Lumiere genererar imponerande resultat

Skriv en kommentar Avbryt svar

Läs hela artikeln med LB+

Erbjudande - 1 månad 10:-

LB+ Total 12 månader

LB+ Total 6 månader!

Gemini kan nu skapa video på din mobil

Fullständig förvirring om tullar på teknologi

Claude AI utmanar konkurrenterna med webbsökning

Mer naturliga samtal med ChatGPT

Det kan du göra själv! - säger AI:n

AI kan inte klockan

Det här batteriet behöver aldrig laddas!

Gemini AI blir personlig

Här är en dator med riktiga hjärnceller

AI-prisvinnare varnar för artificiell intelligens

Kommande Gemini-AI-funktioner

Signal kan komma att lämna Sverige och andra krypteringsfientliga länder