TESTER Bil & Elfordon Datorer Sport & Träning Gaming Mobil Smart hem Teknik

Nyhet

ChatGPT utvecklas: Får röststyrning och bildkommandon

Snart kommer den artificiella intelligensen att förstå din röst och känna igen bilder.

Av / 2023-09-26 - 12:36
ChatGPT utvecklas: Får röststyrning och bildkommandon

OpenAI:s populära AI-chattbot, ChatGPT, får en uppgradering som utökar dess kapacitet bortom textbaserade interaktioner. Användare kommer nu att kunna interagera med ChatGPT med hjälp av röstkommandon och ladda upp bilder. Dessa förbättringar kommer att rullas ut till ChatGPT-prenumeranter inom de närmaste två veckorna. Och kommer att vara tillgängliga för alla andra användare strax därefter.

Med röstkommandon kan användaren helt enkelt säga sin fråga högt och ChatGPT omvandlar tal till text, bearbetar frågan och svarar med en människoliknande röst. OpenAI har investerat i sin Whisper-modell för tal-till-text-funktioner och introducerat en ny text-till-tal-modell för att möjliggöra naturlig ljudgenerering från textinmatningar. Användarna kommer att kunna välja mellan fem olika röster för ChatGPT.

Läs också Nyhet: Stanford-forskare överraskade av ChatGPT-svar Forskare som jämfört svar från ChatGPT över tid menar att de, förvånande nog, har blivit sämre.

Funktionen för bildkommandon gör det möjligt för användaren att ladda upp bilder, mycket likt Google Lens. ChatGPT analyserar bilden och svarar på frågor som rör det visuella innehållet. Användaren kan också använda ett ritverktyg eller skriva/tala ytterligare frågor för att ge sammanhang till bildbaserade frågor. Detta multimodala tillvägagångssätt bör möjliggöra en mer interaktiv och dynamisk konversation med den artificiella intelligensen.

Även om de nya funktionerna utökar ChatGPT:s kapacitet är OpenAI medvetet om de potentiella risker som är förknippade med syntetiskt tal och bildigenkänning, försäkrar företaget. Illasinnade aktörer kan potentiellt missbruka dessa funktioner för imitation eller bedrägeri.

Funktionen för bildigenkänning har till exempel vissa begränsningar för att skydda den personliga integriteten. ChatGPT har bland annat begränsad förmåga att analysera och göra direkta uttalanden om individer för att undvika missbruk.

Peter Gotschalk
(f. 1973): Chefredaktör L&B Home. Peter har arbetat för Ljud & Bild sedan 2012. Han har varit aktiv som teknikjournalist i många medier sedan 1998, bland annat som chefredaktör för prylmagasinet GEAR och som journalist för tidningarna PC World och Privat Computer. Peter skriver om mobiltelefoner och andra bärbara enheter samt om teknisk innovation, inklusive 5G, elektrisk mobilitet och smarta hem.

Skriv en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

Läs hela artikeln med LB+

Erbjudande

Supererbjudande - 1 månad 10:-

Prova LB+ i en månad för 10:-

LB+ Total 12 månader

Full tillgång till allt innehåll på Ljud & Bild och L&B Home i 12 månader

LB+ Total 6 månader!

Full tillgång till allt innehåll på Ljud & Bild och L&B Home i 6 månader

10:- / första månaden
154:- / mån
154:- / mån
Med ett abonnemang får du även:
  • Tillgång till mer än 7800 produkttester!
  • Stora rabatter hos våra samarbetspartner i LB+ Fördelsklubb
  • Nyhetsbrev med senaste nyheterna varje vecka
  • L&B TechCast – en podd med L&B
  • Inaktiverade annonser

Kommande Gemini-AI-funktioner

Signal kan komma att lämna Sverige och andra krypteringsfientliga länder

En enda kristall kan rymma all din data

Teleportering fungerar faktiskt

ChatGPT 4.5 runt hörnet

Pixar-inspirerad robotrevolution från Apple?

Bytedance visar imponerande video-AI

Gemini 2.0 tillgänglig för alla

Nya EU-regler ska skydda dig från farlig AI-användning

Kinesiskt AI-företag lovar guld och gröna skogar - kan vi lita på det?

Gratis Wi-Fi på SAS-flyg

Världsrekord i kvantberäkning