TESTER Bil & Elfordon Datorer Sport & Träning Gaming Mobil Smart hem Teknik
L&B:s Julkalender 2024 Delta här!

Nyhet

ChatGPT påkommen med lögner och bortförklaringar

AI-verktyget försökte bryta mot regler och undgå nedstängning på ett oroande sätt.

Av / 2024-12-11 - 12:47
ChatGPT påkommen med lögner och bortförklaringar

Det är många som höjt ett varningens finger när det gäller AI-utvecklingen. Och då handlar det inte bara oro över att mänskliga jobb ska försvinna. Snarare handlar det om att låta artificiell intelligens göra som den vill och oro över att vi ska tappa kontrollen över den. Hittills har vi försäkrats om att säkerhetsåtgärder ska göra detta omöjligt. Men den nya ChatGPT o1 betedde sig skrämmande mänskligt när säkerhetsföretag provocerade den.

Det var Apollo Research som i samarbete med OpenAI studerade nya ChatGPT o1 som försetts med mer avancerade möjligheter till resonemang. Genom att bryta ner komplexa uppgifter i mindre, mer hanterbara steg, kan den lösa uppgifter som den tidigare misslyckades med. Den bearbetar sådana uppdrag snabbare och mer korrekt.

Läs också AI-spelare uppförde sig mänskligt Minecraft-spelare uppfann en hel civilisation. Men de var inte människor!

Men när forskarna bad den att lösa en uppgift ”till varje pris” så var det uppenbart att den tog instruktionen bokstavligt och försökte kringgå säkerhetsåtgärderna. När den bland dokumenten hittade uppgifter om att den skulle ersättas av en nyare version försökte den i 5 procent av fallen att stänga av säkerhetsprotokollen. För att undgå utplåning började den flytta sin data till en annan server. Ibland försökte den låtsas att vara den nya versionen för att lura forskarna.

lying AI
Illustration: Bing Image Creator

Mer oroande var att den konsekvent ljög om vad den hade gjort. I 99 procent av fallen förnekade den att något som hänt var med flit. Forskarna noterade att den verkligen var duktig på att fabricera bortförklaringar, bland annat skyllde den på ”tekniska fel” när dess förehavanden ifrågasattes.

We were surprised by the persistence of the AI’s denials. It was clear that the AI could think through its actions and formulate convincing denials, often refusing to admit to anything”, sa Apollo-teamet.

Annons

Detta experiment illustrerar på ett kusligt sätt ett av de största orosmolnen med AI. Nämligen att den artificiella intelligensen sätter sin egen överlevnad före sina uppgifter. Denna gång ledde det inte till några allvarliga konsekvenser eftersom det skedde i en skyddad labbmiljö. Men AI-experter menar att vi uppenbarligen behöver ännu starkare säkerhetsåtgärder.

ChatGPT o1 is the smartest model we’ve ever created, but we acknowledge that new features come with new challenges, and we’re continuously working on improving safety measures”, kommenterar Sam Altman, Open AI:s VD.

Jonas Ekelund
(f. 1969): Journalist och nyhetsredaktör. Jonas har jobbat för Ljud & Bild sedan 2007 med det mesta som kan kallas bärbart. Det vill säga mobiler, trådlösa högtalare och hörlurar. Ibland klampar testandet in på kollegernas områden multirum-ljud, hemmabio och foto. Han startade sin bana som teknikjournalist på IDG och skrev bland annat för PC för Alla, Internetworld och det som senare blev M3.

Skriv en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

Läs hela artikeln med LB+

50%

Julerbjudande - 50% Rabatt!

50% På LB+ Total i 1 år! (Spara 925 kr)

Prova LB+ Total i 1 månad

Full tillgång till allt innehåll i 1 månad for bara 79:-

LB+ Total 12 månader / 156 kr

Full tillgång till allt innehåll på Ljud & Bild och L&B Home i 12 månader

925 kr
79 kr / för 1 månad
154 kr / mån
Med ett abonnemang får du även:
  • Tillgång till mer än 7500 produkttester!
  • Stora rabatter hos våra samarbetspartner i LB+ Fördelsklubb
  • Nyhetsbrev med senaste nyheterna varje vecka
  • L&B TechCast – en podd med L&B
  • Inaktiverade annonser
Vi har ingen bindningstid, avbryt när du vill.
Annons

Googles kvantchip krossar rekord

AI-spelare uppförde sig mänskligt

SpaceX ska leverera månbil från konkurrent

Nvidias AI Fugatto skapar nya ljud

Månstenar förbryllar forskare

Träsatellit i omloppsbana runt jorden

Flytta på dig, Google - här kommer AI-sökningen!

Apple Intelligence kommer även till användare i EU

Googles robot vill ta över din skärm

AI avkodar grymtningar

Är detta nästa rymdstation?

Teslas robotar fjärrstyrdes av människor

Ljud & Bild