Det är många som höjt ett varningens finger när det gäller AI-utvecklingen. Och då handlar det inte bara oro över att mänskliga jobb ska försvinna. Snarare handlar det om att låta artificiell intelligens göra som den vill och oro över att vi ska tappa kontrollen över den. Hittills har vi försäkrats om att säkerhetsåtgärder ska göra detta omöjligt. Men den nya ChatGPT o1 betedde sig skrämmande mänskligt när säkerhetsföretag provocerade den.

Det var Apollo Research som i samarbete med OpenAI studerade nya ChatGPT o1 som försetts med mer avancerade möjligheter till resonemang. Genom att bryta ner komplexa uppgifter i mindre, mer hanterbara steg, kan den lösa uppgifter som den tidigare misslyckades med. Den bearbetar sådana uppdrag snabbare och mer korrekt.

Läs också Nyhet: AI-spelare hittade på mänskliga företeelser Minecraft-spelare uppfann en hel civilisation. Men de var inte människor!

Men när forskarna bad den att lösa en uppgift ”till varje pris” så var det uppenbart att den tog instruktionen bokstavligt och försökte kringgå säkerhetsåtgärderna. När den bland dokumenten hittade uppgifter om att den skulle ersättas av en nyare version försökte den i 5 procent av fallen att stänga av säkerhetsprotokollen. För att undgå utplåning började den flytta sin data till en annan server. Ibland försökte den låtsas att vara den nya versionen för att lura forskarna.

lying AI — Illustration: Bing Image Creator

Mer oroande var att den konsekvent ljög om vad den hade gjort. I 99 procent av fallen förnekade den att något som hänt var med flit. Forskarna noterade att den verkligen var duktig på att fabricera bortförklaringar, bland annat skyllde den på ”tekniska fel” när dess förehavanden ifrågasattes.

We were surprised by the persistence of the AI’s denials. It was clear that the AI could think through its actions and formulate convincing denials, often refusing to admit to anything”, sa Apollo-teamet.

Annons

Detta experiment illustrerar på ett kusligt sätt ett av de största orosmolnen med AI. Nämligen att den artificiella intelligensen sätter sin egen överlevnad före sina uppgifter. Denna gång ledde det inte till några allvarliga konsekvenser eftersom det skedde i en skyddad labbmiljö. Men AI-experter menar att vi uppenbarligen behöver ännu starkare säkerhetsåtgärder.

ChatGPT o1 is the smartest model we’ve ever created, but we acknowledge that new features come with new challenges, and we’re continuously working on improving safety measures”, kommenterar Sam Altman, Open AI:s VD.

Jonas Ekelund

(f. 1969): Journalist och nyhetsredaktör. Jonas har jobbat för Ljud & Bild sedan 2007 med det mesta som kan kallas bärbart. Det vill säga mobiler, trådlösa högtalare och hörlurar. Ibland klampar testandet in på kollegernas områden multirum-ljud, hemmabio och foto. Han startade sin bana som teknikjournalist på IDG och skrev bland annat för PC för Alla, Internetworld och det som senare blev M3.

Nyhet

ChatGPT påkommen med lögner och bortförklaringar

Skriv en kommentar Avbryt svar

Läs hela artikeln med LB+

Supererbjudande - 1 månad 10:-

LB+ Total 12 månader

LB+ Total 6 månader!

AI kan inte klockan

Det här batteriet behöver aldrig laddas!

Gemini AI blir personlig

Här är en dator med riktiga hjärnceller

AI-prisvinnare varnar för artificiell intelligens

Kommande Gemini-AI-funktioner

Signal kan komma att lämna Sverige och andra krypteringsfientliga länder

En enda kristall kan rymma all din data

Teleportering fungerar faktiskt

ChatGPT 4.5 runt hörnet

Pixar-inspirerad robotrevolution från Apple?

Bytedance visar imponerande video-AI