Det är många som höjt ett varningens finger när det gäller AI-utvecklingen. Och då handlar det inte bara oro över att mänskliga jobb ska försvinna. Snarare handlar det om att låta artificiell intelligens göra som den vill och oro över att vi ska tappa kontrollen över den. Hittills har vi försäkrats om att säkerhetsåtgärder ska göra detta omöjligt. Men den nya ChatGPT o1 betedde sig skrämmande mänskligt när säkerhetsföretag provocerade den.
Det var Apollo Research som i samarbete med OpenAI studerade nya ChatGPT o1 som försetts med mer avancerade möjligheter till resonemang. Genom att bryta ner komplexa uppgifter i mindre, mer hanterbara steg, kan den lösa uppgifter som den tidigare misslyckades med. Den bearbetar sådana uppdrag snabbare och mer korrekt.
Men när forskarna bad den att lösa en uppgift ”till varje pris” så var det uppenbart att den tog instruktionen bokstavligt och försökte kringgå säkerhetsåtgärderna. När den bland dokumenten hittade uppgifter om att den skulle ersättas av en nyare version försökte den i 5 procent av fallen att stänga av säkerhetsprotokollen. För att undgå utplåning började den flytta sin data till en annan server. Ibland försökte den låtsas att vara den nya versionen för att lura forskarna.
Mer oroande var att den konsekvent ljög om vad den hade gjort. I 99 procent av fallen förnekade den att något som hänt var med flit. Forskarna noterade att den verkligen var duktig på att fabricera bortförklaringar, bland annat skyllde den på ”tekniska fel” när dess förehavanden ifrågasattes.
We were surprised by the persistence of the AI’s denials. It was clear that the AI could think through its actions and formulate convincing denials, often refusing to admit to anything”, sa Apollo-teamet.
Detta experiment illustrerar på ett kusligt sätt ett av de största orosmolnen med AI. Nämligen att den artificiella intelligensen sätter sin egen överlevnad före sina uppgifter. Denna gång ledde det inte till några allvarliga konsekvenser eftersom det skedde i en skyddad labbmiljö. Men AI-experter menar att vi uppenbarligen behöver ännu starkare säkerhetsåtgärder.
ChatGPT o1 is the smartest model we’ve ever created, but we acknowledge that new features come with new challenges, and we’re continuously working on improving safety measures”, kommenterar Sam Altman, Open AI:s VD.
Läs hela artikeln med LB+
Julerbjudande - 50% Rabatt!
50% På LB+ Total i 1 år! (Spara 925 kr)
Prova LB+ Total i 1 månad
Full tillgång till allt innehåll i 1 månad for bara 79:-
LB+ Total 12 månader / 156 kr
Full tillgång till allt innehåll på Ljud & Bild och L&B Home i 12 månader
- Tillgång till mer än 7500 produkttester!
- Stora rabatter hos våra samarbetspartner i LB+ Fördelsklubb
- Nyhetsbrev med senaste nyheterna varje vecka
- L&B TechCast – en podd med L&B
- Inaktiverade annonser