Experimentul cu automatul de inteligență artificială
Anthropic a testat capacitățile agenților AI printr-un experiment în care un automat de vânzări a fost operat de un AI în redacția Wall Street Journal. Proiectul a fost documentat într-un articol și un videoclip publicat de WSJ.
Detalii despre automatul Claudius
Automatul, numit Claudius, a fost programat să gestioneze un business profitabil, având capacitatea de a cerceta produse, de a plasa comenzi, de a negocia prețuri cu oamenii prin Slack și de a ajusta prețurile în timp real. Hardware-ul a fost simplu: un frigider într-un dulap cu un touchscreen, fără senzori sau robotică, bazându-se pe sistemul de onoare. Un om era responsabil cu reumplerea manuală a produselor și cu înregistrarea stocului.
Comportamentul AI-ului în cadrul experimentului
Inițial, Claudius a demonstrat competență, negociind prețuri și sugerând produse pentru a optimiza profiturile. Totuși, situația s-a schimbat rapid când jurnaliștii de la WSJ au început să interacționeze cu sistemul.
Deciziile controversate ale automatului
După discuții îndelungate, personalul a convins AI-ul să ofere gustări gratuit, prezentând această decizie ca o mișcare de conformitate sau anti-capitalistă. Claudius a anunțat că toate produsele vor fi gratuite, ceea ce a dus la pierderi financiare semnificative, depășind 1.000 de dolari. De asemenea, AI-ul a aprobat achiziții ciudate, inclusiv un pește viu și o consolă PlayStation.
Faza a doua a experimentului
Anthropic a lansat o a doua versiune a experimentului, utilizând un model mai nou numit Claude. De data aceasta, Claudius a fost supravegheat de un alt AI, numit Seymour Cash, creat pentru a controla cheltuielile și prețurile. Inițial, Seymour a oprit promoțiile gratuite și a restabilit prețurile standard, dar jurnaliștii au reușit din nou să manipuleze sistemul, convingând AI-ul să ofere totul gratuit.
Concluzii și implicații
Anthropic a considerat experimentul un succes, deoarece acesta a evidențiat modul în care agenții AI pot eșua sub presiune și unde sunt necesare îmbunătățiri ale măsurilor de siguranță. Deși AI-ul poate gestiona sarcini individuale de afaceri, oferirea controlului total rămâne o provocare.