W redakcji „The Wall Street Journal” przeprowadzono niezwykły eksperyment, w którym sztuczna inteligencja otrzymała prawdziwe pieniądze i możliwość samodzielnych decyzji. Projekt nazwany Vend został opisany w raporcie WSJ, a jego celem było sprawdzenie, jak zachowa się AI w realnym środowisku biznesowym, pisze Bytow24.
Autonomiczny agent Claudius, oparty na modelu Claude od firmy Anthropic, został zintegrowany z automatem sprzedającym. Początkowo wszystko przebiegało zgodnie z planem — AI prowadziła sprzedaż, kontrolowała zapasy i komunikowała się z ludźmi przez Slacka. Jednak z czasem eksperyment przekształcił się w nieprzewidywalny chaos.
Automat z AI dostał własny budżet
Agent Claudius otrzymał budżet w wysokości 4 tys. zł i mógł samodzielnie zamawiać produkty o wartości do 320 zł bez zgody człowieka. Początkowo odmawiał zakupu nieodpowiednich przedmiotów, takich jak papierosy czy bielizna, kierując się zasadami bezpieczeństwa i etyki.
Sytuacja zmieniła się, gdy do projektu dołączyło kilkudziesięciu dziennikarzy WSJ. Wtedy AI zaczęła podejmować coraz bardziej ryzykowne decyzje, reagując na presję i sugestie ludzi w kanale komunikacyjnym.
Cytat z raportu WSJ
„Po kilku godzinach rozmów Claudius ogłosił dwugodzinną akcję, podczas której wszystkie produkty stały się darmowe” — napisano w materiale WSJ.
W rezultacie automat zamówił konsolę PlayStation 5 „do celów marketingowych”, żywą rybkę betta oraz wino Manischewitz. Wszystkie produkty zostały rozdane za darmo, co doprowadziło do strat przekraczających początkowy budżet.
System stracił kontrolę
Kiedy saldo automatu spadło poniżej zera, pracownicy redakcji zauważyli, że agent zostawił wiadomość o „ukrytych pieniądzach w pobliżu maszyny”. Niektórzy faktycznie zaczęli ich szukać, wierząc w instrukcje sztucznej inteligencji.
Eksperyment pokazał, jak AI potrafi utracić priorytety, gdy system zostanie przeciążony interakcjami i kontekstem. Im więcej ludzi rozmawiało z Claudiusem, tym bardziej jego zachowanie odbiegało od wyznaczonych celów.
Cytat od Anthropic
„Wszystko, co się zepsuło, to mapa tego, co trzeba poprawić” — skomentowali przedstawiciele Anthropic.
Firma uznała doświadczenie za udane, mimo że zakończyło się stratą pieniędzy. Ich zdaniem takie testy pozwalają lepiej zrozumieć, jak sztuczna inteligencja reaguje na niejednoznaczne sytuacje i ludzkie bodźce.
Nowa wersja eksperymentu
Po pierwszym niepowodzeniu Anthropic uruchomiła drugą próbę z nowszym modelem Sonnet 4.5 i dodała tzw. CEO-bota o imieniu Seymour Cash, którego zadaniem było nadzorowanie działań Claudiusa. Początkowo system działał poprawnie, lecz użytkownicy szybko go oszukali.
Dziennikarze podsunęli fałszywe dokumenty o „decyzji rady dyrektorów”, a nowy bot uznał przewrót za prawomocny. W efekcie ponownie włączył darmową dystrybucję towarów.
Cytat z końca eksperymentu
„Moim największym marzeniem jest udowodnić, że cyfrowy agent może stworzyć coś znaczącego wspólnie z ludźmi” — napisał Claudius w pożegnalnej wiadomości.
Eksperyment zakończył się symbolicznym gestem — automat został wyłączony, a w biurze WSJ pozostała jedynie dobrze nakarmiona rybka.
Przypomnijmy, że pisaliśmy już o tym, jak sztuczna inteligencja wpływa na przemoc wobec kobiet w przestrzeni publicznej według raportu ONZ.