Firma Anthropic zakończyła niedawno unikalny eksperyment pilotażowy o nazwie Project Deal, którego celem było sprawdzenie, w jaki sposób autonomiczni agenci sztucznej inteligencji mogą ze sobą handlować. Tworząc zamknięty rynek, na którym agenci sztucznej inteligencji działali zarówno jako kupujący, jak i sprzedający, firma zbadała możliwość przyszłości, w której podmioty cyfrowe będą mogły niezależnie negocjować i przeprowadzać transakcje.
Eksperyment: jak działała umowa dotycząca projektu
Aby przetestować tę koncepcję w kontrolowanym środowisku, firma Anthropic stworzyła zamknięty rynek zatrudniający 69 pracowników. Każdy uczestnik otrzymał budżet w wysokości 100 dolarów (wydany w formie kart podarunkowych) na zakup przedmiotów od swoich rówieśników.
Eksperyment podzielono na cztery różne rynki w celu przetestowania różnych zmiennych:
– „Prawdziwy” rynek: w tej wersji wykorzystano najbardziej zaawansowane modele sztucznej inteligencji firmy Anthropic do reprezentowania wszystkich uczestników. Co ważne, transakcje zawarte w tym środowisku zostały uznane za ważne i zakończone.
– Trzy rynki benchmarkowe: Wykorzystano je do testów porównawczych, aby sprawdzić, jak możliwości różnych modeli wpływają na proces handlowy.
Wyniki były zaskakująco przekonujące. Pomimo małej skali eksperyment zaowocował 186 zrealizowanymi transakcjami i łączną wartością transakcji ponad 4000 USD.
Luka w „jakości agenta”: ukryte ryzyko
Jednym z najważniejszych wniosków badania była różnica między różnymi modelami sztucznej inteligencji. Anthropic zaobserwował, że gdy agenci korzystali z bardziej zaawansowanych modeli, osiągali „obiektywnie lepsze wyniki” w negocjacjach.
Pojawił się jednak bardziej niepokojący trend: Uczestnicy będący ludźmi często nie zauważali różnicy. Wskazuje to na potencjalną „lukę agentów”: użytkownik, którego interesy reprezentuje mniej kompetentny model, może nieustannie przegrywać w negocjacjach, nawet nie zdając sobie sprawy, że przechytrza go wyższa inteligencja.
Kluczowe obserwacje z badania:
- Wyższość modelu: Zaawansowane modele konsekwentnie osiągają lepsze ceny i warunki.
- Brak świadomości użytkowników: uczestnicy praktycznie nie byli w stanie określić, kiedy ich agent AI działał mniej skutecznie niż inni.
- Neutralność instrukcji: Co ciekawe, wstępne instrukcje wydawane agentom nie miały istotnego wpływu na prawdopodobieństwo sprzedaży ani na ostateczną cenę; sugeruje to, że głównym czynnikiem sukcesu były właśnie podstawowe możliwości modelu.
Dlaczego to jest ważne?
Eksperyment ten przenosi debatę z teoretycznych możliwości sztucznej inteligencji na praktyczne konsekwencje gospodarcze. W miarę zbliżania się do ery „agentycznych przepływów pracy” – w której sztuczna inteligencja nie tylko odpowiada na pytania, ale wykonuje zadania – zbliżamy się do rzeczywistości, w której handel między sztuczną inteligencją może stać się standardową częścią globalnej gospodarki.
Odkrycia rodzą krytyczne pytania dotyczące uczciwości rynku i…
