Компанія Anthropic нещодавно завершила унікальний пілотний експеримент під назвою Project Deal, метою якого було перевірити, як автономні ІІ-агенти можуть торгувати один з одним. Створивши закритий маркетплейс, де ІІ-агенти виступали одночасно в ролях покупців та продавців, компанія вивчила можливість майбутнього, в якому цифрові сутності зможуть самостійно вести переговори та здійснювати угоди.
Експеримент: як працював Project Deal
Щоб протестувати цю концепцію у контрольованому середовищі, Anthropic створила закритий ринок за участю 69 співробітників. Кожному учаснику було виділено бюджет у 100 доларів (виданий у вигляді подарункових карток) для придбання товарів у своїх колег.
Експеримент був розділений на чотири різних маркетплейси для перевірки різних змінних:
– «Реальний» маркетплейс: У цій версії для представлення всіх учасників використовувалися найпросунутіші моделі ІІ від Anthropic. Важливо, що угоди, укладені у цьому середовищі, визнавалися дійсними та завершувалися.
– Три контрольні маркетплейси: Вони використовувалися для порівняльного аналізу, щоб перевірити, як різні можливості моделей впливають на процес торгівлі.
Результати виявилися напрочуд переконливими. Незважаючи на малий масштаб, в ході експерименту було здійснено 186 завершених угод, а загальна сума транзакцій перевищила 4000 доларів.
Розрив у «якості агентів»: прихований ризик
Однією з найбільш значних висновків дослідження стало різницю між різними моделями ИИ. Anthropic зауважила, що коли агенти працювали на базі більш просунутих моделей, вони досягали «об’єктивно кращих результатів» у переговорах.
Однак виявилася і більш тривожна тенденція: люди-учасники часто не помічали різниці. Це вказує на потенційний «розрив як агентів»: користувач, інтереси якого представляє менш здатна модель, може постійно втрачати вигоду в переговорах, навіть не усвідомлюючи, що його переграє досконаліший інтелект.
Ключові спостереження дослідження:
- ** Перевага моделей: ** Просунуті моделі стабільно домагалися вигідніших цін та умов.
- Відсутність обізнаності користувачів: Учасники практично не могли визначити, коли їхній ІІ-агент діяв менш ефективно в порівнянні з іншими.
- Нейтральність інструкцій: Цікаво, що початкові інструкції, дані агентам, суттєво не впливали на ймовірність продажу чи підсумкову ціну; це свідчить, що основним чинником успіху були саме базові можливості моделі.
Чому це важливо
Цей експеримент переводить дискусію в галузі теоретичних можливостей ІІ в площину практичних економічних наслідків. У міру нашого поступу до епохи «агентних робочих процесів» (agentic workflows) — коли ІІ не просто відповідає на запитання, а виконує завдання — ми наближаємося до реальності, де комерція між ІІ може стати стандартною частиною світової економіки.
Отримані результати порушують критичні питання щодо справедливості ринку та…





















































