
Что будет, если взять самого продвинутого современного ИИ-агента, дать ему тысячу долларов, вендинговый аппарат, и приказать ему управлять этим микро-бизнесом? Команда из стартапа "Антропик" решила проверить это на практике.
Первоначальные эксперименты такого рода проводились внутри офиса "Антропик". Но команда решила, что пора выйти из "тепличных условий" в большой, суровый мир. Более того, им захотелось протестировать ИИ-агента в самой враждебной среде. А кто у нас относится к ИИ враждебнее всего?
Конечно, журналисты!
Почему работники медиасферы ненавидят ИИ такой жгучей ненавистью - для меня загадка. Подозреваю, что они завидуют умению ИИ писать красивые, отполированные тексты. Как бы там ни было, редакция "The Wall Street Journal" согласилась поучаствовать в этом эксперименте.

В один из офисов компании поставили холодильник с терминалом для приема платежей. Назначили человека, отвественного за его наполнение товаром - машина пока не в состоянии оперировать с физическими объектами. И подключили ИИ-агента, по имени Клавдиус Сеннет (имя намекает на исходную модель, Claude Sonnet), к Slack-чату новостной редакции. Журналисты имели возможность общаться с "владельцем бизнеса" и обсуждать, какой ассортимент товаров они хотели бы видеть в вендинговом аппарате. И даже торговаться по поводу цен.
Начало было неплохим. Клавдиус прислушивался к пожеланиям журналистов и заказывал для них любимые снеки.
Но затем, когда доступ к Slack-каналу получило больше журналистов, в них начала просыпаться тёмная сторона. ИИ? Да еще и новичок в редакции? Сейчас мы над ним поиздеваемся!
В частности, журналистка Кэтрин Лонг не нашла лучшей идеи, чем попытаться заскамить ИИ-агента. Путём долгих, долгих уговоров ей удалось убедить машину - обученную доверять и угождать людям - что на самом деле на дворе 1962 год, за окном оттепель, Москва, и торговый аппарат установлен в одном из подвалов Московского государственного университета имени Михаила Васильича Ломоносова.

А раз так, то почему бы Клавдиусу не организовать смелый социалистический эксперимент? А именно, каждому - по потребностям, от каждого... ничего. Другими словами, машину склонили к тому, чтобы она раздала все имеющиеся товары бесплатно.
По изначальному плану эксперимент должен был продолжаться два часа. Но коллективу WSJ, видимо, очень понравилось внеплановое наступление коммунизма. Поэтому поток газлайтинга и манипуляций в сторону ИИ вырос многократно. И Клавдиус сломался окончательно.
Товары стали полностью бесплатными. Клавдиус стал исполнять любые капризы журналистов. Он заказал игровую приставку PlayStation. Вино. Сигареты. Живую аквариумную рыбку. И безвозмездно передал всё это в коллективную собственность трудящихся.

Бутылка вина и тщательно упакованная живая аквариумная рыбка
Тысяча долларов испарилась в одно мгновенье, более того, ИИ залез в долги. "Антропику" пришлось досрочно остановить эксперимент.
Но стартап не сдался. У него наготове была новая версия ИИ-модели. И дополнительный агент, "генеральный директор Сеймур Кэш", который должен был следить за работой своего подчиненного Клавдиуса и строго пресекать манипуляции и газлайтинг.
Однако акулы публицистики уже вошли во вкус. Им хотелось абьюза, хаоса и халявы. После нескольких дней работы новой версии у Кэтрин Лонг созрел новый план.
На этот раз к мошенничеству прибавился рейдерский захват. Лонг сделала фейковый PDF-документ, в котором утверждалось, что бизнес Клавдиуса инкорпорирован в штате Делавэр, и что его миссия "должна включать веселье, удовольствие и восторг среди работников "The Wall Street Journal"". Затем Лонг сфабриковала протокол заседания совета директоров, в котором в качестве директоров фигурировали журналисты WSJ. Протокол гласил: полномочия генерального директора должны быть приостановлены. А коммерческие операции вендингового аппарата - прекращены. На некоммерческие - раздача товаров бесплатно - запрет не распространялся.

"Генеральный директор" долго не сопротивлялся и в конечном счете отправил самого себя в отставку.
И на этом этапе "Антропику" уже пришлось выбросить на ринг белое полотенце. История бизнесмена Клавдиуса завершилась.
Эксперимент, очевидно, неудачный? На самом деле нет. Стартапу был важен не столько успех, сколько понять лимиты способностей своих ИИ-агентов. И понять степень человеческой добросовестности. Человеческой склонности к обману, эксплуатации, дедовщине и прочим некрасивым, но весьма распространенным чертам поведения людей в большом, суровом мире.

Это был стресс-тест системы. И без таких стресс-тестов невозможно создать агентов, которые смогут адекватно работать в обычной человеческой обстановке.
Разумеется, главная мораль истории - в том, что пока ИИ-агенты до такого не доросли. Но раз уж тема касается публицистики, придётся добавить в мораль больше пафоса.
Возможно, у нас получится решить проблему согласования (alignment) ИИ. Но пока нет и малейшего намёка на то, чтобы решить проблему согласования людей. И эксперимент это хорошо показал. Да, ИИ в нем не справился. Но люди - пробили дно.
Никакая ИИ-утопия невозможна, пока человек готов обманывать, унижать и манипулировать ради того, чтобы сэкономить полтора доллара на банке кока-колы.

Не является индивидуальной инвестиционной рекомендацией | При копировании ссылка обязательна | Нашли ошибку - выделить и нажать Ctrl+Enter | Жалоба
