АВТОНОМНЫЕ ИИ АГЕНТЫ
Manus, Proxy AI, Camel AI и другие сервисы для мульти-агентов сейчас на хайпе…
Они пугают людей тем, что выполняют сотни действий одновременно….
И манят заголовками «Как создать ИИ-агента, который работает вместо тебя?»
Сейчас будет непопулярное мнение:
БОЛЬШИНСТВУ людей НЕ БУДУТ доступны такие технологии…
и нет, дело не в цене…
дело не в экспертизе в задаче…
Дело в том, что 99% людей даже не умеют написать грамотный системный промпт для GPTs помощника.
Несколько простых примеров, чему учат в рилсах на тему GPTs и люди повторяют:
— Поставьте туда огромную базу знаний из pdf файлов (думая, что он их и правда прочитает).
— Они просят ChatGPT за них придумать промпт-инструкцию, не понимая, как это влияет на контекст и какие “человеческие” параметры, примеры туда надо прописать.
(если что, это не самые рабочие способы создавать GPTs)
А с промптами для автономных ии мульти-агентов (как в примере с соц сетями) настолько много неизвестного, что даже промпт инженеры крупных компаний пока разводят руками.
И пишут в гайдах размытые формулировки: “прописывайте функции конкретно”, не отвечая на вопрос “как”, “какие”, без подробных рабочих примеров.
Прежде чем пойти дальше, разберемся, в чем разница ИИ агентов от автоматизаций с ИИ.
Обычная ИИ-автоматизация (например, ии в переписках, в продажах и контроле менеджеров) — это как робот-пылесос:
— Выполняет только одну задачу (пылесосит)
— Не может сам решить помыть пол или вытереть пыль
— Если застрянет, ждет помощи человека
ИИ-агент — это как роботизированный дворецкий:
— Понимает общую цель (“сделай дом чистым”)
— Сам решает: сначала пылесосить или мыть посуду
— Если встретит препятствие, найдет обходной путь
— Может использовать разные инструменты: пылесос, швабру, тряпку
Еще пример для общего понимания:
Обычный ИИ — умный светофор, который только регулирует движение
ИИ-агент — беспилотное такси, которое само планирует маршрут, объезжает пробки и доставляет тебя к цели
Главное отличие: агент сам понимает цель и выбирает способы её достижения.
Если в простых задачах в стиле “собери инфу на тему Х” – каждый школьник справится.
То для комплексных задач в интернете есть несколько сложностей:
1. ОБУЧЕННОСТЬ ИСХОДНОЙ МОДЕЛИ
Даже для выполнения простых задач в интернете разработчикам нужно научить ИИ какие кнопки в интернете, на каких сайтах как работают. Вшить все возможные сценарии.
Приведу пример, я тестировала активно Proxy AI, и он каждый раз ломался на задаче поиска билетов на нужные даты.
Так как он тупо НЕ понимал, что на сайте поиска билетов, чтобы выбрать дату через 6 месяцев, нужно нажать на стрелочку в календаре.
Он 30 минут пытался бодаться с тем, чтобы цифрами вбить дату, и на любые команды в стиле “в календаре есть кнопки с месяцами… и далее подробное объяснение как работать с календарем на этом сайте”, он продолжал ломаться.
И таких примеров будет сотни. Интернет создан для людей, а не машин (пока что).
Из этого вытекает следующая сложность.
2. БОРЬБА ИНТЕРНЕТА И ИИ АГЕНТОВ
Прямо сейчас куча интернет гигантов разрабатывают системы, которые будут определять, что это ИИ совершает действия, что тексты написаны ИИ без вклада человека и тд… и на примере соц сетей, будут стараться НЕ продвигать такой контент.
И это ХОРОШО.
Иначе весь интернет будет заполонен фантазиями от нейросети. И будет сложно найти где факты, перевоисточники и тд.
А когда мы отправляем нашего ИИ агента читать почту – то там будет отдельный большой вопрос, кто теперь отвечает за конфиденциальность переписки и данных из имейлов?
И так на каждый способ применения – есть много вопросов, и пока мало ответов.
💬 Какой вывод я сделала для себя:
→ массово людям нужно учиться качественно перекладывать свои экспертные задачи и знаний в GPTs помощников и промпты, что уже ускоряет задачу в 6-10 раз (по факту об этом вся фокус-группа)
→ далее уже эталонно решаемые ИИ задачи переводим в простые автоматизации
→ и только потом вообще стоит смотреть в ии мульти-агентов
На самом деле это основа из работы над бизнес процессами (да да, скучные слова)…