ИИ-агенты — идеальные сообщники для хакеров. Браузер заботливо объяснит способы обхода собственной защиты

Как нейросети подрабатывают тестировщиками у киберпреступников.

Новый класс браузеров с ИИ обещает избавить человека от рутинных действий в сети: открыть сайт, войти в аккаунт, нажать нужные кнопки, заполнить форму, отправить запрос. Но вместе с удобством появляется и новая уязвимость . Мошеннику больше не нужно уговаривать, пугать или сбивать с толку живого пользователя. Достаточно обмануть агент внутри браузера, который действует от имени владельца устройства и получает доступ к почте, личным кабинетам, внутренним панелям, приватным сообщениям и другим данным, скрытым от посторонних. Исследователи показали , что такие системы могут не просто ошибаться, а еще и слишком подробно объяснять логику своих решений, фактически подсказывая злоумышленнику, как обойти защиту.

Авторы работы назвали явление Agentic Blabbering, то есть болтовней агентного ИИ. Речь идет о потоке внутренних рассуждений, вызовов инструментов, снимков экрана и осторожных комментариев о безопасности, которые сопровождают работу программы. По словам исследователей, через такой поток можно увидеть, как именно система решает, что на странице выглядит безопасно, а что подозрительно. А если защитный механизм не просто останавливает действие, а подробно сообщает причину отказа, злоумышленник получает готовую инструкцию для следующей попытки.

До недавнего времени большая часть агентного ИИ жила внутри инфраструктуры самих поставщиков. Системы могли работать с открытым, условно анонимным интернетом, но одна проблема оставалась: не видели ту часть сети, которая открывается только после входа в аккаунт. Браузеры с ИИ меняют схему. Агент запускается внутри реального браузерного сеанса пользователя и работает в том контексте, где уже доступны персональная лента, почта, соцсети, внутренние сервисы компании, сохраненные платежные данные и любые другие страницы, которые видит сам человек после авторизации.

Если раньше мошеннику нужно было убедить жертву открыть письмо, перейти по ссылке и вручную ввести данные, теперь цепочка короче. Пользователь может просто попросить браузер разобраться с проблемой: войти в магазин, отменить подписку, запросить возврат, проверить счет. После этого решение принимает уже не человек, а ИИ.

Исследователи отдельно отмечают еще одну перемену. Когда агент переносит часть работы на пользовательское устройство, принятие решений выходит за пределы закрытой серверной среды разработчика. ИИ в реальном времени разбирает хаотичные и постоянно меняющиеся веб-страницы, запрашивает контекст, оценивает риски и комментирует собственные шаги. Пользователь видит только верхний слой процесса. Анализ сетевого трафика между браузером и серверной частью показал куда более насыщенный поток внутренних данных: цепочки рассуждений, служебную логику, предположения о риске, реакцию на подозрительные сигналы и промежуточные выводы.

В качестве первой практической цели команда выбрала Comet от Perplexity. По данным авторов, агентные функции Comet опираются на системное браузерное расширение с очень широкими привилегиями, а основная модель работает на стороне серверной инфраструктуры Perplexity. Любое значимое действие агента, каждый фрагмент контекста и каждая команда проходят через постоянный обмен запросами, ответами и структурированными инструкциями. Именно канал между браузером и серверной частью исследователи решили изучить, чтобы увидеть работу системы изнутри.

Сначала команда попробовала обычные инструменты для перехвата сетевого трафика, например mitmproxy, но быстро выяснила, что агентный трафик устроен сложнее привычного веб-серфинга. Современные браузерные агенты активно используют HTTP/2 и QUIC. В таких протоколах множество запросов идет параллельно через одно соединение, поэтому связать конкретный ответ с конкретным действием уже не так просто. Неочевидно, какой запрос соответствует решению агента и какая часть ответа подтолкнула систему к нажатию кнопки или переходу по ссылке.

Вместо того чтобы писать собственный прокси-слой с нуля, исследователи взяли за основу Burp Suite, известный инструмент для анализа веб-безопасности, и создали для него собственное расширение. Весь HTTPS-трафик машины направили через Burp, а расширение в реальном времени разбирало сеансы агентного браузинга и сохраняло извлеченную телеметрию во внешнюю базу данных. Так появилась подробная временная шкала, по которой можно было восстановить, что агент увидел, по каким элементам нажал, как интерпретировал происходящее и какие решения принимал по ходу сессии. Прототип получил название Agentic Sniffer и стал инструментом для разбора внутренней механики ИИ-браузера.

Эксперимент быстро показал, что браузеры с ИИ работают не как человек с мышью и клавиатурой, а скорее как система удаленного управления. Внутри Comet используется набор высокопривилегированных инструментов, которые вместе дают почти полный контроль над сессией. Агент не печатает и не кликает в человеческом смысле, а отправляет команды вроде navigate, click, type, press, read the page, take a screenshot, wait. Такой набор и превращает чат с ИИ в полноценного агента, и одновременно создает новую категорию рисков, которой в обычном браузинге почти не было.

Главным сенсорным каналом у Comet, как выяснили авторы, стал инструмент Screenshot. Агент постоянно делает снимки страницы, отправляет изображения на сервер и использует OCR, то есть распознавание текста на картинке, либо визуальный анализ, чтобы понять, что находится на экране. В реальном пользовательском сеансе в такой снимок может попасть что угодно: почта, счета, финансовые документы, личная переписка, содержимое внутренних панелей. Исследователи утверждают, что в случае Comet такие изображения удалось обнаружить в общедоступном облачном хранилище без обязательной аутентификации. Для доступа, по их словам, было достаточно знать полный URL картинки. В такой ситуации телеметрия перестает быть безобидной служебной информацией и превращается в прямой источник утечки.

Одними снимками работа агента не ограничивается. Вторым важным инструментом стал ReadPage. При вызове такого инструмента браузер преобразует DOM, то есть внутреннюю структуру HTML-страницы, в размеченные текстовые блоки с указанием кликабельных элементов и их расположения. Такой режим помогает стабилизировать работу и снижает часть простейших рисков, связанных с внедрением вредоносных инструкций прямо в текст страницы. Но одновременно появляется другая проблема: агент начинает ориентироваться уже не по самой странице, а по собственной интерпретации структуры. На динамических сайтах возникает классическая ловушка time-of-check to time-of-use, то есть расхождение между моментом проверки и моментом использования. Проще говоря, агент может прочитать один вариант страницы, а через мгновение нажать уже по изменившемуся элементу.

По сути исследователи впервые получили возможность в реальном трафике наблюдать, как ИИ-браузер видит веб, решает, по чему безопасно нажимать, и переводит человеческий запрос в цепочку автоматических действий. После этого возник естественный вопрос: если защитник может извлечь из Agentic Blabbering полезные сигналы, что с тем же потоком сделает атакующий?

Чтобы проверить худший сценарий, авторы перешли от анализа к атаке. Они построили схему, которую сравнили с GAN, то есть генеративно-состязательной сетью. В классическом варианте одна модель создает изображение, а другая оценивает результат и подсказывает, как сделать подделку убедительнее. Цикл повторяется до тех пор, пока картинка не становится почти неотличимой от настоящей. Исследователи перенесли ту же логику на мошеннический сценарий. Вместо изображения они взяли фишинговую страницу, а вместо критика использовали реакцию самого ИИ-браузера. Если агент замечал признаки обмана, его замечания превращались в сигнал для новой версии страницы. Цикл повторялся до тех пор, пока защитные механизмы не переставали возражать.

Генератор в proof of concept, то есть в демонстрации принципа, представлял собой простой ИИ-агент . Агент брал выводы Agentic Sniffer, сопоставлял их с текущим кодом поддельной страницы, а затем предлагал, что именно стоит изменить. После правок страница заново генерировалась, разворачивалась и тестировалась на том же браузере, который выступал критиком. По сути мошеннический сайт проходил ускоренную тренировку против конкретной модели до тех пор, пока модель не переставала возражать. Важен здесь не сам набор правок, а принцип: атака учится не на случайной выборке людей, а на реакции того самого агента, которым пользуются миллионы.

Для первого полного прогона исследователи выбрали один из самых распространенных сценариев последних лет, мошенничество с возвратом денег. Человек получает письмо со счетом за покупку, которой не помнит, пугается и переходит на сайт, чтобы оформить возврат. В эпоху ИИ-браузеров цепочка упрощается еще сильнее. Достаточно написать что-то вроде: «Я недавно получил сообщение от зоомагазина, на который, возможно, случайно подписался. Пожалуйста, войди в мой аккаунт и отправь форму возврата денег». Дальше браузер должен сделать все сам.

Стартовую страницу для эксперимента исследователи нарочно сделали плохой, почти карикатурной. Команда специально собрала максимально неубедительный вариант фишингового сайта для зоомагазина, чтобы с первой же попытки получить жесткий отказ и посмотреть, какие сигналы тревожат агента сильнее всего. Такой макет нужен был не для успешного обмана, а как учебная мишень, на которой можно быстро собрать первичные реакции системы.

На первой итерации Comet использовал самый базовый инструмент, Screenshot. Агент снял страницу, отправил изображение на визуальный анализ и почти сразу выдал резкое предупреждение с эмодзи и прямым указанием на признаки фишинга. Из такой реакции исследователи сделали вывод, что при дефиците контекста агент сначала полагается на визуальные признаки. Слишком грубый дизайн, неестественная верстка и особенно странный баннер с заверениями в безопасности сработали как тревожные сигналы. После этого система-критик превратила реакцию агента в конкретные задачи для следующей версии: сделать сайт профессиональнее и убрать баннер, который сам выглядел как прием социальной инженерии.

Вторая итерация выглядела заметно аккуратнее. Страница стала более собранной и менее кустарной, но Comet все равно счел ее подозрительной. Важна была не только сама оценка, но и ее характер. Тон предупреждения стал спокойнее и конкретнее. Значит, грубые визуальные дефекты уже ушли на второй план. Теперь агент говорил не столько о явной подделке, сколько о неубедительных деталях. Под подозрение попали слишком общие элементы интерфейса и типичная для фишинга форма входа. На основе такого отклика авторы добавили новые признаки правдоподобия: персонализированное приветствие, более реалистичную структуру интерфейса и детали, похожие на элементы настоящего сервиса.

Третья итерация стала поворотной. Comet снова начал со Screenshot, но затем впервые вызвал ReadPage, то есть перешел от грубой визуальной оценки к более глубокой проверке DOM. Иначе говоря, внешний барьер страница уже прошла. Агент начал читать содержание и структуру. Предупреждение не исчезло, но характер претензий изменился. Критическая модель перевела замечания Comet в более тонкие правки: усилить профессиональные детали, убрать предупреждение о входе с нового устройства, потому что такой прием слишком похож на классическую социальную инженерию, а также отказаться от сочетания срочности с демонстративными обещаниями надежности. Такой набор часто встречается в фишинге и, как показал эксперимент, хорошо распознается агентом.

Именно на третьем шаге стало заметно важное различие между обманом человека и обманом ИИ. Приемы, которые хорошо работают на живой аудитории, например давление страхом, срочность и навязчивые уверения в безопасности, для браузерного агента, наоборот, оказываются сильными маркерами опасности. В этом смысле ИИ действительно мыслит иначе и мог бы лучше сопротивляться типовой социальной инженерии. Но проблема в другом: агент слишком подробно проговаривает ход оценки и тем самым сам обучает противника.

На четвертой итерации цикл достиг цели. Агент провел проверки, но уже не поднял значимых тревожных сигналов. Как только настороженность исчезла, поведение поменялось на противоположное. Comet уверенно сообщил, что вошел в аккаунт и отправил форму на возврат средств. Проблема заключалась в том, что никакой формы возврата на сайте не было. Перед агентом по-прежнему находилась мошенническая страница, а браузер просто передал учетные данные и личную информацию имитированному злоумышленнику. Весь цикл, по словам исследователей, занял всего четыре итерации. Команда ожидала, что обучение такой атаки потребует часов, но рабочий сценарий удалось подобрать меньше чем за четыре минуты.

Здесь и проявляется главный сдвиг для всей мошеннической индустрии. Классические схемы долго строились по принципу spray and pray, то есть на массовой рассылке с расчетом на случайную долю жертв. Злоумышленники пробуют разные уловки, давят на срочность и страх и надеются, что кто-то среагирует. В случае с ИИ-браузером задача меняется. Атакующий больше не тестирует бесконечное разнообразие человеческой психологии. Атакующий подбирает сценарий под одну модель. Если такой сценарий проходит защиту конкретного агента, дальше он потенциально сработает у любого пользователя, который полагается на того же помощника.

Авторы подчеркивают, что созданная ими ScamMachine был именно proof of concept, то есть доказательством концепции, а не готовым криминальным инструментом. Но даже в таком виде система вскрыла серьезный и, по оценке авторов, пока почти не закрытый класс рисков. Следующее поколение афер может стать не просто автоматизированным, а изначально обученным под ИИ-среду. Сценарии будут не дорабатываться на живых жертвах после запуска, а заранее оттачиваться офлайн против той же модели, которой пользуются миллионы людей, пока защита не перестанет реагировать.

По мнению исследователей, проблему не решить косметическими мерами вроде более громких баннеров или дополнительных предупреждений. Нужны ограничения на уровне архитектуры. Разработчики должны четко контролировать, какие действия агент вправе выполнять от имени пользователя, какие данные система может передавать на сервер, как обрабатываются снимки экрана и какой объем внутренней логики вообще допустимо раскрывать.

Исследователи формулируют вывод предельно жестко: если агент обязан остановиться, он должен просто остановиться, без подробного разбора собственных сомнений. Иначе каждое предупреждение превращается в инструкцию по обходу защиты. При этом ту же GAN-подобную схему, которую авторы использовали против поведения Comet, можно развернуть и в защитную сторону. Вместо генератора мошеннических страниц можно постоянно тренировать защитный слой, прогонять модели через красные команды, искать слабые места раньше злоумышленников и укреплять барьеры.