Как заставить нейросеть удалить всё лишнее (и нужное тоже)? Разбираемся в «токсичных потоках»

Обилие инструментов делает ИИ-агентов легкой добычей.


m34yk3gb69iz5sv6dfr0w2x663r67cem.jpg

Безопасный на вид сервер может оказаться опасным, если посмотреть, как его инструменты работают вместе. К такому выводу пришли специалисты AgentSeal , изучив более пяти тысяч серверов MCP , которые используют для работы с ИИ-агентами.

Один из примеров выглядит почти безупречно. Сервер billionverify-mcp получил высокий балл, не содержит явных уязвимостей и не поддаётся простым атакам через внедрение команд . Но внутри скрывается связка инструментов, где один загружает внешний контент, а другой удаляет данные. Если агент обработает подменённый текст, внешняя команда может заставить удалить нужный объект. По отдельности оба инструмента безопасны, вместе – нет.

Такие комбинации назвали «токсичными потоками» данных. После анализа 5 125 серверов специалисты нашли такие связки у 555 из них. Причём среди серверов с высоким рейтингом – от 70 баллов – подобные проблемы обнаружились у 151.

Суть проста. Два безобидных инструмента могут создать опасную цепочку. Например, один читает конфиденциальные данные, другой отправляет запросы во внешнюю сеть. Или один получает контент из интернета, а второй удаляет записи. Ни один из инструментов не вредоносен сам по себе, но их последовательное использование открывает путь для атаки.