Как контролировать ИИ в защищенном контуре: методики, инструменты, культура

Внедрение инструментов на основе технологий искусственного интеллекта происходит практически повсеместно: многие сотрудники так или иначе используют их в своей повседневной деятельности. В то же время далеко не каждый задумывается о том, насколько безопасно отдавать генеративной модели ту или иную информацию. Поэтому комплексная защита корпоративных данных при работе с искусственным интеллектом – задача, требующая особого внимания. Как ее решить – рассказывают эксперты компании InfoWatch.

Утечки данных через публичные нейросети – частая практика

Технологии ИИ обладают большими возможностями в таких направлениях, как обработка и анализ больших объемов данных, автоматизация рутинных задач, улучшение коммуникации и переводов, генерация идей, контента и решений. Вместе с тем их неграмотное и неконтролируемое применение провоцирует новые угрозы для бизнеса: нарушение правил обработки персональных данных, утечки данных, юридические и регуляторные риски, выполнение несанкционированных действий, распространение конфиденциальной информации за пределы корпоративного периметра. Чтобы обезопасить себя от этого, компаниям необходимо принимать предиктивные меры для защиты данных, которые могут быть использованы сотрудниками при работе с ИИ-сервисами

 

Преимущества и риски ИИ-сервисов в корпоративной среде

Преимущества и риски ИИ-сервисов в корпоративной среде
Источник: InfoWatch

 

Менеджер по развитию продуктов InfoWatch Сергей Сидоренко представил наиболее распространенные на практике сценарии использования ИИ в компаниях и показал, какие угрозы они создают для бизнеса:

  • сотрудник загружает Excel-файл с клиентской базой (ФИО, номера телефонов, суммы платежей и другие сведения) в публичную нейросеть, чтобы проанализировать данные;
  • сотрудник отправляет в нейросеть внутренний план развития компании, чтобы ИИ помог сгенерировать улучшенную стратегию;
  • разработчик загружает в нейросеть фрагменты кода для поиска ошибок;
  • HR-специалист использует бесплатный внешний ИИ-сервис для обработки резюме, анкет или внутренних профилей сотрудников.

Во всех случаях конфиденциальная информация и интеллектуальная собственность покидает периметр компании и может оказаться скомпрометированной, доступной третьим лицам.

Мировой опыт утечек данных из-за ИИ

По данным опроса InfoWatch, 46% респондентов из сферы информационной безопасности российских компаний сталкивались со случаями утечек через ИИ или знают о таких случаях. В глобальном информационном поле можно найти множество подобных инцидентов и в международных компаниях.

Например, еще в 2023 году инженеры Samsung трижды за месяц загрузили в ChatGPT фрагменты исходного кода для проверки и оптимизации. Данные ушли на серверы OpenAI и могли быть использованы для обучения модели. В итоге компания экстренно ограничила сотрудникам доступ к ChatGPT.

В 2025 году сотни тысяч приватных чатов пользователей чат-бота Grok оказались проиндексированы Google. Причина – функция «поделиться чатом» делала переписку доступной для поисковых роботов, а не только для конкретного получателя.

В том же году исследователи обнаружили, что наборы учетных данных рекрутингового ИИ-бота McDonald’s Olivia, работающего на платформе McHire, защищены паролями admin и 123456. Данные 64 миллионов соискателей, имена, email, телефоны, переписки с ботом могли быть похищены и в дальнейшем использованы для фишинга.

В 2026 году исполняющий обязанности главы Агентства по кибербезопасности США загрузил служебные документы с пометкой «только для официального использования» в публичную версию ChatGPT. Внутренние системы зафиксировали факт утечки, началось расследование на уровне Министерства внутренней безопасности США.

Совсем недавно исследователи Red Access обнаружили около 380 тысяч общедоступных приложений, созданных с помощью ИИ-инструментов (Lovable, Replit, Netlify и др.). Около пяти тысяч из них раскрывали конфиденциальную информацию.

Типовые сценарии компрометации данных при работе с ИИ

По убеждению Сергея Сидоренко, риски при работе с ИИ не абстрактны и не линейны: они разнообразны и часто непредсказуемы. Для минимизации подобных угроз необходимо использовать специализированные средства защиты, в частности DLP-системы (Data Loss Prevention System - система, обеспечивающая защиту от утечек информации), которые способны блокировать передачу информации в сторонние ИИ-инструменты.

 

Типовые сценарии компрометации данных при работе с ИИ

Типовые сценарии компрометации данных при работе с ИИ
Источник: InfoWatch

 

Эксперт выделяет следующие типовые сценарии компрометации и, соответственно, методы противодействия им.

Работа в публичных ИИ-сервисах, отправка вложений. Если сотрудник отправляет конфиденциальные данные в публичные ИИ-сервисы, то эти сведения уходят внешнему провайдеру. Их передачу нельзя отозвать, а компания теряет контроль над их дальнейшим использованием. Продвинутая DLP-система анализирует использование текста и файлов и может применить политику блокировки. В ней есть инструменты для контроля ИИ-сервисов, HTTPS-трафика, POST-запросов, анализа текста и файлов, выявления новых ИИ-сервисов и промптов.

Утечка конфиденциальных данных через суммаризацию. Сотрудник может не отправлять в нейросеть документ целиком как вложение, а скопировать ключевые фрагменты его содержания в ИИ-сервис, чтобы, например, получить краткую выжимку. DLP-система анализирует отправляемый текст, выявляет чувствительные данные даже без передачи файла целиком и фиксирует сценарии изменения конфиденциальной информации через ИИ. Если в запросе к нейросети DLP-система обнаружит чувствительные данные, то может его заблокировать.

Компрометация данных при работе с ИИ-агентами, встроенными в бизнес-приложения (CRM, офисные пакеты, таск-трекеры, корпоративные порталы, мессенджеры). Опасность представляет тот факт, что искусственный интеллект уже интегрирован в большую долю корпоративных приложений, причем сотрудники даже не подозревают об этом. С помощью DLP-системы браузерные сценарии можно контролировать через анализ POST-запросов. Также ИБ-специалистам стоит проверять доверенные сервисы на использование ИИ-движков.

Обход ограничений ИИ-модели при помощи промпт-инъекций. Злоумышленник может с помощью специальных промптов попытаться заставить внутреннюю модель игнорировать ограничения и выдать закрытую информацию, не предназначенную для широкого круга пользователей. DLP-система фиксирует обращение к LLM и помогает выявить признаки попыток обхода ограничений.

Раскрытие исходных данных из векторных баз. Эмбеддинг (числовое представление данных языковой моделью в виде векторов) часто воспринимается как безопасное техническое представление текста. Однако при компрометации векторной базы злоумышленник может восстановить часть исходного содержания или извлечь чувствительные признаки документов. DLP-система контролирует такие файлы через соответствующее расширение и помогает выявить аномалии копирования, отслеживая доступ к RAG-хранилищам и эмбеддингам.

Базовые правила ИИ-гигиены для ИБ и администраторов

Большинство сценариев потенциальных утечек данных через ИИ можно выявить, изучая запросы пользователей. Специалистам ИБ необходимо контролировать, кто и куда отправляет данные, выделяя отдельных сотрудников и группы, вести перечень веб-сервисов ИИ и чат-ботов в мессенджерах.

 

Ситуации, при которых риски угроз повышаются

Ситуации, при которых риски угроз повышаются
Источник: InfoWatch

 

Выявлять угрозы помогает анализ содержания запроса в ИИ, его структуры. Среди дополнительных признаков опасности стоит обратить внимание на ответы нейросетей, служебные сообщения от чат-ботов, интерфейс ИИ-сервисов и поиск сайтов с ИИ.

Для эффективного снижения рисков наряду с техническими мерами необходимо формировать корпоративную культуру кибербезопасности. Этот процесс подразумевает разработку и внедрение регламентов доступа к информации, строгое распределение полномочий между персоналом и ИИ-агентами, а также обеспечение непрерывного контроля. Основой такого подхода служат концепция нулевого доверия (Zero Trust), обязательная деперсонализация данных и неукоснительное соблюдение правил анонимизации персональной информации.

DLP в помощь специалистам

DLP-система InfoWatch Traffic Monitor формирует у клиента трехуровневую архитектуру защиты. На начальном этапе происходит блокировка и пресечение подозрительной активности. Далее система переходит к отслеживанию и анализу отклонений в поведении отдельных пользователей. Завершающий уровень включает в себя проведение глубокой аналитики и детальное расследование зафиксированных инцидентов.

 

Подходы к выявлению взаимодействия с ИИ

Подходы к выявлению взаимодействия с ИИ
Источник: InfoWatch

 

Лингвист InfoWatch Ольга Караваева продемонстрировала на практике, как с помощью DLP-системы можно контролировать отправку данных: настраивать политики безопасности, вести мониторинг действий сотрудников, анализировать текст и файлы, блокировать запросы к определенным сервисам, выявлять чувствительную информацию.

Для анализа угроз предлагается комплексная методика выявления рисков: она дает понять, кто из сотрудников имеет доступ к данным и может использовать ИИ, куда именно отправляются данные (адреса сайтов, чат-боты), какой контент содержится в самих запросах.

Модуль мониторинга DLP-системы автоматически выявляет попытки передачи конфиденциальной информации через ИИ-сервисы. Можно проводить анализ не только текста запроса, но и ответов ИИ, служебных сообщений и даже скриншотов.

Резюме

Согласно выводам экспертов InfoWatch, угроза утечек данных через сервисы искусственного интеллекта носит не теоретический, а вполне практический характер и представляет реальную опасность для бизнеса. Эффективная защита требует комплексного подхода, который объединяет организационные регламенты, внедрение технических решений (таких, как DLP-системы) и постоянный мониторинг действий пользователей. Необходимо осуществлять контроль не только за прямой отправкой файлов во внешние сервисы, но и за взаимодействием с интегрированными ИИ-агентами, уделяя особое внимание анализу содержания и контекста пользовательских запросов.

Автор: Михаил Симаков.

Тематики: Безопасность

Ключевые слова: информационная безопасность, InfoWatch, DLP, Искусственный интеллект