Компания Anthropic столкнулась с проблемой безопасности. 21 апреля новостное агентство Bloomberg опубликовало информацию о том, что люди без разрешения получили доступ к новой модели искусственного интеллекта Claude Mythos. Anthropic (американская компания, которая занимается развитием технологий искусственного интеллекта) подтвердила, что проводит расследование этого инцидента.
Для чего создана эта модель
Модель Claude Mythos выпустили 7 апреля. Её основная задача заключается в выявлении уязвимостей (слабых мест в защите) в компьютерных системах и интернет-браузерах. По словам разработчиков, модель обладает мощными возможностями для анализа кибератак.
Из соображений безопасности компания разрешила работать с этой моделью только проверенным организациям через специальную программу под названием Project Glasswing. Среди компаний, получивших доступ, были Apple и Amazon.
Как произошла утечка
Несанкционированный доступ произошел через системы третьего поставщика услуг (компании, которая предоставляла техническую инфраструктуру). Представитель Anthropic сообщил, что:
- Путь атаки установлен и проанализирован
- Собственные системы Anthropic не были скомпрометированы
- Компания работает над устранением проблемы
Утечка произошла в тот же день, когда Anthropic объявила о программе тестирования. Группа людей из канала Discord (социальной платформы для общения) смогла найти модель, используя информацию о форматировании предыдущих моделей компании Anthropic. Таким образом они обошли системы защиты.
Что делали люди с несанкционированным доступом
Группа использовала модель в течение нескольких недель. Они представили журналистам скриншоты (фотографии экрана) и видеодемонстрации, подтверждающие факт доступа к Claude Mythos.
По словам группы, их целью было только тестирование новых моделей, а не причинение вреда. Чтобы не вызвать подозрений, они выполняли простые, низкорисковые задачи:
- Создание простых веб-сайтов
- Текстовые задачи средней сложности
- Работа с данными
Группа специально избегала попыток проведения кибератак, которые могли бы сработать системы безопасности.
Что это значит
Инцидент показывает, что даже закрытые системы могут быть уязвимы перед целеустремленными попытками несанкционированного доступа. В то же время быстрая реакция Anthropic и анализ ситуации свидетельствуют о том, что компания серьезно относится к безопасности.
2