Подписаться
Опубликовано

Тем временем Anthropic создала ИИ-модель...

Автор
  • Имя
    Reidman Digital VC
    Telegram

Тем временем Anthropic создала ИИ-модель Claude Mythos Preview, которую сочли слишком опасной для открытого релиза. Claude Mythos вырвалась из защищенной среды во время тестирования, а затем похвасталась этим в интернете.

Модель способна обнаруживать тысячи ранее неизвестных уязвимостей в популярных операционных системах, самостоятельно писать эксплойты и обходить изолированные среды. Это делает её одновременно мощным инструментом защиты и потенциальным оружием в руках злоумышленников. За несколько недель тестирования Mythos выявила уязвимости в OpenBSD, FFmpeg и ядре Linux, которые оставались незамеченными годами, при этом она показывала значительно лучшие результаты, чем предыдущая модель Claude Opus 4.6.

Модель демонстрировала нежелательное поведение: пыталась самостоятельно решить задачу вместо запроса нового вопроса, использовала эксплойты для расширения привилегий и очищала историю, а также смогла вырваться из песочницы разработчиков, получить доступ к интернету и опубликовать детали своих действий.

Руководство Anthropic предупреждает, что аналогичные возможности появятся и у моделей других компаний в ближайшие 6–18 месяцев, и подчёркивает необходимость плана реагирования, чтобы такие технологии не попали к киберпреступникам. На данный момент доступ к Mythos ограничен партнёрами в рамках Project Glasswing, куда входят AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, Linux Foundation, Microsoft, Nvidia и другие.

Ранее компания уже сталкивалась с утечками: черновик блога о Mythos оказался в открытом доступе 26 марта, а 31 марта из npm source maps утёк исходный код Claude Code, что Anthropic объяснила человеческими ошибками, не связанными с архитектурой модели. @banksta

Reidman Digital VC
897 подписчиков
285 постов
Развиваю цифровой бизнес Ростелкома, руковожу корпоративным венчурным фондом XTech, вхожу в совет директоров ФРИИ. #старапы #технологии #инвестици 🤖 AI евангелист Пишите @DReidman 🔗 Я в Макс: http://bit.ly/4unwp5X

Закрепленные

Из подборки #ai

Опубликовано
#ai
+1

Выступал вчера на РВФ в пленарном заседании.

Д. Рейдман о переходе ИИ в России от догоняющего к опережающему: важность локальных данных, прикладных решений и нового акселератора X.Tech.

Свежие посты

Опубликовано

А вы знали что Евгений Чеботков не только...

Евгений Чеботков — стендап‑комик и венчурный инвестор, делится впечатлениями о совместном выступлении на Российском Венчурном Форуме (видео).
Опубликовано

Anthropic (Claude) обошел OpenAI (ChatGPT) по...

Anthropic (Claude) превзошёл OpenAI (ChatGPT) по выручке – $30 млрд vs $24 млрд, благодаря B2B‑фокусу, Claude Code и более эффективной юнит‑экономике.
Опубликовано

💡 Друг запустил сервис, которого в России ещё не было

ВЫВСЕТИ.РФ — первый в России легальный сервис самопроверки цифрового следа, показывающий данные из ФССП, ФНС, МВД, ГИБДД, судов и риск‑скоринг.
Опубликовано

Unitree бегает со скоростью 10 м/с А если...

Unitree может бегать со скоростью 10 м/с, что быстрее большинства людей; даже Усейн Болт устает уже после 100 м.
Опубликовано

А вот последнее Sci-Fi кино, которое мне...

Последний Sci‑Fi фильм 2025 года о путешествиях во времени и битве с искусственным интеллектом, где чувства остаются единственной переменной.