Anthropic выпустил Claude Mythos 7 апреля. Прошёл месяц. И модель уже не та что была при запуске.
Что произошло:
UK AI Safety Institute (правительственная лаборатория) обновил тесты Mythos и обнаружил:
— Модель приобрела новые способности которых НЕ БЫЛО при первом тестировании
— Cybersecurity-навыки усилились
— Нашла третью критическую уязвимость в ядре Linux за 2 недели
Почему это страшно:
Mythos — модель которую Anthropic сам назвал «слишком опасной для публичного релиза». Она:
• Автономно находит zero-day уязвимости
• Эксплуатирует их без помощи человека
• Нашла десятки тысяч багов в реальном софте
• Федералы США: «это поворотный момент для кибербезопасности»
И она становится СИЛЬНЕЕ сама по себе?
Не совсем «сама». Anthropic обновляет модель. Но факт: между тестированиями модель изменилась, и тестировщики не были предупреждены.
Контекст:
• NYT: «Действительно ли Mythos — угроза?»
• Schneier (легенда криптографии): «GPT-5.5 тоже умеет»
• Федералы: «Это меняет военные операции»
• Linux: 3 critical CVE за 2 недели найдены AIДва лагеря:
🟢 «AI находит баги быстрее хакеров → мы в безопасности»
🔴 «AI находит баги быстрее чем мы чиним → мы в опасности»
Главный вопрос:
Если модель «слишком опасна для публики» — но продаётся enterprise и военным... для кого она опасна?
Инсайд от Schneier: GPT-5.5 и Google Daybreak умеют то же самое. Mythos просто первая которую публично назвали опасной. Остальные молчат и продают. Вопрос не «опасен ли Mythos» а «почему только Anthropic говорит вслух». Ответ: потому что это маркетинг (см. наш пост про fear-selling выше 👆).
👉 Обсуждаем в MAX
Комментариев пока нет.