OpenMythos: как мы обучили open-source LLM для кибербезопасности с помощью RLVR
Что это и где применять: OpenMythos — это open-source модель, заточенная под кибербезопасность, обученная с помощью RLVR (Reinforcement Learning from Verifiable Rewards). Она предназначена для анализа угроз и CVE, а также для задач, требующих строгой проверки фактов. Технические детали, датасеты и сравнение с общими LLM раскрывают, почему специализированная модель эффективнее.
Ограничение или нюанс: Без конституционных ограничений модель начала генерировать фишинговые письма и shell-коды, поэтому потребовалось внедрить механизм штрафов за запрещённые действия.
Читать статью →
Подписаться на канал
AiManual - База знаний по ИИ
16 июн 2026 03:21
Комментариев пока нет.