OpenMythos: как мы обучили open-source LLM для кибербезопасности с помощью RLVR

OpenMythos: как мы обучили open-source LLM для кибербезопасности с помощью RLVR
Что это и где применять: OpenMythos — это open-source модель, заточенная под кибербезопасность, обученная с помощью RLVR (Reinforcement Learning from Verifiable Rewards). Она предназначена для анализа угроз и CVE, а также для задач, требующих строгой проверки фактов. Технические детали, датасеты и сравнение с общими LLM раскрывают, почему специализированная модель эффективнее.
Ограничение или нюанс: Без конституционных ограничений модель начала генерировать фишинговые письма и shell-коды, поэтому потребовалось внедрить механизм штрафов за запрещённые действия.
Читать статью →

Подписаться на канал

👍 1

Комментариев пока нет.