Пошаговый курс обучения своей языковой ИИ- модели.
Чел опубликовал ну очень подробное руководство по сборке LLM с нуля на старых лондонских текстах с 1500 по 1850 годы. Сделаны две одинаковые модели на 117 миллионов и 354 миллиона параметров обучены с нуля. Собран кастомный исторический токенизатор со словарем 30 тысяч и более 150 специальных токенов для архаичного английского...
Вот здесь -
https://blog.desigeek.com/post/2025/09/building-llm-from-scratch-part1/
Преклоняюсь перед людьми, которые могут реализовать такие штуки, т.к. это надо какой мозг то иметь? :)
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться
Комментарии (0)
Комментариев пока нет.