Что делают ИИ- энтузиасты. Запустили модель уровня Kimi k2 думающую на обычном ПК. Скорость 0.5 токена в секунду (2 слова в секунду). Зато все конфиденциально :)
Ну ты ж знаешь эти, как их там: депрессия, торг, принятие. Эпел сначала делает, а всем остальным надо пройти все стадии, чтобы нормально воспринималось😆 Ответить
раскрыть ветку (1)
Терпеливый Монстр
был момент она вообще как то дешего стоила, 20-22г, тоже волны как с видяхами Ответить
Простите, но это похоже на фейк. Не может на таком железе такая модель так быстро работать. Она занимает 490гб. Даже если учесть, что не сразу все включаются все веса, ну как минимум 250гб на первый прогон требуется. У него ни памяти в видео ни оперативки на это не хватает. Ssd не может вытянуть такой скорости.
Это какой-то звиздешь. Ответить
Долинный Гранат
Кроме того ollama не параллелит вычисление. Либо vram+gpu, либо ram+cpu. Решения выстраивания очереди ssd - ram - vram не нашел. А уж параллельное вычисление между cpu and gpu нормального нет, потому что 1. Рост ошибок растет и cuda падает или пересчитывает 2. Общая скорость падает на одно и нужно слишком много думать о синхронизации.
В общем, либо это фейк чистой воды, либо чувак сделал невозможное и написал свой софт чтобы все работало, не падало и каким-то образом ускорилось. Ответить
Это какой-то звиздешь.
В общем, либо это фейк чистой воды, либо чувак сделал невозможное и написал свой софт чтобы все работало, не падало и каким-то образом ускорилось.