Русский ИТ бизнес 👨
Подписаться
Мне пишут - интересный опыт, разрешили поделиться запуском новой локальной ИИ от openAI. Цитирую:

"Макс, доброго времени. Протестировал новую открытую GPT. она прям очень впечатлила! они или что-то задумали, или где-то ошиблись и выложили прям убийцу самих себя..😂

по скорости вот на моей 3060 12G:
17.04 токенов/сек
6644 токенов
1.17 сек. до первого токена

и это на высшем уровне сложности размышления! задача была не простая, по кодингу, она сделала лучше даже чем оригинальный GPT.. поэтому я сильно удивился..

надо тестировать, интересно что там с контекстом в плане не размера а качества. а то размер это пук в воду, он может быть и миллион как у гугла а качества на 10к по итогу..😁 ну и надо почитать лицензию, возможно подвох в ней..

возможно регуляторы монопольные пнули, ибо все вдруг выкатили свое не большие модели с размышлением.😁

если она реально на столько хороша, то при 3090 api больше не надо!..😁 она в сжатии дает качество лучшее ее родителя оригинала бесплатного.."

Иными словами - достаточно средней карты и вы получаете очень умную локальную ИИ на вашем ПК. Потом еще поделюсь цифры - ребята пробуют...

Русский ИТ бизнес

Комментарии (0)

  • alapirov
    это какую модель он гонял по факту?
    • David_Tamoyan
      Так в его 12гигов большая и не влезет - значит мелкую гонял
  • WebDevelopment_Pekarskiy
    Так он на 20b или на 100b запустил?
    Но соглашусь с автором. Я тестировал на своем офисном ПК (GPU встроенный) модель от QWEN на 14b скорость была 2.09 токен/сек до первого токена 29 секунд.
    Запустил от OpenAI 20b модель, скорость до первого токена не изменилась, но скорость стала 7.72 тлен/сек.

    Поставил задачу написать программу где шестиугольник крутится внутри катаются шарики, прописать коллизии и физику, она справилась с парой уточнений, но справилась.
  • alexy_os
    Интересно как будет работать на Mac mini M4/16Gb
  • kbystryakov
    Пробовал gpt-oss 20b на gtx 3060 12gb под lm studio с разными настройками - скорость была в диапазоне от 8 до 45 т/с

    Как на реддите пишут: главное достоинство этой модели - скорость
  • yelrik
    а horizon кто то пробовал?
  • amusinov
    старшая модель, минимальная карта 5090…