Русский ИТ бизнес
Русский ИТ бизнес
Post media

Для апологетов ИИ - новый чип Apple M5 в 6 раз быстрее текущего в части генерации текста (до первого токена). Что это значит? Как минимум, запуск локальных ИИ будет проще и работать они будут быстрее.

Но скажу так - чем сильнее надувается пузырь ИИ, тем дешевле будут токены и меньше смысла в локальных моделях, если их можно за копейки покупать на рынке.

Русский ИТ бизнес
  • Объёмный Ремесленник
    Объёмный Ремесленник
    Проц это хорошо, только вопрос, где к такому ноуту взять робособаку, которая будет таскать чемодан с оперативной для нормальных моделей...
  • Чесночный Режиссер
    Чесночный Режиссер
    если вы гоняете свои данные в чужие LLM ки не удивляйтесь потом когда вырастет новый конкурент и вас похоронит.
    • Объёмный Ремесленник
      Объёмный Ремесленник
      Не уверен, что в ближайшее время провайдеры llm заинтересуются парсингом ассортимента Петровича...
  • Чесночный Режиссер
    Чесночный Режиссер
    зато когда заинтересуется сосед Петровича и сделает запрос в LLM ку та будет готова выдать ему все расклады. Плати тока за токены
  • Робкий Киллер
    Робкий Киллер
    Ну вот и инфраструктура к gpt-oss открытым моделям подъехала. Можно локально гонять без внешних api
    • Голографический Режиссер
      Голографический Режиссер
      там 32озу, маловато
      • Робкий Киллер
        Робкий Киллер
        Эта да. Для 120B пока маловато но думаю скоро Mac M5 mini выпустят и тогда их можно соединить в кластер
  • Зевающий Хореограф
    Зевающий Хореограф
    Локальные модели нужны для privacy
  • Пряный Единорог
    Пряный Единорог
    Когда пузырь лопнет, токены станут гораздо дороже.
  • Ворчливый Десерт
    Ворчливый Десерт
    Офигительно важный показатель - время до первого токена (нет)