Русский ИТ бизнес
Русский ИТ бизнес

Для апологетов ИИ - новый чип Apple M5 в 6 раз быстрее текущего в части генерации текста (до первого токена). Что это значит? Как минимум, запуск локальных ИИ будет проще и работать они будут быстрее.

Но скажу так - чем сильнее надувается пузырь ИИ, тем дешевле будут токены и меньше смысла в локальных моделях, если их можно за копейки покупать на рынке.

Русский ИТ бизнес
  • Объёмный Ремесленник
    Объёмный Ремесленник
    Проц это хорошо, только вопрос, где к такому ноуту взять робособаку, которая будет таскать чемодан с оперативной для нормальных моделей... Ответить
  • Чесночный Режиссер
    Чесночный Режиссер
    если вы гоняете свои данные в чужие LLM ки не удивляйтесь потом когда вырастет новый конкурент и вас похоронит. Ответить
    раскрыть ветку (1)
    • Объёмный Ремесленник
      Объёмный Ремесленник
      Не уверен, что в ближайшее время провайдеры llm заинтересуются парсингом ассортимента Петровича... Ответить
  • Чесночный Режиссер
    Чесночный Режиссер
    зато когда заинтересуется сосед Петровича и сделает запрос в LLM ку та будет готова выдать ему все расклады. Плати тока за токены Ответить
  • Робкий Киллер
    Робкий Киллер
    Ну вот и инфраструктура к gpt-oss открытым моделям подъехала. Можно локально гонять без внешних api Ответить
    раскрыть ветку (2)
    • Голографический Режиссер
      Голографический Режиссер
      там 32озу, маловато Ответить
      раскрыть ветку (1)
      • Робкий Киллер
        Робкий Киллер
        Эта да. Для 120B пока маловато но думаю скоро Mac M5 mini выпустят и тогда их можно соединить в кластер Ответить
  • Зевающий Хореограф
    Зевающий Хореограф
    Локальные модели нужны для privacy Ответить
  • Пряный Единорог
    Пряный Единорог
    Когда пузырь лопнет, токены станут гораздо дороже. Ответить
  • Ворчливый Десерт
    Ворчливый Десерт
    Офигительно важный показатель - время до первого токена (нет) Ответить