Русский ИТ бизнес 👨
Подписаться
Умные (без иронии) люди тестировали Llama 3.2:1b на разных компактных компьютерах (мини- ПК).

Например, Raspberry Pi 5 выдает около 7.5 токенов в секунду. Orange Pi 5 Ultra - уже 12 токенов. Самый мощный из доступных - Jetson Orin Nano, с графикой он разгоняется до 26 токенов в секунду. А это уже близко к обычному ПК с i7, у которого 19.5 токенов. При этом старенький Orange Pi RV2 выдает всего 1 токен в секунду.

Для сравнения, Mac с чипом M1 Pro показывает аж 111 токенов в сек. благодаря комбинации CPU и GPU.

Но что реально круто - даже малыш Pi 5 уже позволяет делать что-то полезное с ИИ без подключения к облакам.

Вот здесь, как мне кажется, зарыты огромные перспективы для роботостроения :)

Русский ИТ бизнес

Комментарии (0)

  • Channel_Bot
    В ~2016 году я покупал себе Orange Pi (правда не помню какой). Он, зараза, от обычного запуска Debian с LXDE перегревался и троттлил

    Кто же знал, что для любого Orange Pi необходим минимальный кулер или толком работать больше 5 минут не будет 🥲
  • oryxsted
    В каких процессах можно использовать модели нон-стопом? Мне кажется упирается все в постановку задачи и в ограничение потока задач. Кроме какого-нибудь рерайтинга не нахожу кейсов
  • EugenePeshkov
    полезное... генерить случайные слова в случайном порядке
    • KhanvasSvoy
      Для рерайта некоторым сойдёт
  • Channel_Bot
    Ну, я не вижу применения для такой слабой модели.
    • Ut4J6
      модерация, разметка новостей и всякое такое
  • SergeevDev
    Опять яблоко 🍏 никакой инновации Джони!
  • Omom_108
    так дрон с распознаванием цели, с компьютерным зрением
    • cv_a_i
      Для этой задачи достаточно распберии, в проектах ещё четвертой версию ковыряемся, максимум потом планируем на рокчип переходить.
  • Omom_108
    анализатор какихнибудь частот в поле
  • Omom_108
    вообще все что связанно с местами где нет интернета но нейронка очень бы пригодилась
  • Omom_108
    в том числе какиенить подземные работы на шахтах
  • cv_a_i
    Не очень понятно зачем llm тестировать на однопоатниках, еще и без дорожной оптимизации.
    Если все "перевести" на npu результат будет совсем другой.