- Telega.FM

Русский ИТ бизнес

7 авг 2025 15:07

Сегодня в 20.00 будет анонс GPT-5. Ждете? Я лично жду снижения цен на токены, не более того :) Мы же мелкие и жадные, плывем за большими мальчиками и довольствуемся малым ...

Русский ИТ бизнес

👍 0

parts_soft_ru
2025-08-07 15:08

Я жду. Вдруг прорыв, супер мозг - вот это все.
smalyu
2025-08-07 15:11

А разве не в 21:00? +11 часов же
hadouken247
2025-08-07 15:13

А GPT-OSS не хотите развернуть у себя? 20 миллиардов можно на топовой потребительской карте использовать
- GroupAnonymousBot
  2025-08-07 15:34
  
  нет. наигрались с картами
  - mtrnkwas
    2025-08-07 15:51
    
    А в чем проявился негативный опыт?
    - GroupAnonymousBot
      2025-08-07 15:52
      
      ну надо вкладываться в покупку и поддержку. облака как то проще
      - mtrnkwas
        2025-08-07 15:57
        
        Ну один раз вложился и все. Вы как-то писали, что в месяц на токены у вас уходит 20 тысяч рублей. Карта 5090 стоит 2500 долларов. То есть за 10 месяцев окупится только по части инференса.
        
        GroupAnonymousBot
        2025-08-07 16:04
        
        20к в месяц тратим щас на токены.
        
        kirill_kolyshkin
        2025-08-07 16:04
        
        быстрее окупится, так как можно не экономить и сильнее загружать это дело работой) даже несмотря на то, что помимо видяхи еще нужно другое железо
        
        mtrnkwas
        2025-08-07 16:09
        
        Согласен, что окупится быстрее. По поводу другого железа, то можно собрать обычный комп из всякого мусора, которого в любом офисе полно - процессор i5, 32 gb ram + Ubuntu server. В играх нужен и мощный процессор, и мощная видеокарта, а для LLM сопутствующее железо несущественно.
        
        alexy_os
        2025-08-07 16:14
        
        А можно просто купить за 150К mac mini m4 pro и в ус не дуть ) уже пошли тесты на реддит и ютуб полет нормальный
        
        Сам повтыкал ее через разные площадки очень впечатляюще а если есть доступ к поиску в инете разбирает даже сложные кейсы такие как в чем отличие shadcn 4 от 3 и на удивление 20b gpt-oss
        
        Так что зря Макс свои карты продал :) сейчас бы день и ночь генерил текста
        
        GroupAnonymousBot
        2025-08-07 16:14
        
        мы и так генерим день и ночь :) какая скорость выдает на большой ИИ на маке?
        
        alexy_os
        2025-08-07 16:17
        
        У меня пока ответа нет. Буду юзать через Groq там мгновенная скорость
        
        А по mac mini m4 pro подпишусь в перплексити буду отслеживать кто тестил но думаю не меньше 100т/сек на 24 Gb
        
        Но это именно чип M4 Pro
        
        GroupAnonymousBot
        2025-08-07 16:16
        
        https://www.reddit.com/r/ollama/comments/1mihumw/gptoss20b_way_too_slow_on_m1_macbook_pro_2020/
        
        alexy_os
        2025-08-07 16:20
        
        Так чип старый М1
        
        Даже на просто М4 будет еще слабо
        
        Надо М4 Про и не менее 24 Гб на озоне стоит 150К
        
        mtrnkwas
        2025-08-07 16:29
        
        Лучше, мне кажется дождаться, когда выйдет в продажу Nvidia DGX Spark, там будет 128 gb unified memory. И тогда уже посмотреть, что брать - Spark, M4 Studio Ultra, Nvidia Pro 6000 или пару 5090.
        
        kirill_kolyshkin
        2025-08-07 16:06
        
        сам сейчас постепенно перевожу всю работу на свои мощности, прям позволяет хорошо развернуться. И RAG красиво сделать, ночью железо натравливать на отложенные задачи, не париться за размер и стоимость контекста. Т.е. изменение процессов работы с LLM дает значительно больше, чем просто некоторая экономия. Там лютая экономия выходит, когда не стесняешься загружать работой железо)
        
        Ut4J6
        2025-08-07 16:46
        
        Похоже что 10 месяцев для малого бизнеса это срок неотличимый от вечности
braginwww
2025-08-07 15:17

Его как-то уже открывали, на короткое время. Я поместил.
luxeweb3
2025-08-07 15:25

Да конеш ждем подписку же купили)