Русский ИТ бизнес 👨

02.10.2025 07:08

Anthropic выпустила Claude Sonnet 4.5 и заявляет 82 процента точности в Agentic Coding. Модель прибавила в математике и расчетных задачах, лучше справляется с трудными числовыми рассуждениями.

На финансовых бенчмарках держит конкурентный уровень, где проверяют прикладные решения и анализ данных.

В коде и компьютерном использовании показывает лидирующие результаты, включая задачи, где агенту нужно пользоваться инструментами для достижения цели.

Для разработчиков добавлены чекпоинты, правка контекста, память и расширение для VS Code для управления сложными процессами. Усилена защита от манипуляций и prompt injection.

Появился новый Agent SDK для сборки агентов на базе Claude Code.

Русский ИТ бизнес

0/8 Открыть в Telegram

Комментарии (0)

DADementr
2025-10-02 07:10

Угу и заодно сломали позавчера-вчера лимиты по Opus вообще не доступен был. Сегодня вроде починили
- zerohold
  2025-10-02 07:15
  
  Opus конский ценник
  - DADementr
    2025-10-02 07:16
    
    Да писец конечно. Но юзаю, так как сопоставимых нет
    - khizetel
      2025-10-02 07:17
      
      А для каких задач, если не секрет?
      - DADementr
        2025-10-02 07:17
        
        сложная математика и тригонометрия в коде. Лень думать, только проверяю)
        
        bonchb
        2025-10-02 07:20
        
        А че другие нейронки не ало с матемаиикой?
        
        DADementr
        2025-10-02 07:21
        
        с такой нет. У меня сейчас набор GLM, Grok и Opus по возрастающей цена-качество
        
        bonchb
        2025-10-02 07:23
        
        Тут хором все got 5 хвалят
        
        DADementr
        2025-10-02 07:24
        
        gpt 5? днище вообще ИМХО для моих задач.
        
        bonchb
        2025-10-02 07:24
        
        Хер поймешь. Кто чо говорит
        
        Ochen_Grustniy_Chelovek
        2025-10-02 09:36
        
        поддерживаю. правда мои задачи, мягко говоря, отличаются от сложной математики и тригонометрии. В курсоре гпт-5 еще и ленится жутко. обрубает выполнение отчетом после каждого чиха.
        
        DADementr
        2025-10-02 09:41
        
        ну у них это не первая просадка по качеству. Поправят со временем. Летом 23 тоже обновой сильно поломали, но к осени пофиксили
        
        Ochen_Grustniy_Chelovek
        2025-10-02 09:44
        
        я два месяца только развлекаюсь. не застал :) написал пока сайт себе и crm в приличном виде. Вышло дешевле, чем у дяди, нет посредников, теряющих логику, и задачи решает гораздо быстрее человека.
        
        alexy_os
        2025-10-02 12:39
        
        Юзайте в режиме max gpt-5-high и ничего забывать и обрезать не будет и по деньгам выходить будет в 5 раз дешевле sonnet
        
        Ochen_Grustniy_Chelovek
        2025-10-02 12:41
        
        попробую, спасибо. вообще под общие задачи и авто хватает. она как будто умнее джипити)
        
        alexy_os
        2025-10-02 13:04
        
        А я как Скрудж Макдак каждый токен считаю и испытываю панические атаки когда представляю, что в режим Auto случайно забредет дипсик) если хочу сэкономить то просто юзаю gpt-5-mini и уже довольно часто grok-code-fast он сейчас бесплатно раздается
        
        Ochen_Grustniy_Chelovek
        2025-10-02 13:10
        
        или о3, хоспади прости. я уже тоже научился их различать. к слову, для моих бытовых задач, авто моделька даже Kinsing мне изгнала с сервера на ура) supernova еще пробовал, он 800к поддерживает и тоже фри сейчас, достаточно продуктивно справляется с размытыми обширными задачами, вроде : "посмотри все и исправь"😁
        
        bonchb
        2025-10-02 13:27
        
        А где можно потестить grok-code-fast? Веб браузере его нет.
        
        alexy_os
        2025-10-02 14:59
        
        В Open Router стоит копейки, а в IDE Cursor доступен по подписке в 20$ Pro
        
        bonchb
        2025-10-03 03:23
        
        Пользуешь через АПИ или через их веббраузер? Бо нативной десктопной версии Open Router нет. Есть третьи приложения обертки.
        
        alexy_os
        2025-10-03 07:10
        
        Да, через API в своем приложении по созданию сайтов и seo статей. А по разработке, grok юзаю в курсоре
        
        Maxim279
        2025-10-04 03:07
        
        Западные коллеги говорят это лучшая модель, чтобы в 10 раз быстрей получить нерабочий код ))
        
        А вот grok 4 fast уже получше.
        
        khizetel
        2025-10-02 08:11
        
        Может информация будет полезной. В Genspark с минимальной подпиской есть разные модели. И до Нового Года у них безлимит на ии чаты. Кредиты не списываются совсем
        
        DADementr
        2025-10-02 08:13
        
        Тут основной затык в том, что реселлеры не могут повторить систему агентов у чатов производителей это не сама модель такая писец умная, а многослойные этапы обработки запросов. Но гляну, спасибо
        
        khizetel
        2025-10-02 08:16
        
        Genspark это в принципе один большой ии-агент. Он мне моментами не нравится. Тот же поиск и анализ хуже Perplexity. Но что-то очень даже ничего.
        
        DADementr
        2025-10-02 08:18
        
        угу, смотрю сейчас
        
        rznvlxndr
        2025-10-02 08:14
        
        perplexity тоже довольно оперативно добавляет
        
        DADementr
        2025-10-02 10:08
        
        Ниче так. Справился. Итераций больше чем с Опусом, но достойно.👍
        Еще помучаю и там посмотрим может оформлю подписку
DADementr
2025-10-02 07:11

Врут. Тоже самое на сложных мат и тригонометрических расчетах в коде. Opus пока рулит
bonchb
2025-10-02 07:14

Вот все конечно круто. Новые совершенные техники кодинга и т. П. Но один хер пока совершенной системы тестирования я чет не видел. У меня 60 ℅ занимает тестирование после кодинга. Проверки на дурака, на предотвращение ошибок и влияние человеческого фактора
zerohold
2025-10-02 07:15

Opes конский ценник
DADementr
2025-10-12 15:05

Только опус у них знатный, но лимиты порезали аж задушили
- bonchb
  2025-10-12 15:06
  
  И не говори братан, гады немцы 🤨