Русский ИТ бизнес 👨
Подписаться
Anthropic выпустила Claude Sonnet 4.5 и заявляет 82 процента точности в Agentic Coding. Модель прибавила в математике и расчетных задачах, лучше справляется с трудными числовыми рассуждениями.

На финансовых бенчмарках держит конкурентный уровень, где проверяют прикладные решения и анализ данных.

В коде и компьютерном использовании показывает лидирующие результаты, включая задачи, где агенту нужно пользоваться инструментами для достижения цели.

Для разработчиков добавлены чекпоинты, правка контекста, память и расширение для VS Code для управления сложными процессами. Усилена защита от манипуляций и prompt injection.

Появился новый Agent SDK для сборки агентов на базе Claude Code.

Русский ИТ бизнес

Комментарии (0)

  • DADementr
    Угу и заодно сломали позавчера-вчера лимиты по Opus вообще не доступен был. Сегодня вроде починили
    • zerohold
      Opus конский ценник
      • DADementr
        Да писец конечно. Но юзаю, так как сопоставимых нет
        • khizetel
          А для каких задач, если не секрет?
          • DADementr
            сложная математика и тригонометрия в коде. Лень думать, только проверяю)
            • bonchb
              А че другие нейронки не ало с матемаиикой?
              • DADementr
                с такой нет. У меня сейчас набор GLM, Grok и Opus по возрастающей цена-качество
                • bonchb
                  Тут хором все got 5 хвалят
                  • DADementr
                    gpt 5? днище вообще ИМХО для моих задач.
                    • bonchb
                      Хер поймешь. Кто чо говорит
                    • Ochen_Grustniy_Chelovek
                      поддерживаю. правда мои задачи, мягко говоря, отличаются от сложной математики и тригонометрии. В курсоре гпт-5 еще и ленится жутко. обрубает выполнение отчетом после каждого чиха.
                      • DADementr
                        ну у них это не первая просадка по качеству. Поправят со временем. Летом 23 тоже обновой сильно поломали, но к осени пофиксили
                        • Ochen_Grustniy_Chelovek
                          я два месяца только развлекаюсь. не застал :) написал пока сайт себе и crm в приличном виде. Вышло дешевле, чем у дяди, нет посредников, теряющих логику, и задачи решает гораздо быстрее человека.
                      • alexy_os
                        Юзайте в режиме max gpt-5-high и ничего забывать и обрезать не будет и по деньгам выходить будет в 5 раз дешевле sonnet
                        • Ochen_Grustniy_Chelovek
                          попробую, спасибо. вообще под общие задачи и авто хватает. она как будто умнее джипити)
                          • alexy_os
                            А я как Скрудж Макдак каждый токен считаю и испытываю панические атаки когда представляю, что в режим Auto случайно забредет дипсик) если хочу сэкономить то просто юзаю gpt-5-mini и уже довольно часто grok-code-fast он сейчас бесплатно раздается
                            • Ochen_Grustniy_Chelovek
                              или о3, хоспади прости. я уже тоже научился их различать. к слову, для моих бытовых задач, авто моделька даже Kinsing мне изгнала с сервера на ура) supernova еще пробовал, он 800к поддерживает и тоже фри сейчас, достаточно продуктивно справляется с размытыми обширными задачами, вроде : "посмотри все и исправь"😁
                            • bonchb
                              А где можно потестить grok-code-fast? Веб браузере его нет.
                              • alexy_os
                                В Open Router стоит копейки, а в IDE Cursor доступен по подписке в 20$ Pro
                                • bonchb
                                  Пользуешь через АПИ или через их веббраузер? Бо нативной десктопной версии Open Router нет. Есть третьи приложения обертки.
                                  • alexy_os
                                    Да, через API в своем приложении по созданию сайтов и seo статей. А по разработке, grok юзаю в курсоре
                              • Maxim279
                                Западные коллеги говорят это лучшая модель, чтобы в 10 раз быстрей получить нерабочий код ))

                                А вот grok 4 fast уже получше.
            • khizetel
              Может информация будет полезной. В Genspark с минимальной подпиской есть разные модели. И до Нового Года у них безлимит на ии чаты. Кредиты не списываются совсем
              • DADementr
                Тут основной затык в том, что реселлеры не могут повторить систему агентов у чатов производителей это не сама модель такая писец умная, а многослойные этапы обработки запросов. Но гляну, спасибо
                • khizetel
                  Genspark это в принципе один большой ии-агент. Он мне моментами не нравится. Тот же поиск и анализ хуже Perplexity. Но что-то очень даже ничего.
                  • DADementr
                    угу, смотрю сейчас
              • rznvlxndr
                perplexity тоже довольно оперативно добавляет
              • DADementr
                Ниче так. Справился. Итераций больше чем с Опусом, но достойно.👍
                Еще помучаю и там посмотрим может оформлю подписку
  • DADementr
    Врут. Тоже самое на сложных мат и тригонометрических расчетах в коде. Opus пока рулит
  • bonchb
    Вот все конечно круто. Новые совершенные техники кодинга и т. П. Но один хер пока совершенной системы тестирования я чет не видел. У меня 60 ℅ занимает тестирование после кодинга. Проверки на дурака, на предотвращение ошибок и влияние человеческого фактора
  • zerohold
    Opes конский ценник
  • DADementr
    Только опус у них знатный, но лимиты порезали аж задушили
    • bonchb
      И не говори братан, гады немцы 🤨