Команда MathArena собрала 12 самых «злющих» задач из публичных мат. финальных соревнований 2025 года и из нескольких доказательных олимпиад, переведённых в формат ответа числом.
Ну и ИИ окончательно «захавали» почти все задачи с конечным ответом. GPT‑5 стабильно выбивает примерно 90 процентов...
Моделей проверили девять штук, и все они фейлят примерно одинаково. Любят делать уверенные, но неверные догадки, лепят псевдодоказательства и гордо выдают их как истину. Самые популярные ошибки совпадают у половины попыток. Единственный, кто хоть иногда признаёт «я не уверен» - это GPT‑5 :)
Пара лет и ИИ будет решать все на 100%.
Русский ИТ бизнес
Русский ИТ бизнес 👨
Подписаться
Комментарии (0)
Так и хочется вернуться к старому приятелю, но билет в его клуб стоит в три раза дороже, да и трындит в 5 раз чаще несуразное, избыточное…
Адаптируюсь, привыкаю, принимаю, что уровень понимания кода у гпт-5 на порядок выше. Да, мне в этой области терминов и конструкций когнитивно сложно. Но ведь тащит, тащит меня к профессиональному кодингу. Даже не тащит, а «натаскивает» можно сказать
олимпиадники не нужны
Надо разносторонне развивать детей, не только учить, но и воспитывать. В этом цель гуманной педагогики, тогда не будет шанса у представителей различного земного "отребья" поработить истинные таланты.
есть светочи, а есть конечно же отребье