Продвинутая модель Gemini от Google на базе Deep Think завоевала золото на Международной математической олимпиаде, показав решение задач на уровне че
Коротко Усовершенствованная версия модели искусственного интеллекта Gemini от Google DeepMind достигла уровня золотой медали на Международной математической олимпиаде, решив пять из шести задач, что стало важной вехой в развитии ИИ на уровне математических рассуждений человека.
Подразделение искусственного интеллекта Google, Google DeepMind Компания объявила, что усовершенствованная версия её модели Gemini Deep Think успешно решила пять из шести задач на Международной математической олимпиаде (ММО), получив 35 баллов, что эквивалентно золотой медали. Это один из первых случаев, когда координаторы ММО официально оценили и сертифицировали результаты модели, используя те же стандарты, что и для участников-людей.
Система Gemini Deep Think, использованная для этой демонстрации featured Расширенные возможности рассуждения, адаптированные для решения сложных математических задач. В неё вошли последние научные разработки, включая метод, известный как «параллельное мышление», который позволяет модели одновременно исследовать и интегрировать несколько путей решения, прежде чем прийти к окончательному ответу, а не следовать единому линейному процессу.
Для повышения эффективности модель была обучена с использованием методов обучения с подкреплением, разработанных для улучшения многошаговых рассуждений, доказательства теорем и решения общих задач. Система также получила доступ к тщательно отобранному набору высококачественных математических решений, а также к инструкциям по решению вопросов в стиле ИМО.
Ограниченная версия этой модели Deep Think будет предоставлена избранным тестировщикам, включая математиков, перед более широким выпуском для подписчиков Google AI Ultra.
Это достижение представляет собой значительный шаг вперёд по сравнению с прошлогодними достижениями. В 2024 году такие модели, как AlphaGeometry и AlphaProof, требовали человеческого вмешательства для перевода задач на языки предметной области (например, Lean) и обратно. Кроме того, решение задач занимало несколько дней вычислений. В отличие от этого, обновлённая версия Модель Близнецов разработали математически строгие решения, используя официальные условия задач ИМО, полностью на естественном языке и в пределах стандартного времени соревнования, составляющего 4.5 часа.
IMO становится ключевым эталоном для ИИ в области продвинутых математических рассуждений
IMO — это давний международный конкурс, объединяющий лучших учащихся предвузовских учебных заведений для решения шести сложных математических задач по таким темам, как алгебра, комбинаторика, геометрия и теория чисел. Основанный в 1959 году, IMO по праву считается одним из самых сложных математических конкурсов в мире. Каждая страна-участница выставляет команду из шести студентов, и 50% лучших участников награждаются медалями, при этом около 8% получают золотую медаль.
В последние годы конкурс также стал эталоном для оценки возможностей искусственного интеллекта в решении сложных задач и построении математических рассуждений. В 2024 году комбинированная система Google DeepMind, состоящая из AlphaProof и AlphaGeometry 2, достигла серебряного уровня, решив четыре из шести задач и набрав 28 баллов. Этот результат, основанный на формальных математических языках, стал заметным шагом вперёд в демонстрации потенциала ИИ, сопоставимого с продвинутыми математическими навыками человека.
Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.
Вам также может понравиться
[Первичный листинг] Листинг DePHY (PHY) на Bitget. Присоединяйтесь и разделите 6,600,000 PHY
Новые спотовые маржинальные торговые пары - ES/USDT
Bitget Trading Club Championship (1-й этап) – совершайте спотовые сделки ежедневно, чтобы разделить 50,000 BGB
Запуск SLPUSDT для фьючерсной и ботовой торговли
Популярное
ДалееЦены на крипто
Далее








