Самая мощная модель o3 от OpenAI разоблачена в мошенничестве, получив привилегированный доступ к банку тестовых вопросов FrontierMath заранее

Самая мощная модель o3 от OpenAI разоблачена в мошенничестве, получив привилегированный доступ к банку тестовых вопросов FrontierMath заранее

Bitget2025/01/21 03:29

Показать оригинал

Подрядчик из EpochAI по имени "Meemi" раскрыл на форуме Less Wrong, что OpenAI не только предоставила финансовую поддержку для теста-эталона FrontierMath, но и получила привилегированный доступ к банку тестовых вопросов.

Тамай Бесироглу, заместитель директора и один из соучредителей EpochAI, вскоре признал это на платформе X. Мы совершили ошибку, не раскрыв участие OpenAI в FrontierMath раньше. Наш контракт запрещал нам делать это до выпуска o3. Оглядываясь назад, мы должны были стремиться к большей прозрачности раньше. Мы признаем это и обещаем в будущем действовать лучше.

Эллиот Глейзер, главный математик в EpochAI, признал, что он не раскрывал информацию о финансировании отрасли во время проекта и извинился перед математиками, которые могли бы не участвовать, если бы знали об этом заранее. Что касается оценок o3, он выразил уверенность в точности оценок, предоставленных OpenAI, но подчеркнул, что EpochAI необходимо провести проверку через независимый набор тестов на удержание, который разрабатывается, и пообещал, что оценки из этого набора будут обнародованы. Когда его спросили о статусе этого набора на удержание, Глейзер уточнил, что он все еще находится в стадии разработки, а не завершен.

Сообщается, что FrontierMath является высоко оцененным эталоном оценки способности к продвинутому математическому рассуждению. Он был совместно создан EpochAI с участием более 60 ведущих математиков, включая нескольких лауреатов Филдсовской премии и опытных составителей задач для Международных математических олимпиад.

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.

APR до 12%. Аирдропы новых токенов.

Внести!

Вам также может понравиться

Аналитик Benchmark подтвердил рейтинг "покупать" для японской криптовалютной компании Metaplanet

金色财经•2025/09/25 03:09

У Mafija Brother на Hyperliquid по позициям long по ETH и PUMP плавающий убыток достиг 18,68 миллионов долларов.

金色财经•2025/09/25 02:51

Официальное заявление GAIN: проводится расследование по вопросу аномальной дополнительной эмиссии

金色财经•2025/09/25 02:29

Данные: 10 адресов за 6 часов получили в общей сложности 210 000 ETH на сумму около 863 миллионов долларов.

Chaincatcher•2025/09/25 02:28

Самая мощная модель o3 от OpenAI разоблачена в мошенничестве, получив привилегированный доступ к банку тестовых вопросов FrontierMath заранее

Вам также может понравиться

Популярное

Цены на крипто