Bitget App
Trade smarter
Acheter des cryptosMarchésTradingFuturesEarnWeb3CommunautéPlus
Trading
Spot
Achat et vente de cryptos
Marge
Amplifiez et maximisez l'efficacité de vos fonds
Onchain
Going Onchain, without going Onchain!
Convert
Aucun frais de transaction ni slippage
Explorer
Launchhub
Prenez l'avantage dès le début et commencez à gagner
Copy
Copiez des traders experts en un clic
Bots
Bots de trading IA simples, rapides et fiables
Trading
Futures USDT-M
Futures réglés en USDT
Futures USDC-M
Futures réglés en USDC
Futures Coin-M
Futures réglés en cryptomonnaies
Explorer
Guide des Futures
Le parcours de trading de Futures, du débutant à l'expert
Événements Futures
Profitez de généreuses récompenses
Bitget Earn
Une variété de produits pour faire fructifier vos actifs
Simple Earn
Déposez et retirez à tout moment, rendements flexibles sans risque
On-chain Earn
Réalisez des profits quotidiens sans risquer votre capital
Structured Earn
Une innovation financière solide pour gérer les fluctuations du marché
VIP et Gestion de patrimoine
Des services premium pour une gestion de patrimoine intelligente
Prêt Crypto
Emprunts flexibles avec un haut niveau de sécurité des fonds
Des employés d'OpenAI accusent publiquement les résultats des tests de référence du dernier modèle d'IA de xAI, Grok3, d'être trompeurs

Des employés d'OpenAI accusent publiquement les résultats des tests de référence du dernier modèle d'IA de xAI, Grok3, d'être trompeurs

Voir l'original
Bitget2025/02/23 03:37

Récemment, un employé d'OpenAI a publiquement accusé la société xAI d'Elon Musk d'avoir publié des résultats de tests de référence trompeurs pour son dernier modèle d'IA, Grok3. En réponse, Igor Babushkin, le co-fondateur de xAI, a insisté sur le fait qu'il n'y avait aucune irrégularité.

Le graphique de xAI montre que deux versions de Grok3 - Grok3 Reasoning Beta et Grok3 mini Reasoning - ont surpassé le modèle actuellement le plus puissant d'OpenAI, o3-mini-high, sur AIME 2025. Cependant, un employé d'OpenAI a rapidement souligné sur la plateforme X que le graphique de xAI n'incluait pas le score de o3-mini-high sous la condition "cons@64" dans AIME 2025.

Sur la plateforme X, Babushkin a soutenu qu'OpenAI avait également publié par le passé des graphiques de référence trompeurs similaires. Malgré le fait que ces graphiques soient utilisés pour comparer les performances de leurs propres modèles.

0

Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.

PoolX : Bloquez vos actifs pour gagner de nouveaux tokens
Jusqu'à 12% d'APR. Gagnez plus d'airdrops en bloquant davantage.
Bloquez maintenant !