Bitget App
Trade smarter
Acquista CryptoMercatiTradingFuturesEarnWeb3PlazaAltro
Trading
Spot
Acquista e vendi crypto
Margine
Amplifica il tuo capitale e l'efficienza dei fondi
Onchain
Going Onchain, without going Onchain!
Convert
Zero commissioni di transazione e nessuno slippage
Esplora
Launchhub
Ottieni il vantaggio in anticipo e inizia a vincere
Copy Trading
Copia un trader d'élite con un solo clic
Bot
Trading bot IA semplice, veloce e affidabile
Trading
Futures USDT-M
Futures regolati in USDT
Futures USDC-M
Futures regolati in USDC
Futures Coin-M
Futures regolati in criptovalute
Esplora
Guida ai futures
Un percorso da nuovo utente ad avanzato nel trading sui futures
Promozioni sui Futures
Ti aspettano generosi bonus
Bitget Earn
Una varietà di prodotti per far crescere i tuoi asset
Earn Semplice
Deposita e preleva in qualsiasi momento per ottenere rendimenti flessibili a rischio zero
On-chain Earn
Guadagna profitti ogni giorno senza mettere a rischio il tuo capitale iniziale
Earn Strutturato
Un'innovazione finanziaria solida per gestire le oscillazioni del mercato
VIP e Gestione Patrimoniale
Servizi premium per una gestione patrimoniale smart
Prestiti
Prestiti flessibili con elevata sicurezza dei fondi
I dipendenti di OpenAI accusano pubblicamente i risultati dei test di riferimento dell'ultimo modello AI di xAI, Grok3, di essere fuorvianti

I dipendenti di OpenAI accusano pubblicamente i risultati dei test di riferimento dell'ultimo modello AI di xAI, Grok3, di essere fuorvianti

Vedi l’originale
Bitget2025/02/23 03:37

Recentemente, un dipendente di OpenAI ha accusato pubblicamente la società xAI di Elon Musk di aver rilasciato risultati fuorvianti dei test di benchmark per il suo ultimo modello di intelligenza artificiale, Grok3. In risposta, Igor Babushkin, co-fondatore di xAI, ha insistito sul fatto che non ci fosse alcuna scorrettezza.

Il grafico di xAI mostra che due versioni di Grok3 - Grok3 Reasoning Beta e Grok3 mini Reasoning - hanno superato il modello attualmente più forte disponibile di OpenAI, o3-mini-high, su AIME 2025. Tuttavia, un dipendente di OpenAI ha rapidamente sottolineato sulla piattaforma X che il grafico di xAI non includeva il punteggio di o3-mini-high sotto la condizione "cons@64" in AIME 2025.

Sulla piattaforma X, Babushkin ha sostenuto che anche OpenAI aveva rilasciato in passato grafici di benchmark simili e fuorvianti. Nonostante questi grafici fossero utilizzati per confrontare le prestazioni dei propri modelli.

0

Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.

PoolX: Blocca per guadagnare
Almeno il 12% di APR. Sempre disponibile, ottieni sempre un airdrop.
Blocca ora!