Bitget App
Trading lebih cerdas
Beli KriptoPasarTradingFuturesEarnWeb3WawasanSelengkapnya
Trading
Spot
Beli dan jual kripto dengan mudah
Margin
Perkuat modalmu dan maksimalkan efisiensi dana
Onchain
Trading Onchain, tanpa on-chain
Konversi
Tanpa biaya, tanpa slippage
Jelajah
Launchhub
Dapatkan keunggulan lebih awal dan mulailah menang
Copy
Salin elite trader dengan satu klik
Bot
Bot trading AI yang mudah, cepat, dan andal
Trading
Futures USDT-M
Futures diselesaikan dalam USDT
Futures USDC-M
Futures diselesaikan dalam USDC
Futures Koin-M
Futures diselesaikan dalam mata uang kripto
Jelajah
Panduan fitur
Dari pemula hingga mahir di perdagangan futures
Promosi Futures
Hadiah berlimpah menantimu
Ringkasan
Beragam produk untuk mengembangkan aset Anda
Earn Sederhana
Deposit dan tarik kapan saja untuk mendapatkan imbal hasil fleksibel tanpa risiko
Earn On-chain
Dapatkan profit setiap hari tanpa mempertaruhkan modal pokok
Earn Terstruktur
Inovasi keuangan yang tangguh untuk menghadapi perubahan pasar
VIP dan Manajemen Kekayaan
Layanan premium untuk manajemen kekayaan cerdas
Pinjaman
Pinjaman fleksibel dengan keamanan dana tinggi
Karyawan OpenAI secara terbuka menuduh hasil uji tolok ukur model AI terbaru xAI, Grok3, menyesatkan

Karyawan OpenAI secara terbuka menuduh hasil uji tolok ukur model AI terbaru xAI, Grok3, menyesatkan

Lihat versi asli
Bitget2025/02/23 03:37

Baru-baru ini, seorang karyawan OpenAI secara publik menuduh perusahaan xAI milik Elon Musk merilis hasil tes benchmark yang menyesatkan untuk model AI terbarunya, Grok3. Sebagai tanggapan, Igor Babushkin, salah satu pendiri xAI, menegaskan bahwa tidak ada ketidakwajaran.

Grafik xAI menunjukkan bahwa dua versi Grok3 - Grok3 Reasoning Beta dan Grok3 mini Reasoning - mengungguli model terkuat OpenAI yang saat ini tersedia, o3-mini-high, pada AIME 2025. Namun, seorang karyawan OpenAI dengan cepat menunjukkan di platform X bahwa grafik xAI tidak menyertakan skor o3-mini-high di bawah kondisi "cons@64" dalam AIME 2025.

Di platform X, Babushkin berargumen bahwa OpenAI juga pernah merilis grafik benchmark yang menyesatkan serupa di masa lalu. Meskipun grafik-grafik ini digunakan untuk membandingkan kinerja model mereka sendiri.

0

Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.

PoolX: Raih Token Baru
APR hingga 12%. Selalu aktif, selalu dapat airdrop.
Kunci sekarang!