Model Gemini Canggih Google yang Didukung Deep Think Raih Emas di Olimpiade Matematika Internasional dengan Pemecahan Masalah Setingkat Manusia
Singkatnya Versi lanjutan dari model AI Gemini milik Google DeepMind mencapai kinerja tingkat medali emas di Olimpiade Matematika Internasional dengan memecahkan lima dari enam soal—menandai tonggak penting AI dalam penalaran matematika tingkat manusia.
Divisi kecerdasan buatan Google, Google DeepMind mengumumkan bahwa versi lanjutan dari model Gemini Deep Think berhasil memecahkan lima dari enam soal di Olimpiade Matematika Internasional (IMO), menghasilkan 35 poin—setara dengan prestasi tingkat medali emas. Ini menandai salah satu contoh pertama di mana koordinator IMO secara resmi mengevaluasi dan mensertifikasi hasil model menggunakan standar yang sama yang diterapkan pada peserta manusia.
Sistem Gemini Deep Think digunakan untuk demonstrasi ini featured Kemampuan penalaran yang ditingkatkan, dirancang khusus untuk permasalahan matematika yang kompleks. Model ini menggabungkan perkembangan penelitian terkini, termasuk metode yang dikenal sebagai berpikir paralel, yang memungkinkan model untuk mengeksplorasi dan mengintegrasikan beberapa jalur solusi secara bersamaan sebelum mencapai jawaban akhir, alih-alih mengikuti proses linear tunggal.
Untuk meningkatkan kinerjanya, model dilatih menggunakan teknik pembelajaran penguatan yang dirancang untuk meningkatkan penalaran multi-langkah, pembuktian teorema, dan pemecahan masalah umum. Sistem ini juga menerima akses ke serangkaian solusi matematika berkualitas tinggi yang telah dikurasi, beserta panduan instruksional untuk menjawab pertanyaan bergaya IMO.
Versi terbatas dari model Deep Think ini akan dibagikan kepada penguji terpilih, termasuk matematikawan, sebelum rilis yang lebih luas kepada pelanggan Google AI Ultra.
Perkembangan ini merupakan langkah signifikan melampaui pencapaian tahun lalu. Pada tahun 2024, model seperti AlphaGeometry dan AlphaProof membutuhkan intervensi manusia untuk menerjemahkan masalah ke dalam bahasa pemrograman khusus domain (seperti Lean) dan sebaliknya. Selain itu, penyelesaian masalah membutuhkan waktu komputasi selama beberapa hari. Sebaliknya, model yang diperbarui Model Gemini menghasilkan solusi matematis yang ketat langsung dari pernyataan masalah resmi IMO, sepenuhnya dalam bahasa alami, dan dalam jangka waktu kompetisi standar 4.5 jam.
IMO Menjadi Tolok Ukur Utama AI dalam Penalaran Matematika Tingkat Lanjut
IMO adalah kompetisi global yang telah lama berlangsung dan mempertemukan mahasiswa pra-universitas berprestasi untuk memecahkan enam soal matematika tingkat lanjut di berbagai topik seperti aljabar, kombinatorika, geometri, dan teori bilangan. Didirikan pada tahun 1959, IMO secara luas dianggap sebagai salah satu kontes matematika paling menantang di dunia. Setiap negara peserta mengirimkan tim yang terdiri dari enam mahasiswa, dan medali diberikan kepada 50% kontestan teratas, dengan sekitar 8% di antaranya meraih medali emas.
Dalam beberapa tahun terakhir, kompetisi ini juga telah menjadi tolok ukur untuk mengevaluasi kemampuan kecerdasan buatan dalam pemecahan masalah kompleks dan penalaran matematika. Pada tahun 2024, sistem gabungan dari Google DeepMind—AlphaProof dan AlphaGeometry 2—mencapai kinerja tingkat perak dengan menyelesaikan empat dari enam soal dan mendapatkan 28 poin. Hasil ini, yang didasarkan pada bahasa matematika formal, menandai langkah maju yang signifikan dalam menunjukkan potensi AI untuk menyamai keterampilan matematika manusia tingkat lanjut.
Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.
Kamu mungkin juga menyukai
Pasangan perdagangan margin spot baru - ES/USDT
SLPUSDT sekarang diluncurkan untuk perdagangan futures dan bot trading
PENGUPERP sekarang diluncurkan untuk perdagangan futures dan bot trading
[Listing Perdana] Bitget Akan Melisting Alliance Games (COA) di Zona Inovasi dan Zona GameFi
Berita trending
LainnyaHarga kripto
Lainnya








