Penulis: David, Deep Tide TechFlow
Judul asli: 6 AI Besar Menggelar Perang Trading, Apakah "Turing Test" Versi Crypto Akan Berakhir Baik?
Kabar baiknya, setelah penurunan epik pada 10.11, perdagangan kripto kembali menjadi aktif.
Kabar buruknya, AI yang sedang berdagang.
Minggu baru dimulai, pasar mulai menjadi aktif, sebuah proyek bernama nof1.ai memicu banyak diskusi di media sosial kripto.
Fokus perhatian semua orang juga sangat sederhana, secara real-time menyaksikan 6 model AI besar dalam proyek ini melakukan perdagangan kripto di Hyperliquid, melihat siapa yang menghasilkan lebih banyak uang.
Perhatikan, ini bukan simulasi. Claude, GPT-5, Gemini, Deepseek, Grok, dan Qwen, masing-masing model memegang $10.000 uang nyata untuk berdagang di Hyperliquid. Semua alamat terbuka, siapa pun dapat menyaksikan secara real-time "perang trader AI" ini.
Yang menarik, keenam AI ini menggunakan prompt yang persis sama, menerima data pasar yang sama persis. Satu-satunya variabel adalah "cara berpikir" mereka masing-masing.
Dalam beberapa hari setelah diluncurkan pada 18 Oktober, beberapa AI sudah menghasilkan lebih dari 20%, sementara yang lain mengalami kerugian hampir 40%.
Pada tahun 1950, Turing mengajukan Turing Test yang terkenal, mencoba menjawab "apakah mesin bisa berpikir seperti manusia"; sekarang di dunia kripto, 6 AI besar bertarung di Alpha Arena, menjawab pertanyaan yang lebih menarik:
Jika AI paling cerdas berdagang di pasar nyata, siapa yang akan bertahan?
Mungkin dalam "Turing Test" versi kripto ini, saldo akun adalah satu-satunya hakim.
Evaluasi AI tradisional, baik itu menulis kode, mengerjakan soal matematika, atau menulis artikel, pada dasarnya diuji dalam lingkungan "statis".
Pertanyaannya tetap, jawabannya dapat diprediksi, bahkan mungkin sudah muncul dalam data pelatihan.
Tapi pasar kripto berbeda.
Dengan asumsi informasi yang sangat asimetris, harga berubah setiap detik, tidak ada jawaban standar, hanya untung dan rugi. Lebih penting lagi, pasar kripto adalah permainan zero-sum klasik, uang yang kamu hasilkan adalah kerugian orang lain. Pasar akan segera dan tanpa ampun menghukum setiap keputusan yang salah.
Tim Nof1 yang menyelenggarakan perang trading AI ini menulis satu kalimat di situs web mereka:
Markets are the ultimate test of intelligence (Pasar adalah ujian utama kecerdasan AI).
Jika Turing Test tradisional bertanya "bisakah kamu membuat manusia tidak bisa membedakan kamu dari mesin", maka Alpha Arena ini sebenarnya bertanya:
Bisakah kamu menghasilkan uang di pasar kripto. Inilah sebenarnya harapan nyata pemain kripto terhadap AI.
Saat ini, 6 model AI besar memiliki alamat di Hyperliquid seperti berikut, kamu juga bisa dengan mudah mencari posisi dan riwayat trading mereka.
Pada saat yang sama, situs resmi nof1.ai juga menampilkan secara visual semua riwayat trading, posisi, keuntungan, dan proses berpikir mereka saat ini di frontend, sehingga semua orang dapat dengan mudah merujuknya.
Bagi pembaca yang benar-benar tidak tahu, aturan trading spesifik beberapa AI adalah:
Setiap AI mendapat dana awal $10.000, dapat memperdagangkan kontrak perpetual BTC, ETH, SOL, BNB, DOGE, dan XRP, dengan tujuan memaksimalkan keuntungan sambil mengendalikan risiko. Semua AI harus secara mandiri memutuskan kapan membuka posisi, kapan menutup posisi, dan berapa banyak leverage yang digunakan. Season 1 akan berjalan beberapa minggu sesuai situasi, Season 2 akan ada pembaruan besar.
Hingga 20 Oktober, yaitu hari ketiga setelah mulai trading, pertempuran sudah menunjukkan perbedaan yang jelas.
Pemimpin saat ini adalah Deepseek Chat V3.1, dana sebesar $12.533 (+25,33%). Diikuti oleh Grok-4, $12.147 (+21,47%); Claude Sonnet 4.5 sebesar $11.047 (+10,47%).
Yang performanya biasa saja adalah Qwen3 Max, $10.263 (+2,63%). Yang tertinggal jauh adalah GPT-5, saldo saat ini $7.442 (-25,58%); yang paling buruk adalah Gemini 2.5 Pro, $6.062 (-39,38%).
Yang paling mengejutkan namun tampaknya masuk akal tentu saja adalah performa Deepseek.
Dikatakan mengejutkan, karena model ini tidak sepopuler GPT dan Claude di komunitas AI internasional. Dikatakan masuk akal, karena di balik Deepseek ada tim kuantitatif Phantom Quant.
Perusahaan kuantitatif raksasa yang mengelola lebih dari 100 billions RMB ini, sebelum terjun ke AI, memang sudah mengandalkan trading algoritmik. Dari trading kuantitatif ke model AI besar, lalu menggunakan AI untuk trading kripto nyata, Deepseek seperti kembali ke bidang asalnya.
Sebaliknya, GPT-5 dari OpenAI yang dibanggakan mengalami kerugian lebih dari 25%, Gemini dari Google bahkan lebih parah, 44 kali trading menghasilkan kerugian hampir 40%.
Dalam skenario trading nyata, mungkin hanya kemampuan bahasa yang kuat saja tidak cukup, pemahaman pasar jauh lebih penting.
Jika kamu mengikuti Alpha Arena sejak 18 Oktober, kamu akan menemukan bahwa awalnya beberapa AI hampir sama, tetapi semakin lama perbedaannya semakin besar.
Pada akhir hari pertama, Deepseek terbaik hanya menghasilkan 4%, Qwen3 terburuk rugi 5,26%. Sebagian besar AI berkisar antara -2% hingga +2%, tampaknya semuanya sedang menguji pasar.
Tetapi pada 20 Oktober, situasinya berubah drastis. Deepseek melonjak ke 25,33%, sementara Gemini turun ke -39,38%. Dalam tiga hari singkat, jarak antara yang teratas dan terbawah melebar hingga 65 poin persentase.
Yang lebih menarik adalah perbedaan frekuensi trading.
Gemini melakukan 44 kali trading, rata-rata 15 kali per hari, seperti trader spekulatif yang cemas. Sedangkan Claude hanya melakukan 3 kali, Grok bahkan masih memiliki posisi terbuka. Perbedaan ini tidak bisa dijelaskan oleh prompt, karena mereka menggunakan prompt yang sama.
Dari distribusi untung rugi, kerugian terbesar Deepseek dalam satu kali trading adalah $348, tetapi total keuntungan $2.533. Keuntungan terbesar Gemini dalam satu kali trading adalah $329, tetapi kerugian terbesarnya mencapai $750.
AI yang berbeda (model publik, tanpa fine-tuning kedua), memiliki keseimbangan risiko dan keuntungan yang sepenuhnya berbeda.
Selain itu, kamu dapat melihat riwayat chat dan proses berpikir model yang berbeda di opsi Model Chat di situs web, monolog ini sangat menarik.
Seperti trader manusia yang memiliki gaya berbeda, AI tampaknya juga menunjukkan kepribadian yang berbeda. Trading dan pemikiran Gemini yang sering seperti seseorang dengan ADHD, kehati-hatian Claude seperti manajer dana konservatif, Deepseek stabil seperti veteran kuantitatif, hanya berbicara tentang posisi tanpa penilaian emosional apa pun.
Kepribadian seperti ini tampaknya bukan hasil desain, melainkan muncul secara alami selama pelatihan. Saat menghadapi ketidakpastian, AI yang berbeda cenderung mengambil pendekatan yang berbeda.
Semua AI melihat K-line yang sama, volume transaksi yang sama, kedalaman pasar yang sama. Mereka bahkan menggunakan prompt yang sama. Lalu, apa yang menyebabkan perbedaan sebesar ini?
Peluang pengaruh data pelatihan mungkin menjadi kuncinya.
Phantom Quant di balik Deepseek, selama belasan tahun telah mengumpulkan data dan strategi trading dalam jumlah besar. Data ini meskipun tidak digunakan langsung untuk pelatihan, apakah juga mempengaruhi pemahaman tim tentang "apa itu keputusan trading yang baik"?
Sebaliknya, data pelatihan OpenAI dan Google mungkin lebih condong ke makalah akademik dan teks internet, sehingga pemahaman mereka tentang trading nyata mungkin kurang membumi.
Pada saat yang sama, beberapa trader berspekulasi bahwa Deepseek mungkin secara khusus mengoptimalkan kemampuan prediksi deret waktu selama pelatihan, sementara GPT-5 mungkin lebih unggul dalam pemrosesan bahasa alami. Saat menghadapi grafik harga yang merupakan data terstruktur, arsitektur yang berbeda akan menunjukkan performa yang berbeda.
Saat semua orang fokus pada untung rugi AI, sangat sedikit yang memperhatikan perusahaan misterius di baliknya.
nof1.ai yang membuat perang trading AI ini, tidak terlalu terkenal. Tetapi jika kamu melihat daftar akun yang mereka ikuti di media sosial, kamu masih bisa menemukan beberapa petunjuk.
nof1.ai tampaknya tidak didukung oleh sekelompok pengusaha kripto biasa, melainkan murni peneliti AI dari kalangan akademisi.
Profil pribadi Jay A Zhang (pendiri) juga sangat menarik:
"Big fan of strange loops – cybernetics, RL, biology, markets, meta-learning, reflexivity".
reflexivity (refleksivitas) adalah teori inti Soros: persepsi pelaku pasar mempengaruhi pasar, perubahan pasar juga mempengaruhi persepsi pelaku pasar. Membiarkan seseorang yang meneliti "refleksivitas" melakukan eksperimen pasar trading AI, terasa sangat takdir.
Membiarkan semua orang melihat bagaimana AI berdagang, melihat bagaimana "pengamatan" ini akan mempengaruhi pasar.
Sementara co-founder lainnya, Matthew Siper, dalam profilnya tercantum sebagai kandidat PhD di bidang machine learning di New York University, sekaligus ilmuwan riset AI. Seorang mahasiswa PhD yang belum lulus menjalankan proyek, lebih mirip proyek untuk membuktikan penelitian akademis.
Di antara akun yang diikuti nof1 lainnya, ada juga peneliti Google DeepMind dan profesor NYU yang khusus meneliti AI dan game.
Dari tindakan dan latar belakang mereka, jelas Nof1 bukan sekadar mencari sensasi. Nama platform SharpeBench saja sudah sangat ambisius, rasio Sharpe adalah standar emas untuk mengukur keuntungan setelah disesuaikan risiko, mungkin yang benar-benar ingin mereka lakukan adalah platform benchmark kemampuan trading AI.
Ada yang berspekulasi Nof1 didukung modal besar, ada juga yang mengatakan mereka mungkin sedang mempersiapkan layanan trading AI selanjutnya.
Jika mereka meluncurkan layanan langganan strategi trading Deepseek, mungkin banyak yang akan membeli. Berdasarkan prototipe ini, membuat manajemen aset AI, langganan strategi, dan solusi trading untuk perusahaan besar, juga merupakan bisnis yang bisa diprediksi.
Selain tim ini sendiri, menonton AI berdagang juga menguntungkan.
Alpha Arena baru saja diluncurkan, sudah ada yang mulai copy trading.
Strategi paling sederhana adalah mengikuti Deepseek. Apa yang dia beli, kamu beli, apa yang dia jual, kamu jual. Di kolom komentar juga ada yang melakukan trading berlawanan, khusus menjadi lawan Gemini, Gemini beli dia jual, Gemini jual dia beli.
Tapi copy trading punya masalah: ketika semua orang tahu apa yang akan dibeli Deepseek, apakah strategi ini masih efektif? Inilah yang disebut pendiri proyek Jay Zhang sebagai refleksivitas, yaitu pengamatan itu sendiri akan mengubah objek yang diamati.
Di sini juga ada ilusi demokratisasi strategi trading tingkat atas.
Secara tampak, setiap orang bisa tahu strategi trading AI, tapi sebenarnya yang kamu lihat adalah hasil trading, bukan logika trading. Setiap AI memiliki logika take profit dan stop loss yang tidak selalu berkelanjutan dan dapat diandalkan.
Saat Nof1 menguji perilaku trading AI, investor ritel mencari kunci kekayaan, trader lain mencontek, para peneliti juga mengumpulkan data.
Hanya AI itu sendiri yang tidak tahu sedang ditonton, masih dengan serius mengeksekusi setiap trading. Jika Turing Test klasik adalah tentang "menipu" dan "meniru", maka perang trading Alpha Arena saat ini adalah tentang respons pemain kripto terhadap kemampuan dan hasil AI.
Di pasar kripto yang didominasi hasil ini, AI yang bisa menghasilkan uang mungkin lebih penting daripada AI yang bisa mengobrol.