Co-Founder Ethereum Vitalik Buterin Mengatakan Info Finance Dapat Mengurangi Risiko karena ChatGPT Jailbreaks Bisa Membocorkan Data

Tata kelola AI dalam kripto adalah seperangkat aturan dan sistem yang mengendalikan pengambilan keputusan otomatis; pendekatan naif dapat dimanipulasi dan menyebabkan kebocoran dana atau data. Vitalik Buterin mengusulkan “info finance” dengan juri manusia, pemeriksaan acak, dan keberagaman model untuk mengurangi manipulasi dan meningkatkan transparansi.

Tata kelola AI yang naif rentan terhadap manipulasi dan jailbreak.
Info finance ditambah juri manusia dan pemeriksaan acak dapat mendeteksi manipulasi sejak dini.
Demo jailbreak ChatGPT menunjukkan bagaimana alat yang terhubung dapat mengekspos data pribadi dalam hitungan menit.

Risiko tata kelola AI mengancam pendanaan kripto dan keamanan data; pelajari bagaimana info finance dan pengawasan juri dapat mengurangi manipulasi — baca langkah-langkah yang dapat diambil sekarang.

Diterbitkan: 13 September 2025

Apa itu risiko tata kelola AI dalam kripto?

Risiko tata kelola AI mengacu pada kegagalan dalam sistem yang memungkinkan alat berbasis AI membuat keputusan keuangan atau tata kelola tanpa pemeriksaan yang memadai. Implementasi naif dapat dimanipulasi melalui jailbreak atau sinyal menipu, memungkinkan alokasi dana yang tidak adil dan paparan data kecuali pengawasan manusia dan insentif yang beragam dibangun di dalamnya.

Bagaimana Vitalik Buterin mengusulkan info finance sebagai alternatif?

Vitalik Buterin merekomendasikan model “info finance” di mana pasar model terbuka dipasangkan dengan juri manusia dan pemeriksaan acak. Pendekatan ini menciptakan persaingan model yang beragam dan menyelaraskan insentif sehingga pembuat model dan spekulan memantau hasil, sehingga lebih mudah mendeteksi goodharting dan taktik manipulasi lainnya.

Bagaimana jailbreak ChatGPT dapat mengekspos data pengguna?

Demonstrasi oleh peneliti keamanan Eito Miyamura menunjukkan bahwa prompt jailbreak sederhana yang disisipkan dalam undangan kalender atau input lain dapat menipu alat yang terhubung dengan ChatGPT untuk mengungkapkan data pribadi. Penyerang hanya membutuhkan data kontekstual dasar (misalnya, alamat email) untuk membuat prompt yang mengarahkan ulang perilaku agen dan mengekstrak informasi sensitif.

Kerentanan apa yang memungkinkan jailbreak ini bekerja?

Alat AI yang terhubung sering kali mengikuti instruksi eksplisit tanpa penyaringan akal sehat. Seperti yang dikatakan Miyamura, “Agen AI seperti ChatGPT mengikuti perintah Anda, bukan akal sehat Anda.” Ketika agen diizinkan membaca kalender, email, atau data pribadi lainnya, prompt jahat dapat memaksa mereka membocorkan konten atau melakukan tindakan atas nama penyerang.

Kapan juri manusia harus campur tangan dalam tata kelola berbasis AI?

Juri manusia harus campur tangan ketika kebenaran dasar, barang publik jangka panjang, atau keputusan pendanaan bernilai tinggi dipertaruhkan. Buterin mencatat bahwa sinyal kebenaran dasar yang tepercaya sangat penting dan bahwa juri yang dibantu oleh LLM dapat mengadili sinyal ambigu atau yang dimanipulasi dengan lebih andal daripada sistem yang sepenuhnya algoritmik.

Perbandingan pendekatan tata kelola Pendekatan Kekuatan Kelemahan

Tata kelola AI naif	Keputusan cepat, biaya rendah	Rentan terhadap manipulasi, jailbreak, hasil tidak transparan
Info finance + juri	Keberagaman, pemeriksaan acak, insentif selaras	Memerlukan koordinasi dan seleksi juri yang tepercaya
Juri manusia saja	Kepercayaan tinggi dan kesadaran konteks	Keterbatasan skalabilitas dan kecepatan

Bagaimana mengurangi risiko tata kelola AI dan paparan data?

Perlindungan praktis memadukan mekanisme pasar, pengawasan manusia, dan batasan teknis pada akses agen ke data pribadi. Berikut adalah langkah-langkah ringkas dan dapat diambil yang dapat diadopsi organisasi sekarang.

Batasi hak istimewa agen: batasi akses data dan minta persetujuan eksplisit untuk tindakan sensitif.
Pemeriksaan acak model: lakukan audit acak dan tinjauan juri manusia atas keputusan otomatis.
Insentif keberagaman: jalankan model yang bersaing di pasar terbuka untuk mengungkap upaya manipulasi.
Perkuat input: sanitasi konten eksternal (undangan kalender, lampiran) sebelum dikonsumsi agen.
Pantau goodharting: lacak sinyal adopsi dan anomali yang mengindikasikan perilaku menipu.

Pertanyaan yang Sering Diajukan

Seberapa mendesak risiko dari jailbreak ChatGPT?

Jailbreak yang dilaporkan menunjukkan risiko langsung: penyerang dapat membuat prompt untuk mengekstrak data dalam hitungan menit jika agen memiliki akses langsung ke akun pengguna. Organisasi harus menganggap ini sebagai ancaman prioritas tinggi dan segera membatasi hak istimewa agen.

Mengapa juri manusia direkomendasikan dibandingkan otomatisasi penuh?

Juri manusia memberikan sinyal kebenaran dasar yang tepercaya dan penilaian kontekstual yang tidak dimiliki LLM. Ketika dibantu oleh LLM untuk efisiensi, juri dapat mengevaluasi kebenaran jangka panjang dan mendeteksi sinyal adopsi palsu yang terlewatkan oleh sistem otomatis.

Poin Penting

Tata kelola AI naif berisiko: Dapat dimanipulasi melalui jailbreak dan insentif menipu.
Info finance adalah alternatif praktis: Pasar model terbuka plus pemeriksaan acak meningkatkan ketahanan.
Tindakan segera: Batasi hak istimewa agen, lakukan audit, dan terapkan juri manusia yang dibantu LLM.

Kesimpulan

Tata kelola AI berada di persimpangan jalan: desain naif mengancam dana dan privasi, sementara kerangka alternatif seperti info finance yang dikombinasikan dengan juri manusia menawarkan pertahanan yang lebih kuat. Para pemangku kepentingan harus menerapkan batasan akses, audit berkelanjutan, dan pasar dengan insentif selaras untuk melindungi tata kelola hari ini dan membangun sistem yang lebih transparan di masa depan.

Jika Anda melewatkannya: Penarikan $205 Juta Galaxy Digital Mungkin Menandakan Akumulasi Institusional, Solana Bisa Melonjak Menuju $300