Bitget App
Trade smarter
Buka
BerandaDaftar
Bitget>
Berita>
Co-Founder Ethereum Vitalik Buterin Mengatakan Info Finance Dapat Mengurangi Risiko karena ChatGPT Jailbreaks Bisa Membocorkan Data

Co-Founder Ethereum Vitalik Buterin Mengatakan Info Finance Dapat Mengurangi Risiko karena ChatGPT Jailbreaks Bisa Membocorkan Data

Coinotag2025/09/13 14:26
Oleh: Sheila Belson
SOL+0.12%ETH-1.05%RLY0.00%
  • Tata kelola AI yang naif rentan terhadap manipulasi dan jailbreak.

  • Info finance ditambah juri manusia dan pemeriksaan acak dapat mendeteksi manipulasi sejak dini.

  • Demo jailbreak ChatGPT menunjukkan bagaimana alat yang terhubung dapat mengekspos data pribadi dalam hitungan menit.

Risiko tata kelola AI mengancam pendanaan kripto dan keamanan data; pelajari bagaimana info finance dan pengawasan juri dapat mengurangi manipulasi — baca langkah-langkah yang dapat diambil sekarang.




Diterbitkan: 13 September 2025

Apa itu risiko tata kelola AI dalam kripto?

Risiko tata kelola AI mengacu pada kegagalan dalam sistem yang memungkinkan alat berbasis AI membuat keputusan keuangan atau tata kelola tanpa pemeriksaan yang memadai. Implementasi naif dapat dimanipulasi melalui jailbreak atau sinyal menipu, memungkinkan alokasi dana yang tidak adil dan paparan data kecuali pengawasan manusia dan insentif yang beragam dibangun di dalamnya.

Bagaimana Vitalik Buterin mengusulkan info finance sebagai alternatif?

Vitalik Buterin merekomendasikan model “info finance” di mana pasar model terbuka dipasangkan dengan juri manusia dan pemeriksaan acak. Pendekatan ini menciptakan persaingan model yang beragam dan menyelaraskan insentif sehingga pembuat model dan spekulan memantau hasil, sehingga lebih mudah mendeteksi goodharting dan taktik manipulasi lainnya.

Bagaimana jailbreak ChatGPT dapat mengekspos data pengguna?

Demonstrasi oleh peneliti keamanan Eito Miyamura menunjukkan bahwa prompt jailbreak sederhana yang disisipkan dalam undangan kalender atau input lain dapat menipu alat yang terhubung dengan ChatGPT untuk mengungkapkan data pribadi. Penyerang hanya membutuhkan data kontekstual dasar (misalnya, alamat email) untuk membuat prompt yang mengarahkan ulang perilaku agen dan mengekstrak informasi sensitif.

Kerentanan apa yang memungkinkan jailbreak ini bekerja?

Alat AI yang terhubung sering kali mengikuti instruksi eksplisit tanpa penyaringan akal sehat. Seperti yang dikatakan Miyamura, “Agen AI seperti ChatGPT mengikuti perintah Anda, bukan akal sehat Anda.” Ketika agen diizinkan membaca kalender, email, atau data pribadi lainnya, prompt jahat dapat memaksa mereka membocorkan konten atau melakukan tindakan atas nama penyerang.

Kapan juri manusia harus campur tangan dalam tata kelola berbasis AI?

Juri manusia harus campur tangan ketika kebenaran dasar, barang publik jangka panjang, atau keputusan pendanaan bernilai tinggi dipertaruhkan. Buterin mencatat bahwa sinyal kebenaran dasar yang tepercaya sangat penting dan bahwa juri yang dibantu oleh LLM dapat mengadili sinyal ambigu atau yang dimanipulasi dengan lebih andal daripada sistem yang sepenuhnya algoritmik.

Perbandingan pendekatan tata kelola Pendekatan Kekuatan Kelemahan
Tata kelola AI naif Keputusan cepat, biaya rendah Rentan terhadap manipulasi, jailbreak, hasil tidak transparan
Info finance + juri Keberagaman, pemeriksaan acak, insentif selaras Memerlukan koordinasi dan seleksi juri yang tepercaya
Juri manusia saja Kepercayaan tinggi dan kesadaran konteks Keterbatasan skalabilitas dan kecepatan

Bagaimana mengurangi risiko tata kelola AI dan paparan data?

Perlindungan praktis memadukan mekanisme pasar, pengawasan manusia, dan batasan teknis pada akses agen ke data pribadi. Berikut adalah langkah-langkah ringkas dan dapat diambil yang dapat diadopsi organisasi sekarang.

  1. Batasi hak istimewa agen: batasi akses data dan minta persetujuan eksplisit untuk tindakan sensitif.
  2. Pemeriksaan acak model: lakukan audit acak dan tinjauan juri manusia atas keputusan otomatis.
  3. Insentif keberagaman: jalankan model yang bersaing di pasar terbuka untuk mengungkap upaya manipulasi.
  4. Perkuat input: sanitasi konten eksternal (undangan kalender, lampiran) sebelum dikonsumsi agen.
  5. Pantau goodharting: lacak sinyal adopsi dan anomali yang mengindikasikan perilaku menipu.


Pertanyaan yang Sering Diajukan

Seberapa mendesak risiko dari jailbreak ChatGPT?

Jailbreak yang dilaporkan menunjukkan risiko langsung: penyerang dapat membuat prompt untuk mengekstrak data dalam hitungan menit jika agen memiliki akses langsung ke akun pengguna. Organisasi harus menganggap ini sebagai ancaman prioritas tinggi dan segera membatasi hak istimewa agen.

Mengapa juri manusia direkomendasikan dibandingkan otomatisasi penuh?

Juri manusia memberikan sinyal kebenaran dasar yang tepercaya dan penilaian kontekstual yang tidak dimiliki LLM. Ketika dibantu oleh LLM untuk efisiensi, juri dapat mengevaluasi kebenaran jangka panjang dan mendeteksi sinyal adopsi palsu yang terlewatkan oleh sistem otomatis.

Poin Penting

  • Tata kelola AI naif berisiko: Dapat dimanipulasi melalui jailbreak dan insentif menipu.
  • Info finance adalah alternatif praktis: Pasar model terbuka plus pemeriksaan acak meningkatkan ketahanan.
  • Tindakan segera: Batasi hak istimewa agen, lakukan audit, dan terapkan juri manusia yang dibantu LLM.

Kesimpulan

Tata kelola AI berada di persimpangan jalan: desain naif mengancam dana dan privasi, sementara kerangka alternatif seperti info finance yang dikombinasikan dengan juri manusia menawarkan pertahanan yang lebih kuat. Para pemangku kepentingan harus menerapkan batasan akses, audit berkelanjutan, dan pasar dengan insentif selaras untuk melindungi tata kelola hari ini dan membangun sistem yang lebih transparan di masa depan.

Jika Anda melewatkannya: Penarikan $205 Juta Galaxy Digital Mungkin Menandakan Akumulasi Institusional, Solana Bisa Melonjak Menuju $300
Disclaimer: Konten pada artikel ini hanya merefleksikan opini penulis dan tidak mewakili platform ini dengan kapasitas apa pun. Artikel ini tidak dimaksudkan sebagai referensi untuk membuat keputusan investasi.
PoolX: Raih Token Baru
APR hingga 12%. Selalu aktif, selalu dapat airdrop.
Kunci sekarang!

Kamu mungkin juga menyukai

Laporan: Pengembang Ethereum Dibayar Kurang Lebih dari 50%

Meskipun Ethereum telah mengamankan hampir $1 triliun dalam nilai, banyak kontributor utamanya memperoleh gaji kurang dari setengah yang ditawarkan oleh para pesaing.

Cryptopotato2025/09/13 22:21

Berita trending

Lainnya
1
Whale Duduk di Atas Keuntungan $9 Juta Setelah Taruhan Leverage pada BTC & Memecoin
2
Ethiopia Mengubah Tenaga Air Menjadi Penambangan Bitcoin

Harga kripto

Lainnya
Bitcoin
Bitcoin
BTC
$115,930.75
-0.10%
Ethereum
Ethereum
ETH
$4,666.39
-0.33%
XRP
XRP
XRP
$3.12
+0.53%
Tether USDt
Tether USDt
USDT
$1
-0.03%
Solana
Solana
SOL
$242.56
+0.82%
BNB
BNB
BNB
$932.82
+1.00%
USDC
USDC
USDC
$0.9997
-0.02%
Dogecoin
Dogecoin
DOGE
$0.2900
+5.24%
Cardano
Cardano
ADA
$0.9295
+1.67%
TRON
TRON
TRX
$0.3497
-0.59%
Cara menjual PI
Bitget listing PI - Beli atau jual PI dengan cepat di Bitget!
Trading sekarang
Belum menjadi Bitgetter?Paket sambutan senilai 6200 USDT untuk para Bitgetter baru!
Daftar sekarang
Trade smarter