Raindrop Workshop Membantu Agen AI Anda Secara Otomatis Menemukan Bug dan Memperbaikinya dengan Codex (Open Source Gratis)

AI Agen Pengembang Alat Perusahaan Raindrop Minggu Ini Merilis Workshop Debugger Lokal (v0.1.6) yang Membantu Pengembang Melacak Output Token dan Panggilan Alat Secara Real-Time, serta Menggunakan MCP agar Claude Code Otomatis Membaca, Menulis Pengujian, dan Memperbaiki.
(Latar Belakang: Claude yang Suka Salah Saat Menulis Kode? Modifikasi 12 Aturan Andrej Karpathy untuk Mengurangi Tingkat Kesalahan dari 41% Menjadi 3%)
(Tambahan Latar Belakang: Anthropic Meluncurkan “Claude for Small Business”: Menargetkan Usaha Kecil dan Menengah untuk Otomatisasi AI)

AI Agent Anda Baru Saja Menghasilkan Hasil Aneh. Ia Memilih Alat yang Tidak Anda Harapkan, dan Memberikan Respons yang Ambigu Secara Semantik. Anda Membuka Log, Melihat Serangkaian Panggilan API dan Jumlah Token, Tapi Tidak Ada Petunjuk Tentang Keputusan Mana yang Salah.

Raindrop Merilis Alat Open Source Pada 14 Mei, Berusaha Mencegah Situasi Ini Terjadi Lagi: Sebuah Workshop Debugger AI Lokal, Gratis, dan Sepenuhnya Open Source. Membantu Pengembang Melacak Setiap Token Output dan Panggilan Alat Secara Real-Time, dan Menyerahkan Proses Debugging kepada Claude Code atau Codex.

Mengapa Masalah Debugging AI Agent Sangat Sulit?

Debugging Software Tradisional Memiliki Breakpoint, Call Stack Lengkap, dan Jalur Eksekusi yang Pasti. Debugging AI Agent Berbeda. Perilakunya Probabilistik. Input yang Sama Bisa Menghasilkan Jalur yang Sangat Berbeda di Eksekusi yang Berbeda; Keputusan Diambil Melalui Banyak Panggilan LLM yang Terdistribusi, Hampir Tidak Mungkin Dilihat Logikanya Hanya dari Output Akhir.

Inti Masalahnya Adalah: Anda Tidak Mencari “Baris Kode yang Salah”, Tapi “Keputusan Agent yang Tidak Sesuai Ekspektasi dalam Konteks Tertentu, dan Langkah Mana yang Salah”. Masalah Semacam Ini Tidak Bisa Diselesaikan Hanya Dengan Debugger Tradisional.

Solusi yang Ada Biasanya Hanya Ada Dua:

  • Pertama, Platform Monitoring Cloud, Mengirim Trace ke Layanan Pihak Ketiga untuk Analisis Dashboard
  • Kedua, Menyisipkan Log Kustom di Kode

Yang Pertama Tidak Ramah untuk Pengembang yang Khawatir tentang Privasi Data, Sedangkan Yang Kedua Memakan Waktu dan Tenaga, Apalagi Setiap Pembaruan Framework Mengharuskan Pemeliharaan Infrastruktur Logging Baru. Keduanya Juga Memiliki Masalah Bersama: Mereka Memberitahu “Apa yang Terjadi”, Tapi Tidak Membantu “Memperbaikinya”.

Workshop Memilih Jalan Ketiga: Eksekusi Sepenuhnya Lokal, Tidak Mengirim Data ke Server Eksternal, Open Source, Gratis, dan Membuat AI Terlibat Langsung dalam Loop Debugging.

Cara Kerja Workshop

Setelah Diaktifkan, Workshop Menjalankan Antarmuka Visual di Lokal dan Membuka MCP (Model Context Protocol) Server. MCP Adalah “Standar Komunikasi yang Memungkinkan Alat AI Mengakses Kemampuan Eksternal” — Jembatan bagi Claude Code dan Alat Pengkodean AI Lainnya untuk Membaca Data Eksternal.

Dengan SDK yang Didukung, Setiap Node Eksekusi Agent — Setiap Output Token, Panggilan Alat, Cabang Keputusan — Secara Streaming Muncul di localhost:5899 Secara Real-Time, Tanpa Polling dan Tanpa Refresh Manual.

Secara Sederhana, Ini Seperti Membuka Jendela Monitoring di Komputer Anda, Membiarkan Anda Melihat Secara Langsung Apa yang Dilakukan AI Agent, Layaknya Menonton Siaran Langsung.

Fokus Utama Desain Workshop Adalah Mengintegrasikan Claude Code dan Asisten Desain Lain ke Dalam Loop Debugging. Karena Workshop Membuka MCP Server, Claude Code Bisa Membaca Trace Langsung, Menulis Pengujian Eval Berdasarkan Trace Tersebut, Menjalankan Pengujian, Mengamati Assertion yang Gagal, Memperbaiki Kode Agent, dan Menjalankan Ulang — Sampai Semua Pengujian Lulus.

Raindrop Menyebut Loop Ini Sebagai “Loop Eval Perbaikan Diri”. Seluruh Proses Berjalan di Lingkungan Lokal, Claude Code Membaca Trace, Menulis Eval, Melihat Gagal, Memperbaiki Kode, dan Menjalankan Ulang Otomatis Tanpa Intervensi Pengembang.

Workshop Juga Mendukung Fitur Replay: Mengambil Trace dari Lingkungan Produksi dan Menjalankan Ulang di Lokal dengan Kode Asli, untuk Pengujian Regresi. Sangat Berguna Saat Terjadi Kesalahan di Produksi Tapi Tidak Bisa Direproduksi di Lokal, Menghemat Waktu Membuat Ulang Situasi Reproduksi.

CODEX-1,18%
TOKEN1,34%
ANTHROPIC-2,59%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Disematkan