
Google 軟體工程師 Addy Osmani 於 6 月 7 日撰文定義「Loop Engineering」為一种以 sistem otomatis menggantikan metode desain prompt AI agent yang dikerjakan secara manual oleh insinyur, yang terdiri dari lima balok: Automations, Worktrees, Skills, Plugins/Connectors, dan Sub-agents.
Menurut penjelasan Addy Osmani dalam kerangka kerjanya:
Automations (otomatisasi): Tugas yang dipicu berdasarkan jadwal, bertanggung jawab untuk menjalankan otomatis 「Discovery」(penemuan) dan 「Triage」(triase). Osmani menjelaskan bahwa Automations adalah mekanisme inti agar loop menjadi benar-benar berputar, bukan sekadar 「sekali jalan」. Codex app menggunakan Automations pada tiap halaman dan menyediakan instruksi /goal (menjalankan hingga kondisi terpenuhi); Claude Code mencapai fungsi serupa melalui penjadwalan tugas, cron, /loop, /goal, dan GitHub Actions.
Worktrees (pohon kerja): Menggunakan mekanisme git worktree untuk membuat direktori kerja terpisah bagi agent yang berjalan secara paralel, mencegah konflik karena beberapa agent memodifikasi file yang sama secara bersamaan. Codex app menyediakan worktree bawaan untuk setiap thread; Claude Code menyediakan mekanisme isolasi serupa melalui git worktree dan flag --worktree.
Skills (kemampuan): Menuliskan pengetahuan proyek, kebiasaan, dan langkah build ke dokumen eksternal dalam format SKILL.md agar agent tidak perlu menebak ulang konteks proyek setiap kali menjalankan tugas. Dua alat tersebut menggunakan format SKILL.md yang sama; Osmani menjelaskan bahwa deskripsi yang tepat lebih baik daripada uraian yang kabur.
Plugins / Connectors (plugin dan penghubung): Dibangun berdasarkan MCP (Model Context Protocol), sehingga agent dapat mengakses sistem eksternal seperti Issue Tracker, database, endpoint API, dan alat komunikasi. Codex app dan Claude Code sama-sama mendukung MCP; Osmani menegaskan bahwa connector yang sama biasanya bisa langsung digunakan di dua alat tersebut.
Sub-agents (sub-agent): Memisahkan「executing agent」与「validating agent」menjadi peran yang berdiri sendiri, dengan instruksi berbeda bahkan model yang berbeda untuk saling meninjau, sehingga mencegah agent yang sama menilai diri sendiri terlalu longgar. Codex app mendefinisikan di .codex/agents/ dalam format TOML; Claude Code mendefinisikan Task subagents dan agent teams di .claude/agents/.
Osmani mendefinisikan memori eksternal sebagai「apa pun yang hidup di luar satu percakapan dan digunakan untuk mencatat apa yang sudah dikerjakan serta langkah selanjutnya」,misalnya file Markdown atau papan Linear. Alasan perlunya: large language model tidak menyimpan memori di antara setiap eksekusi, sehingga progres harus disimpan di luar, bukan di jendela konteks model.
Dua alat tersebut sama-sama mendukung mekanisme ini:Codex app menghubungkan Linear melalui Markdown atau Connector; Claude Code menghubungkan Linear melalui AGENTS.md, file progres, atau koneksi MCP.
Menurut kerangka Addy Osmani, traditional Prompt Engineering ditulis manual oleh insinyur dan agent berinteraksi dengannya putaran demi putaran; Loop Engineering merancang sistem lengkap yang secara otomatis dipicu oleh Automations, mengisolasi paralel lewat Worktrees, menyediakan pengetahuan melalui Skills, menghubungkan alat melalui Connectors, dan memisahkan eksekusi serta verifikasi lewat Sub-agents—peran insinyur bergeser dari「mengoperasikan agent secara langsung」 menjadi「merancang sistem untuk menjalankan agent」.
Berdasarkan analisis perbandingan Osmani, hingga saat artikel tersebut diterbitkan, kedua alat telah mendukung kelima balok dan mekanisme memori eksternal secara lengkap; perbedaan utamanya ada pada penamaan dan path spesifik: Automations memiliki padanan fungsi, Worktrees semuanya berbasis git worktree, Skills semuanya memakai format SKILL.md, Plugins/Connectors semuanya berbasis MCP, Sub-agents memakai file konfigurasi di bawah direktori .agents/.
Menurut penjelasan Osmani, desain Sub-agents menetapkan「agent yang menulis kode」dan「agent yang meninjau kode」sebagai dua peran independen, yang bisa memakai instruksi berbeda bahkan model yang berbeda. Instruksi /goal pada Claude Code memakai prinsip yang sama: model baru menilai apakah tugas sudah selesai, bukan model yang menjalankan tugas itu menilai sendiri—Osmani menyebut ini sebagai penerapan「yang mengerjakan vs yang memeriksa」 pada kondisi berhenti itu sendiri.
Berita Terkait
Claude Fable 5 menambahkan mekanisme deteksi distilasi, tingkat pemicunya di bawah 5%
Google Mengumumkan Gemini 3.5 Live Translate untuk Terjemahan Suara 70+ Bahasa
Moonshot AI Mengumumkan Desktop Agent Kimi Work dengan Arsitektur Swarm
Inno Holdings mengumumkan kesepakatan AI Hong Kong senilai 3 juta dolar AS, harga saham INHD melonjak 20 kali
Amazon meluncurkan alat desain produk AI, prompt teks menghasilkan desain kaus