Theo Beating, Prime Intellect đã công bố mã nguồn mở cho general-agent, một môi trường huấn luyện tác nhân tự tiến hóa sử dụng cơ chế tạo nhiệm vụ dạng hai người chơi. Hệ thống tự động tạo ra 4.504 nhiệm vụ và hơn 8.000 công cụ duy nhất bằng cách luân phiên giữa bộ tổng hợp nhiệm vụ và bộ giải, đồng thời phân loại các thách thức thành năm bậc độ khó thông qua chín chiến lược, bao gồm điều kiện ràng buộc, hướng dẫn nhiễu và liên kết chéo giữa các thực thể.
Trong thử nghiệm, việc tinh chỉnh một mô hình tham số 30B trên hơn 4.400 quỹ đạo từ môi trường đã cải thiện độ chính xác gọi công cụ từ 18,9% lên 52,3% trên chuẩn BFCL, cho thấy khả năng tạo ra dữ liệu huấn luyện đã được xác minh theo nghĩa của khung mà không cần dựa vào các bộ dữ liệu tĩnh được gắn nhãn thủ công.