🔥SemiAnalysis Thực tế thử nghiệm: GPT-5.5 trở lại hàng đầu, nhưng SWE-bench Pro bị Opus 4.7 vượt mặt


Cơ quan phân tích bán dẫn và AI SemiAnalysis phát hành đánh giá ngang hàng trợ lý lập trình, bao gồm GPT-5.5, Opus 4.7 và DeepSeek V4.
GPT-5.5 dựa trên mã hiệu "Spud" của mô hình tiền huấn luyện mới, là mô hình lập trình đầu tiên của OpenAI trở lại hàng đầu sau nửa năm, các kỹ sư SemiAnalysis bắt đầu chuyển đổi giữa Codex và Claude Code.
Thực tế thử nghiệm cho thấy phân công: Claude giỏi trong lập kế hoạch dự án mới, Codex mạnh hơn trong sửa lỗi đòi hỏi suy luận cao.
Nhưng bài viết tiết lộ, Ope…
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim