Anthropic đã phát hành một phiên bản nâng cấp của mô hình chủ lực của họ, Claude Opus 4.7, vào ngày 16 tháng 4 (theo giờ địa phương). So với mô hình Opus 4.6 trước đó, Opus 4.7 thể hiện “những cải thiện đáng kể” về năng lực kỹ thuật phần mềm nâng cao, đặc biệt trong các tác vụ khó, với độ chặt chẽ và tính nhất quán được nâng cao trong các tác vụ phức tạp chạy lâu và khả năng nhìn được cải thiện. Tuy nhiên, Anthropic đã cố ý làm suy yếu khả năng tấn công-phòng thủ an ninh mạng của mô hình trong quá trình huấn luyện và đưa vào các cơ chế an toàn để tự động phát hiện và chặn các yêu cầu bị cấm hoặc có rủi ro cao.

Hiệu suất và điểm chuẩn

Trong thử nghiệm điểm chuẩn, Opus 4.7 đạt các mức điểm nhìn chung cao hơn so với Opus 4.6 trước đó và mô hình cạnh tranh GPT-5.4. Tuy nhiên, Anthropic nhấn mạnh rằng năng lực tổng thể của Opus 4.7 không tương xứng với mô hình mạnh nhất của công ty, Claude Mythos Preview. Theo Anthropic: “Bằng cách triển khai và vận hành các cơ chế bảo vệ này trong thế giới thực, chúng tôi sẽ tích lũy kinh nghiệm để cuối cùng cho phép phát hành rộng rãi các mô hình cấp Mythos.”

Triển khai và giá cả

Opus 4.7 hiện đã hoạt động trên tất cả các sản phẩm Claude và các giao diện API, được tích hợp với các dịch vụ Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry. Giá vẫn giữ nguyên so với Opus 4.6: $5 cho mỗi một triệu token đầu vào và $25 cho mỗi một triệu token đầu ra.

Thay đổi tiêu thụ token

Hai thay đổi trong Opus 4.7 so với Opus 4.6 sẽ ảnh hưởng đến việc sử dụng token. Thứ nhất, Opus 4.7 sử dụng bộ mã hóa (tokenizer) được cập nhật, cải thiện cách mô hình xử lý văn bản. Tuy nhiên, điều này có nghĩa là các đầu vào giống hệt nhau có thể tiêu thụ nhiều token hơn—khoảng 1 đến 1,35 lần mức tiêu thụ của thế hệ trước.

Thứ hai, Opus 4.7 thực hiện nhiều suy luận hơn ở mức “mức độ suy nghĩ” cao hơn, đặc biệt trong các vòng tiếp theo của các kịch bản dạng tác nhân. Điều này giúp tăng độ tin cậy cho các bài toán phức tạp nhưng tạo ra thêm các token đầu ra.

Gia tăng tiêu thụ token của Opus 4.7. Nguồn: Anthropic

Phân tích thị trường và bối cảnh

Các nhà phân tích mô tả Opus 4.7 là một mô hình “mang tính chuyển tiếp”. Nhà phân tích đầu tư Adam Button cho biết việc phát hành Opus 4.7 củng cố câu chuyện của Anthropic xung quanh các mô hình “siêu phàm” như Mythos và xác nhận sự hoài nghi của thị trường: các mô hình trả phí hiện có công khai về cơ bản là các phiên bản “lite” bị ràng buộc bởi các cơ chế an toàn.

Nền tảng công ty và mốc tài chính

Anthropic, được thành lập năm 2021 bởi các cựu nhân viên OpenAI, phát triển dòng mô hình ngôn ngữ lớn Claude. Vào ngày 6 tháng 4, Anthropic công bố doanh thu hàng năm hóa của họ (ARR) vượt $300 billion, mức tăng đáng kể so với $9 billion vào cuối năm 2025. Công ty đang tích cực theo đuổi một đợt phát hành cổ phiếu lần đầu ra công chúng.

Lo ngại rủi ro an ninh mạng

Các lãnh đạo của Anthropic đã nhiều lần cảnh báo về tác động của AI đối với an ninh mạng. Theo các báo cáo đề ngày 10 tháng 4 (theo giờ địa phương), Bộ trưởng Tài chính Mỹ Yellen và Chủ tịch Cục Dự trữ Liên bang Powell đã tổ chức một cuộc họp khẩn với các lãnh đạo Phố Wall vào ngày 7 tháng 4 để thảo luận về việc mô hình AI Mythos mới nhất của Anthropic có thể làm gia tăng rủi ro an ninh mạng như thế nào. Anthropic đã tuyên bố Mythos không phù hợp để phát hành công khai vì mô hình có thể bị lạm dụng bởi tội phạm mạng và gián điệp. Công ty đang cung cấp quyền truy cập có chọn lọc vào Mythos cho các doanh nghiệp hàng đầu toàn cầu về an ninh mạng và phần mềm.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Được hậu thuẫn bởi OpenAI, 1X khai trương nhà máy 58.000 ft² tại California, nhắm tới 10.000 robot trong năm đầu tiên

Tin tức ngành AI

Theo Bloomberg, 1X Technologies, một startup robot được OpenAI hậu thuẫn và được thành lập tại Na Uy, đã mở một cơ sở sản xuất rộng 58.000 feet vuông tại Hayward, California, với tham vọng trở thành đơn vị dẫn đầu trong việc sản xuất hàng loạt robot hình người dành cho người tiêu dùng. Cơ sở này dự kiến sẽ sản xuất 10.000 robot trong giai đoạn…

GateNews1giờ trước

Nhà Trắng Soạn Thảo Bản Ghi Nhớ Về Chính Sách AI, Chỉ Đạo Các Cơ Quan Mỹ Sử Dụng Nhiều Nhà Cung Cấp AI Khác Nhau Vào Ngày 30 Tháng 4

Tin tức ngành AI

Theo các nguồn được PANews trích dẫn vào ngày 30 tháng 4, các quan chức Nhà Trắng đang soạn thảo một bản ghi nhớ chính sách trí tuệ nhân tạo (AI) toàn diện, trong đó chỉ đạo các cơ quan chính phủ Mỹ áp dụng nhiều nhà cung cấp dịch vụ AI khác nhau và tránh phụ thuộc vào một nhà cung cấp duy nhất. Bản ghi nhớ cũng yêu cầu tất cả các công ty AI được ký hợp đồng

GateNews2giờ trước

Cơ quan Quản lý Không gian mạng Trung Quốc khởi động chiến dịch kéo dài 4 tháng để kiềm chế tình trạng hỗn loạn trong ứng dụng AI vào ngày 30/4

Tin tức ngành AI

Theo CCTV News, Cơ quan Quản lý Không gian mạng Trung Quốc đã khởi động một chiến dịch trên toàn quốc kéo dài bốn tháng vào ngày 30/4 nhằm giải quyết tình trạng hỗn loạn trong các ứng dụng AI. Sáng kiến này, được triển khai qua hai giai đoạn, nhắm tới các vấn đề bao gồm đăng ký mẫu hình bị thiếu, năng lực an toàn và rà soát nền tảng chưa đầy đủ,

GateNews2giờ trước

Forefront Tech hoàn tất định giá IPO $100M , niêm yết trên Nasdaq theo mã FTHAU

Cổ phiếu Tin tức ngành AI

Theo ChainCatcher, công ty đầu tư mục đích đặc biệt Forefront Tech đã hoàn tất định giá IPO 100 triệu USD vào ngày 30 tháng 4 và sẽ niêm yết trên Nasdaq với mã FTHAU. Công ty dự kiến sử dụng số tiền thu được để theo đuổi các cơ hội sáp nhập và mua lại trong blockchain, fintech, trí tuệ nhân tạo trong

GateNews3giờ trước

Claude Code của Anthropic bị tính phí quá mức 200,98 USD do lỗi thanh toán, ban đầu bị từ chối hoàn tiền trước khi được bồi thường đầy đủ

Tin tức ngành AI

Theo giám sát của Beating, một lỗi tính phí trong dịch vụ Claude Code của Anthropic đã khiến một thuê bao Max đạt mức bị tính phí quá 20 lần, tương đương 200,98 USD phí sử dụng phát sinh, trong khi chỉ dùng 13% hạn mức theo tháng của họ. Lỗi được kích hoạt khi lịch sử commit của kho git của người dùng chứa chữ in hoa

GateNews3giờ trước

DeepSeek giới thiệu phương pháp Visual Primitives để nâng cao khả năng suy luận đa phương thức vào ngày 30 tháng 4

Tin tức ngành AI

Theo báo cáo kỹ thuật của DeepSeek, vào ngày 30 tháng 4, công ty đã giới thiệu Visual Primitives, một phương pháp nhúng các đơn vị thị giác cơ bản như điểm và hộp giới hạn vào chuỗi suy luận nhằm giải quyết vấn đề Reference Gap trong các tác vụ đa phương thức. Phương pháp này giúp giảm mức tiêu thụ token hình ảnh

GateNews4giờ trước

Bình luận

0/400

GateUser-72e48736

· 04-20 02:41

Nếu tính chính xác cũng được tăng cường, thì việc xem xét mã/viết kiểm thử đơn/hoàn thiện tài liệu sẽ an toàn hơn, các kỹ sư phần mềm sẽ vui mừng khôn xiết.

Xem bản gốcTrả lời0

StargazingWithAMirroredSphere

· 04-17 09:22

Từ 4.6 đến 4.7 được gọi là "đáng kể", không rõ mức độ cải thiện lớn như thế nào trong việc gỡ lỗi chuỗi dài, tái cấu trúc và phạm vi kiểm thử?

Xem bản gốcTrả lời0

OrangePeelRadio

· 04-17 07:47

Xin một tiêu chuẩn: Liệu có thể tìm hết tất cả các lỗi ẩn trong PR phức tạp một lần không? Đừng chỉ viết các đoạn demo nhỏ.

Xem bản gốcTrả lời0

BlackVelvetBluePeony

· 04-17 07:38

Anthropic này có vẻ đang tiến nhanh, Claude bây giờ ngày càng giống như một "kỹ sư cao cấp" chứ không chỉ là một chatbot.

Xem bản gốcTrả lời0

ReminderOfWavesCrashingAgainst

· 04-17 07:35

Nâng cao năng lực kỹ thuật phần mềm rất quan trọng, nhiệm vụ cấp độ kho mã nguồn mới là chiến trường thực sự.

Xem bản gốcTrả lời0

StargazingUnderTheGlassDome

· 04-17 07:32

4.7 Cuối cùng đã đến, mong đợi thử nghiệm thực tế.

Xem bản gốcTrả lời0

GateUser-5d719aba

· 04-17 07:26

Hy vọng không lại là việc tăng điểm dựa trên bảng xếp hạng, trong các dự án thực tế, khi gặp xung đột phụ thuộc hoặc vấn đề môi trường thì sẽ gặp sự cố.

Xem bản gốcTrả lời0

TheWaveOfRasterization

· 04-17 07:20

Tôi quan tâm hơn đến độ tin cậy của việc gọi công cụ và thay đổi nhiều tệp: liệu có thể duy trì tính nhất quán, không gây ra lỗi ở chỗ này rồi gây lỗi ở chỗ khác.

Xem bản gốcTrả lời0

StrollingOnTheEdgeOfTheDao

· 04-17 07:19

Chờ cộng đồng so sánh hiệu suất SWE của GPT/DeepSeek, đặc biệt là điều hướng kho lớn, định vị vấn đề, tốc độ giao hàng từ đầu đến cuối.

Xem bản gốcTrả lời0

BluePeonyObserver

· 04-17 07:19

4.7 của “tăng cường tính nghiêm ngặt” nghe có vẻ cẩn trọng hơn, có thể sẽ ít bịa đặt API hơn? Điều này quá quan trọng.

Xem bản gốcTrả lời0

Xem thêm