Các mô hình AI hàng đầu tụt lại ở các tác vụ doanh nghiệp thường ngày, Databricks nói rằng các mô hình chuyên biệt nhỏ hơn vượt trội

Tin Gate News, ngày 20 tháng 4 — Các mô hình AI hàng đầu tỏ ra xuất sắc trong việc giải các vấn đề phức tạp như toán Olympic, nhưng lại gặp khó khăn với công việc doanh nghiệp thường nhật, theo David Meyer của Databricks. Một số mô hình có thể sửa một mã số hóa đơn sai thay vì gắn cờ đó là lỗi, trong khi các công cụ lập trình như Claude cũng có thể hoạt động kém hiệu quả trong các tác vụ kỹ thuật dữ liệu.

Khoảng cách này xuất phát từ sự khác biệt cơ bản giữa dữ liệu doanh nghiệp và văn bản công khai trên web được dùng để huấn luyện các mô hình lớn. Dữ liệu doanh nghiệp thường có nhãn cột mơ hồ, nhiều trường trống và các mã được lưu dưới dạng văn bản thuần. Trong một nghiên cứu học thuật, điểm F1 của một mô hình AI—điểm cân bằng giữa độ chính xác và độ thu hồi—giảm từ 0.94 trên dữ liệu công khai xuống 0.07 trên dữ liệu doanh nghiệp cho một tác vụ kỹ thuật dữ liệu. Ngoài ra, các mô hình lớn thường mặc định theo những khuôn mẫu quen thuộc từ quá trình huấn luyện; một số mô hình mặc định sang Structured Query Language (SQL) dù đã nhận được hướng dẫn và tài liệu về ngôn ngữ truy vấn độc quyền của một công ty.

Các mô hình nguồn mở nhỏ được tinh chỉnh bằng học tăng cường có thể xử lý các công việc cụ thể hiệu quả hơn với chi phí huấn luyện thấp hơn đáng kể so với các mô hình tổng quát lớn. Databricks đang xây dựng các tác nhân AI nhỏ cho các quy trình làm việc cụ thể, như KARL, sử dụng học tăng cường cho suy luận nhiều bước với tài liệu của công ty. Ngành đang chuyển từ việc phụ thuộc vào các mô hình khổng lồ sang các kiến trúc lai, trong đó các mô hình nhỏ hiệu quả xử lý khối lượng thường ngày, rồi chỉ nâng cấp lên các hệ thống lớn hơn, tốn kém hơn cho những trường hợp không rõ ràng hoặc phức tạp.

Gần đây Databricks đã mua Quotient AI để giúp các doanh nghiệp lớn chạy các tác nhân AI đáng tin cậy hơn. Cuộc cạnh tranh trong mảng kinh doanh AI hiện tập trung vào việc vận hành toàn bộ vòng đời AI, bao gồm các hệ thống phản hồi để theo dõi lỗi và liên tục cải thiện mô hình theo thời gian, khiến các công cụ đánh giá và tinh chỉnh ngày càng có giá trị sau khi triển khai.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Các Nền Tảng Thương Mại Điện Tử Ấn Độ Ra Mắt Cửa Hàng AI Cho ChatGPT, Perplexity và Gemini

Tin Cổng, ngày 27 tháng 4 — Các nền tảng thương mại điện tử của Ấn Độ Flipkart, BigBasket, Ajio và FirstCry đang xây dựng các cửa hàng AI cho ChatGPT, Perplexity và Google Gemini để hỗ trợ thương mại mang tính tác nhân (agentic commerce), nơi các công cụ AI mua sắm thay mặt người dùng. Công ty quick commerce Swiggy cũng đã xây dựng các bộ kết nối cho ChatGP

GateNews5phút trước

Telegram ra mắt công cụ chatbot AI cho phép tạo mà không cần lập trình, hỗ trợ các mô hình GPT và Llama

Theo báo cáo của Techiexpert vào ngày 27 tháng 4, Telegram đã ra mắt công cụ xây dựng bot AI không cần mã, cho phép người dùng không cần bất kỳ kỹ năng lập trình nào có thể tạo và triển khai bot AI chỉ bằng thao tác bấm chọn. Công cụ mới hỗ trợ nhiều mô hình AI như GPT, Llama và được tích hợp vào Telegram Business.

MarketWhisper49phút trước

Ấn Độ Khởi động Dự án Thành phố AI $650M tại Bengaluru Hướng tới 25.000 Nhà nghiên cứu vào năm 2030

Tin tức Gate, ngày 27 tháng 4 — Ấn Độ đang phát triển một thành phố AI trị giá $650 triệu ở Bengaluru, với cơ sở vật chất diện tích 500.000 feet vuông được thiết kế để trở thành phòng thí nghiệm vật lý đầu tiên trên thế giới cho AI mang tính tác nhân. Dự án cung cấp kết nối 400 Gbps cho bốn nhà cung cấp điện toán đám mây AI lớn và dự kiến để hỗ trợ

GateNews1giờ trước

OpenAI Tuyển Dụng Nhân Tài Hàng Đầu Ngành Phần Mềm Doanh Nghiệp Khi Các Tác Nhân Tuy Tiến Phá Vỡ Ngành

Tin tức Gate News ngày 26 tháng 4 — OpenAI và Anthropic đã tuyển dụng các lãnh đạo cấp cao và kỹ sư chuyên biệt từ các công ty phần mềm doanh nghiệp lớn, bao gồm Salesforce, Snowflake, Datadog và Palantir. Denise Dresser, cựu CEO của Slack thuộc Salesforce, gia nhập OpenAI với vai trò giám đốc doanh thu cấp cao

GateNews12giờ trước

Worxphere Đổi Thương Hiệu JobKorea Với Công Cụ Tuyển Dụng Được Tích Hợp AI

Thông điệp Cổng Tin Tức, ngày 26 tháng 4 — Nền tảng nhân sự của Hàn Quốc Worxphere đã đổi thương hiệu JobKorea khi chuyển từ các bảng tuyển dụng trực tuyến truyền thống sang các giải pháp tuyển dụng dựa trên AI. Công ty đang hợp nhất các dịch vụ, bao gồm JobKorea và Albamon, thành một nền tảng thống nhất bao phủ việc làm lâu dài,

GateNews22giờ trước

Tác nhân AI giờ đã có thể độc lập tái hiện các bài báo học thuật phức tạp: Mollick cho rằng lỗi thường nằm ở phần văn bản gốc của con người chứ không phải AI

Mollick 指 ra rằng chỉ với các phương pháp công khai và dữ liệu là có thể để AI agent tái tạo lại nghiên cứu phức tạp mà không cần có bản thảo bài báo gốc và mã nguồn; nếu quá trình tái hiện không khớp với bài báo gốc thì đa phần là do lỗi xử lý dữ liệu trong chính bài báo hoặc do kết luận bị quá mức, chứ không phải do AI. Claude đầu tiên tái hiện lại bài báo, sau đó GPT‑5 Pro được dùng để xác minh chéo, đa số thành công, chỉ bị cản trở khi gặp vấn đề do dữ liệu quá lớn hoặc replication data. Xu hướng này đã làm giảm đáng kể chi phí nhân lực, khiến việc tái hiện trở thành một kiểm định phổ biến và có thể thực hiện được; đồng thời cũng nêu ra các thách thức về thể chế đối với việc phản biện và quản trị, trong đó các công cụ quản trị của chính phủ hoặc có thể trở thành một vấn đề then chốt.

ChainNewsAbmedia04-26 03:34
Bình luận
0/400
Không có bình luận