Anthropic ra mắt mô hình AI ‘Hybrid Reasoning’ đầu tiên trên thế giới

Anthropic ra mắt mô hình AI ‘Hybrid Reasoning’ đầu tiên trên thế giới

Anthropic, một công ty trí tuệ nhân tạo được thành lập bởi những người lưu vong từ OpenAI , đã giới thiệu mô hình AI đầu tiên có thể tạo ra kết quả đầu ra thông thường hoặc một lượng “lý luận” có thể kiểm soát được cần thiết để giải quyết các vấn đề khó khăn hơn.

Anthropic cho biết mô hình lai mới, có tên là Claude 3.7, sẽ giúp người dùng và nhà phát triển dễ dàng giải quyết các vấn đề đòi hỏi sự kết hợp giữa đầu ra theo bản năng và suy nghĩ từng bước. Michael Gerstenhaber, trưởng nhóm sản phẩm, nền tảng AI tại Anthropic cho biết: “Người dùng có nhiều quyền kiểm soát đối với hành vi—thời gian suy nghĩ và có thể trao đổi lý luận và trí thông minh với thời gian và ngân sách”.

Anthropic ra mắt mô hình AI

Claude 3.7 cũng có một “scratchpad” mới cho thấy quá trình suy luận của mô hình. Một tính năng tương tự đã được chứng minh là phổ biến với mô hình AI DeepSeek của Trung Quốc . Nó có thể giúp người dùng hiểu cách mô hình đang xử lý một vấn đề để sửa đổi hoặc tinh chỉnh lời nhắc.

Dianne Penn, trưởng nhóm nghiên cứu sản phẩm tại Anthropic, cho biết scratchpad thậm chí còn hữu ích hơn khi kết hợp với khả năng tăng giảm “lý luận” của mô hình. Ví dụ, nếu mô hình gặp khó khăn trong việc phân tích chính xác một vấn đề, người dùng có thể yêu cầu mô hình dành nhiều thời gian hơn để giải quyết vấn đề đó.

Các công ty AI tiên phong ngày càng tập trung vào việc khiến các mô hình “lý luận” về các vấn đề như một cách để tăng khả năng của chúng và mở rộng tính hữu ích của chúng. OpenAI, công ty đã khởi xướng sự bùng nổ AI hiện tại với ChatGPT, là công ty đầu tiên cung cấp mô hình AI lý luận, được gọi là o1 , vào tháng 9 năm 2024. Kể từ đó, OpenAI đã giới thiệu phiên bản mạnh mẽ hơn có tên là o3 , trong khi đối thủ Google đã phát hành một sản phẩm tương tự cho mô hình Gemini của mình, được gọi là Flash Thinking . Trong cả hai trường hợp, người dùng phải chuyển đổi giữa các mô hình để truy cập vào khả năng lý luận—một điểm khác biệt chính so với Claude 3.7.

Sự khác biệt giữa mô hình thông thường và mô hình lý luận tương tự như hai loại tư duy được nhà kinh tế học đoạt giải Nobel Michael Kahneman mô tả trong cuốn sách Tư duy nhanh và chậm xuất bản năm 2011 của ông : tư duy Hệ thống 1 nhanh và theo bản năng và tư duy Hệ thống 2 chậm hơn, thận trọng hơn.

Loại mô hình giúp ChatGPT khả thi, được gọi là mô hình ngôn ngữ lớn hoặc LLM, tạo ra phản hồi tức thời cho lời nhắc bằng cách truy vấn mạng nơ-ron lớn. Những đầu ra này có thể cực kỳ thông minh và mạch lạc nhưng có thể không trả lời được các câu hỏi đòi hỏi lý luận từng bước, bao gồm cả số học đơn giản.

Anthropic ra mắt mô hình AI

Một LLM có thể bị buộc phải bắt chước lý luận cân nhắc nếu được hướng dẫn đưa ra một kế hoạch mà sau đó phải tuân theo. Tuy nhiên, mẹo này không phải lúc nào cũng đáng tin cậy và các mô hình thường gặp khó khăn khi giải quyết các vấn đề đòi hỏi phải lập kế hoạch cẩn thận và chi tiết. OpenAI, Google và hiện tại là Anthropic đều đang sử dụng một phương pháp học máy được gọi là học tăng cường để khiến các mô hình mới nhất của họ học cách tạo ra lý luận hướng đến câu trả lời đúng. Điều này đòi hỏi phải thu thập thêm dữ liệu đào tạo từ con người về việc giải quyết các vấn đề cụ thể.

Penn cho biết chế độ lý luận của Claude đã nhận được dữ liệu bổ sung về các ứng dụng kinh doanh bao gồm viết và sửa mã, sử dụng máy tính và trả lời các câu hỏi pháp lý phức tạp. Penn cho biết “Những thứ chúng tôi cải thiện là … các chủ đề kỹ thuật hoặc các chủ đề đòi hỏi lý luận dài dòng”. “Những gì chúng tôi nhận được từ khách hàng là rất nhiều sự quan tâm trong việc triển khai các mô hình của chúng tôi vào khối lượng công việc thực tế của họ”.

Anthropic cho biết Claude 3.7 đặc biệt tốt trong việc giải quyết các vấn đề mã hóa đòi hỏi lý luận từng bước, vượt trội hơn o1 của OpenAI trên một số điểm chuẩn như SWE-bench. Công ty hiện đang phát hành một công cụ mới, có tên là Claude Code, được thiết kế riêng cho loại mã hóa hỗ trợ AI này.

Penn cho biết: “Mô hình này đã tốt về mặt mã hóa”. Nhưng “việc suy nghĩ thêm sẽ tốt cho các trường hợp có thể đòi hỏi phải lập kế hoạch rất phức tạp—ví dụ như bạn đang xem xét một cơ sở mã cực lớn cho một công ty”.

 

THÔNG TIN  LIÊN HỆ 

SDT: 0977383456 

EMAIL:    kbtech.technology@gmail.com 

WEBSITE   :   kbtech.com.vn 

ĐĂNG KÝ ZALO OA  : dangkyzalooa.com

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *