Gemini 2.5 Pro Bước Tiến Mới Trong Cuộc Đua AI Của Google
Chỉ vài tháng sau khi phát hành các mô hình AI Gemini 2.0 đầu tiên, Google lại tiếp tục nâng cấp. Công ty cho biết Gemini 2.5 Pro Experimental mới là mô hình “thông minh nhất” cho đến nay, cung cấp một cửa sổ ngữ cảnh lớn, đa phương thức và khả năng lập luận. Google chỉ ra một loạt các điểm chuẩn cho thấy Gemini mới đánh bại các mô hình ngôn ngữ lớn (LLM) khác, và thử nghiệm thực tế cũng chứng minh điều đó—Gemini 2.5 Pro là một trong những mô hình AI tạo ấn tượng mạnh nhất hiện nay.
Gemini 2.5, giống như tất cả các mô hình của Google trong tương lai, có khả năng lập luận được tích hợp sẵn. Về cơ bản, AI tự kiểm tra thực tế trong quá trình tạo ra đầu ra. Quá trình này có thể được gọi là “lập luận mô phỏng”, vì không có bằng chứng nào cho thấy nó giống với lập luận của con người. Tuy nhiên, điều này có thể cải thiện đáng kể đầu ra của LLM. Google đặc biệt nhấn mạnh khả năng lập trình “agent” của mô hình như một trong những lợi ích từ quá trình này. Ví dụ, Gemini 2.5 Pro Experimental có thể tạo ra một trò chơi điện tử hoàn chỉnh từ một lời nhắc duy nhất, và kết quả thực nghiệm cho thấy điều này hoạt động với phiên bản mô hình có sẵn công khai.
Google đưa ra nhiều tuyên bố về Gemini 2.5 Pro; nó thông minh hơn, nhận thức ngữ cảnh tốt hơn và có khả năng suy luận vượt trội. Tuy nhiên, việc định lượng những cải tiến này trong các mô hình AI tạo sinh vẫn là một thách thức. Một số lợi thế kỹ thuật rõ ràng có thể kể đến là cửa sổ ngữ cảnh 1 triệu mã thông báo, vượt xa các mô hình cạnh tranh như OpenAI GPT hoặc Anthropic Claude. Điều này cho phép nhập liệu nhiều cuốn sách rất dài vào Gemini 2.5 Pro trong một lời nhắc duy nhất, với đầu ra tối đa là 64.000 mã thông báo. Đây là con số ấn tượng so với các LLM khác.
Google đã chạy Gemini 2.5 Experimental qua nhiều điểm chuẩn, trong đó nó đạt điểm cao hơn so với các hệ thống AI khác. Ví dụ, mô hình này vượt qua o3-mini của OpenAI trong GPQA và AIME 2025, đánh giá mức độ AI trả lời các câu hỏi phức tạp về khoa học và toán học. Nó cũng lập kỷ lục mới trong điểm chuẩn Humanity’s Last Exam, bao gồm 3.000 câu hỏi do các chuyên gia trong lĩnh vực biên soạn. AI mới của Google đạt điểm 18,8% so với 14% của OpenAI.
Không rõ liệu các tiêu chí đo lường khách quan khả năng của AI có thực sự hiệu quả hay không. Đôi khi, đánh giá chủ quan có thể mang lại nhiều thông tin hơn—một cách gọi là “vibemarking”. AI mới của Google đã đứng đầu bảng xếp hạng đấu trường LMSYS Chatbot, một thành tích đáng chú ý. Điều này cho thấy người dùng thường thích đầu ra của Gemini 2.5 Pro Experimental hơn so với OpenAI o3-mini, Grok, DeepSeek và các công cụ khác.
Việc nâng cấp AI lần này tạo ra những cải tiến đáng kể. Khi thử nghiệm các nhiệm vụ phức tạp với Gemini 2.5, kết quả cho thấy AI đã xử lý tốt hơn nhiều so với các mô hình 2.0 trước đó. Các câu hỏi về mã hóa, toán học và khoa học cũng đạt hiệu suất tốt hơn so với các phiên bản trước.
Mô hình chuyên nghiệp mới của Google cũng có tốc độ rất cao. Dù vẫn sử dụng cách thức tạo mã thông báo tuần tự như các mô hình khác, nhưng tốc độ tổng thể nhanh hơn cả các mô hình OpenAI và Anthropic mới nhất. Google tận dụng khả năng tính toán AI mạnh mẽ để tạo ra hiệu ứng tối ưu. Đây cũng là lý do giúp Gemini 2.5 Pro Experimental có cửa sổ ngữ cảnh mạnh mẽ—với kích thước lớn hơn khoảng năm lần so với giới hạn đầu vào của o3-mini. Và đây mới chỉ là bước khởi đầu. Google cho biết cửa sổ ngữ cảnh sẽ sớm được tăng lên 2 triệu mã thông báo.
Mô hình 2.0 Pro của Google từng gây ấn tượng khi ra mắt vài tháng trước, nhưng hiện tại đã được thay thế. Google xác nhận Gemini 2.5 Pro là bản nâng cấp thay thế cho 2.0, có sẵn trên các sản phẩm của Google cho những ai đăng ký Gemini Advanced (20 đô la mỗi tháng). Mô hình mới hiện có sẵn trên ứng dụng di động và web, cũng như trong AI Studio của Google. Nó cũng sẽ sớm xuất hiện trên Vertex AI.
Google chưa công bố giá API cho Gemini 2.5 Pro Experimental, nhưng hiện tại, người dùng vẫn có thể truy cập miễn phí với giới hạn 50 tin nhắn mỗi ngày. Tuy nhiên, điều này sẽ thay đổi trong tương lai. Logan Kilpatrick của Google đã tuyên bố trên X (trước đây là Twitter) rằng Gemini 2.5 Pro Experimental sẽ là mô hình thử nghiệm đầu tiên có giới hạn API và mức giá cao hơn.
THÔNG TIN LIÊN HỆ
SDT: 0977383456
EMAIL: kbtech.technology@gmail.com
WEBSITE : kbtech.com.vn
ĐĂNG KÝ ZALO OA : dangkyzalooa.com