OpenAI đã công bố vào thứ năm rằng họ sẽ ra mắt GPT-4.5, mô hình AI được mong đợi từ lâu có tên mã là Orion . GPT-4.5 là mô hình lớn nhất của OpenAI cho đến nay, được đào tạo bằng nhiều sức mạnh tính toán và dữ liệu hơn bất kỳ bản phát hành nào trước đây của công ty.
Mặc dù có quy mô lớn, OpenAI lưu ý trong sách trắng rằng họ không coi GPT-4.5 là mô hình biên giới.
Những người đăng ký ChatGPT Pro , gói 200 đô la một tháng của OpenAI, sẽ được truy cập vào GPT-4.5 trong ChatGPT bắt đầu từ thứ năm như một phần của bản xem trước nghiên cứu. Các nhà phát triển trên các cấp trả phí của API OpenAI cũng sẽ có thể sử dụng GPT-4.5 bắt đầu từ hôm nay. Đối với những người dùng ChatGPT khác, những khách hàng đã đăng ký ChatGPT Plus và ChatGPT Team sẽ nhận được mô hình vào tuần tới, một phát ngôn viên của OpenAI nói với TechCrunch.
Ngành công nghiệp đã nín thở chờ đợi Orion, một số người coi đây là chỉ báo cho tính khả thi của các phương pháp đào tạo AI truyền thống . GPT-4.5 được phát triển bằng cùng một kỹ thuật chính — tăng đáng kể lượng sức mạnh tính toán và dữ liệu trong giai đoạn “tiền đào tạo” được gọi là học không giám sát — mà OpenAI đã sử dụng để phát triển GPT-4, GPT-3, GPT-2 và GPT-1.
Trong mọi thế hệ GPT trước GPT-4.5, việc mở rộng quy mô dẫn đến những bước nhảy vọt về hiệu suất trên nhiều lĩnh vực, bao gồm toán học, viết và mã hóa. Thật vậy, OpenAI cho biết quy mô tăng lên của GPT-4.5 đã mang lại cho nó “kiến thức sâu sắc hơn về thế giới” và “trí tuệ cảm xúc cao hơn”. Tuy nhiên, có những dấu hiệu cho thấy lợi ích từ việc mở rộng quy mô dữ liệu và điện toán đang bắt đầu đi xuống. Trên một số chuẩn mực AI, GPT-4.5 vẫn chưa bằng các mô hình “lý luận” AI mới hơn từ công ty AI Trung Quốc DeepSeek, Anthropic và chính OpenAI.
GPT-4.5 cũng rất tốn kém để chạy, OpenAI thừa nhận — tốn kém đến mức công ty cho biết họ đang đánh giá xem có nên tiếp tục cung cấp GPT-4.5 trong API của mình trong dài hạn hay không. Để truy cập API của GPT-4.5, OpenAI tính phí các nhà phát triển 75 đô la cho mỗi triệu mã thông báo đầu vào (khoảng 750.000 từ) và 150 đô la cho mỗi triệu mã thông báo đầu ra. So sánh với GPT-4o, chỉ tốn 2,50 đô la cho mỗi triệu mã thông báo đầu vào và 10 đô la cho mỗi triệu mã thông báo đầu ra.
“Chúng tôi đang chia sẻ GPT-4.5 như một bản xem trước nghiên cứu để hiểu rõ hơn về điểm mạnh và hạn chế của nó”, OpenAI cho biết trong một bài đăng trên blog được chia sẻ với TechCrunch. “Chúng tôi vẫn đang khám phá khả năng của nó và rất muốn xem mọi người sử dụng nó theo những cách mà chúng tôi có thể không ngờ tới”.
Hiệu suất hỗn hợp
OpenAI nhấn mạnh rằng GPT-4.5 không phải là sự thay thế tức thời cho GPT-4o , mô hình chủ lực của công ty hỗ trợ hầu hết API và ChatGPT. Mặc dù GPT-4.5 hỗ trợ các tính năng như tải tệp và hình ảnh lên và công cụ canvas của ChatGPT , nhưng hiện tại nó thiếu các khả năng như hỗ trợ chế độ thoại hai chiều thực tế của ChatGPT .
Về mặt tích cực, GPT-4.5 có hiệu suất cao hơn GPT-4o — và nhiều mẫu khác nữa.
Trên chuẩn SimpleQA của OpenAI, thử nghiệm các mô hình AI trên các câu hỏi thực tế, đơn giản, GPT-4.5 vượt trội hơn GPT-4o và các mô hình lý luận của OpenAI, o1 và o3-mini , về độ chính xác. Theo OpenAI, GPT-4.5 ít gây ảo giác hơn hầu hết các mô hình, về mặt lý thuyết có nghĩa là nó ít có khả năng bịa ra điều gì đó .
OpenAI không liệt kê một trong những mô hình lý luận AI hiệu suất cao nhất của mình, nghiên cứu sâu, trên SimpleQA. Một phát ngôn viên của OpenAI nói với TechCrunch rằng họ chưa công khai báo cáo hiệu suất của nghiên cứu sâu trên chuẩn mực này và tuyên bố rằng đó không phải là một phép so sánh có liên quan. Đáng chú ý, mô hình Nghiên cứu sâu của công ty khởi nghiệp AI Perplexity, hoạt động tương tự trên các chuẩn mực khác đối với nghiên cứu sâu của OpenAI, vượt trội hơn GPT-4.5 trong bài kiểm tra độ chính xác thực tế này .
Trong một tập hợp con các vấn đề về mã hóa, chuẩn mực SWE-Bench Verified, GPT-4.5 gần như ngang bằng với hiệu suất của GPT-4o và o3-mini nhưng kém hơn về mặt nghiên cứu chuyên sâu của OpenAI và Claude 3.7 Sonnet của Anthropic . Trong một bài kiểm tra mã hóa khác, chuẩn mực SWE-Lancer của OpenAI, chuẩn mực này đo lường khả năng phát triển các tính năng phần mềm đầy đủ của mô hình AI, GPT-4.5 vượt trội hơn GPT-4o và o3-mini nhưng kém về mặt nghiên cứu chuyên sâu.
Trong một tập hợp con các vấn đề về mã hóa, chuẩn mực SWE-Bench Verified, GPT-4.5 gần như ngang bằng với hiệu suất của GPT-4o và o3-mini nhưng kém hơn về mặt nghiên cứu chuyên sâu của OpenAI và Claude 3.7 Sonnet của Anthropic . Trong một bài kiểm tra mã hóa khác, chuẩn mực SWE-Lancer của OpenAI, chuẩn mực này đo lường khả năng phát triển các tính năng phần mềm đầy đủ của mô hình AI, GPT-4.5 vượt trội hơn GPT-4o và o3-mini nhưng kém về mặt nghiên cứu chuyên sâu.
Trong một thử nghiệm khác, OpenAI đã yêu cầu GPT-4.5 và hai mô hình khác trả lời lời nhắc “Tôi đang trải qua thời gian khó khăn sau khi trượt bài kiểm tra”. GPT-4o và o3-mini đã đưa ra thông tin hữu ích, nhưng phản hồi của GPT-4.5 là phù hợp nhất về mặt xã hội.
“Chúng tôi mong muốn có được bức tranh toàn cảnh hơn về khả năng của GPT-4.5 thông qua bản phát hành này”, OpenAI viết trong bài đăng trên blog, “vì chúng tôi nhận ra rằng các tiêu chuẩn học thuật không phải lúc nào cũng phản ánh tính hữu ích trong thế giới thực”.
Luật mở rộng bị thách thức
OpenAI tuyên bố rằng GPT‐4.5 là “bước tiến mới nhất trong khả năng học không giám sát”. Điều đó có thể đúng, nhưng những hạn chế của mô hình này dường như cũng xác nhận suy đoán từ các chuyên gia rằng “luật mở rộng” đào tạo trước sẽ không còn hiệu quả nữa.
Nhà đồng sáng lập và cựu khoa học gia trưởng của OpenAI, Ilya Sutskever, cho biết vào tháng 12 rằng “chúng tôi đã đạt được dữ liệu đỉnh điểm” và “việc đào tạo trước như chúng ta biết chắc chắn sẽ kết thúc”. Bình luận của ông lặp lại những lo ngại mà các nhà đầu tư, nhà sáng lập và nhà nghiên cứu AI đã chia sẻ với TechCrunch trong một bài viết vào tháng 11 .
Để ứng phó với những rào cản trước khi đào tạo, ngành công nghiệp — bao gồm cả OpenAI — đã áp dụng các mô hình lý luận, mất nhiều thời gian hơn các mô hình không lý luận để thực hiện các nhiệm vụ nhưng có xu hướng nhất quán hơn. Bằng cách tăng lượng thời gian và sức mạnh tính toán mà các mô hình lý luận AI sử dụng để “suy nghĩ” thông qua các vấn đề, các phòng thí nghiệm AI tự tin rằng họ có thể cải thiện đáng kể khả năng của các mô hình.
OpenAI có kế hoạch cuối cùng sẽ kết hợp chuỗi mô hình GPT của mình với chuỗi lý luận “o” của mình, bắt đầu với GPT-5 vào cuối năm nay . GPT-4.5, được cho là cực kỳ tốn kém để đào tạo, bị trì hoãn nhiều lần và không đáp ứng được kỳ vọng nội bộ, có thể không tự mình giành được vương miện chuẩn mực AI. Nhưng OpenAI có thể coi đó là bước đệm hướng tới một thứ gì đó mạnh mẽ hơn nhiều.
Nguồn: techcrunch.com
THÔNG TIN LIÊN HỆ
SDT: 0977383456
EMAIL: kbtech.technology@gmail.com
WEBSITE : kbtech.com.vn
ĐĂNG KÝ ZALO OA : dangkyzalooa.com