Trái ngược hoàn toàn với sự kiện rầm rộ năm ngoái , OpenAI đã tổ chức một hội nghị DevDay khiêm tốn hơn vào thứ Ba, tránh ra mắt các sản phẩm lớn để tập trung vào việc cải tiến từng bước bộ công cụ AI và API hiện có.
Trọng tâm của công ty trong năm nay là trao quyền cho các nhà phát triển và giới thiệu những câu chuyện của cộng đồng, báo hiệu sự thay đổi trong chiến lược khi bối cảnh AI ngày càng cạnh tranh.
Công ty đã tiết lộ bốn cải tiến chính tại sự kiện: Vision Fine-Tuning, Realtime API, Model Distillation và Prompt Caching. Những công cụ mới này làm nổi bật sự thay đổi chiến lược của OpenAI hướng đến việc trao quyền cho hệ sinh thái nhà phát triển của mình thay vì cạnh tranh trực tiếp trong không gian ứng dụng dành cho người dùng cuối.
Bộ nhớ đệm nhanh chóng: Một lợi ích cho ngân sách của nhà phát triển
Một trong những thông báo quan trọng nhất là sự ra mắt của Prompt Caching , một tính năng nhằm mục đích giảm chi phí và độ trễ cho các nhà phát triển.
Hệ thống này tự động áp dụng mức giảm giá 50% cho các mã thông báo đầu vào mà mô hình đã xử lý gần đây, có khả năng tiết kiệm đáng kể cho các ứng dụng thường xuyên sử dụng lại ngữ cảnh.
“Chúng tôi khá bận rộn,” Olivier Godement, giám đốc sản phẩm của OpenAI cho nền tảng này, cho biết tại một cuộc họp báo nhỏ tại trụ sở chính của công ty ở San Francisco để khởi động hội nghị dành cho nhà phát triển. “Chỉ hai năm trước, GPT-3 đã chiến thắng. Bây giờ, chúng tôi đã giảm [những] chi phí đó gần 1000 lần. Tôi đã cố gắng đưa ra một ví dụ về các công nghệ đã giảm chi phí của chúng gần 1000 lần trong hai năm—và tôi không thể đưa ra một ví dụ nào.”
Việc giảm chi phí đáng kể này mang đến cơ hội lớn cho các công ty khởi nghiệp và doanh nghiệp khám phá các ứng dụng mới, vốn trước đây nằm ngoài tầm với do chi phí cao.
Tinh chỉnh tầm nhìn: Một ranh giới mới trong AI trực quan
Một thông báo quan trọng khác là việc giới thiệu tính năng tinh chỉnh thị giác cho GPT-4o , mô hình ngôn ngữ lớn mới nhất của OpenAI. Tính năng này cho phép các nhà phát triển tùy chỉnh khả năng hiểu trực quan của mô hình bằng cả hình ảnh và văn bản.
Bản cập nhật này có ý nghĩa sâu rộng, có khả năng tác động đến các lĩnh vực như xe tự hành, hình ảnh y tế và chức năng tìm kiếm trực quan.
Theo OpenAI, Grab , một công ty giao đồ ăn và gọi xe hàng đầu Đông Nam Á, đã tận dụng công nghệ này để cải thiện dịch vụ lập bản đồ của mình.
Chỉ sử dụng 100 ví dụ, Grab được cho là đã cải thiện được 20 phần trăm độ chính xác của số làn đường và tăng 13 phần trăm khả năng định vị biển báo giới hạn tốc độ.
Ứng dụng thực tế này chứng minh khả năng tinh chỉnh thị giác để cải thiện đáng kể các dịch vụ hỗ trợ AI trên nhiều ngành công nghiệp bằng cách sử dụng các lô dữ liệu đào tạo thị giác nhỏ.
API thời gian thực: Thu hẹp khoảng cách trong AI đàm thoại
OpenAI cũng đã công bố API thời gian thực của mình , hiện đang ở giai đoạn beta công khai. Sản phẩm mới này cho phép các nhà phát triển tạo ra trải nghiệm đa phương thức, độ trễ thấp, đặc biệt là trong các ứng dụng giọng nói thành giọng nói. Điều này có nghĩa là các nhà phát triển có thể bắt đầu thêm điều khiển giọng nói của ChatGPT vào các ứng dụng.
Để minh họa tiềm năng của API, OpenAI đã trình diễn phiên bản cập nhật của Wanderlust , một ứng dụng lập kế hoạch du lịch được giới thiệu tại hội nghị năm ngoái .
Với Realtime API, người dùng có thể nói chuyện trực tiếp với ứng dụng, tham gia vào cuộc trò chuyện tự nhiên để lập kế hoạch cho chuyến đi của mình. Hệ thống thậm chí còn cho phép ngắt lời giữa câu, mô phỏng cuộc đối thoại của con người.
Trong khi lập kế hoạch du lịch chỉ là một ví dụ, Realtime API mở ra nhiều khả năng cho các ứng dụng hỗ trợ giọng nói trong nhiều ngành công nghiệp khác nhau.
Từ dịch vụ khách hàng đến giáo dục và các công cụ trợ năng, các nhà phát triển hiện có một nguồn tài nguyên mới mạnh mẽ để tạo ra những trải nghiệm trực quan và nhạy bén hơn nhờ AI.
“Bất cứ khi nào chúng tôi thiết kế sản phẩm, về cơ bản chúng tôi đều xem xét cả các công ty khởi nghiệp và doanh nghiệp”, Godement giải thích. “Và vì vậy, trong giai đoạn alpha, chúng tôi có một nhóm doanh nghiệp sử dụng API, các mô hình mới của các sản phẩm mới cũng vậy”.
Về cơ bản, Realtime API hợp lý hóa quy trình xây dựng trợ lý giọng nói và các công cụ AI đàm thoại khác, loại bỏ nhu cầu ghép nhiều mô hình lại với nhau để phiên âm, suy luận và chuyển đổi văn bản thành giọng nói.
Những người dùng đầu tiên như Healthify , một ứng dụng hướng dẫn dinh dưỡng và thể dục, và Speak , một nền tảng học ngôn ngữ, đã tích hợp Realtime API vào sản phẩm của họ.
Những triển khai này cho thấy tiềm năng của API trong việc tạo ra trải nghiệm người dùng tự nhiên và hấp dẫn hơn trong nhiều lĩnh vực, từ chăm sóc sức khỏe đến giáo dục.
Cấu trúc giá của Realtime API, mặc dù không hề rẻ ở mức 0,06 đô la cho mỗi phút âm thanh đầu vào và 0,24 đô la cho mỗi phút âm thanh đầu ra, vẫn có thể mang lại giá trị đáng kể cho các nhà phát triển muốn tạo ứng dụng dựa trên giọng nói.
Chưng cất mô hình: Một bước tiến tới AI dễ tiếp cận hơn
Có lẽ thông báo mang tính chuyển đổi nhất là sự ra mắt của Model Distillation. Quy trình làm việc tích hợp này cho phép các nhà phát triển sử dụng đầu ra từ các mô hình tiên tiến như o1-preview và GPT-4o để cải thiện hiệu suất của các mô hình hiệu quả hơn như GPT-4o mini .
Phương pháp này có thể cho phép các công ty nhỏ hơn khai thác các khả năng tương tự như các mô hình tiên tiến mà không phải chịu cùng chi phí tính toán.
Nó giải quyết sự chia rẽ lâu đời trong ngành AI giữa các hệ thống tiên tiến, tốn nhiều tài nguyên và các hệ thống dễ tiếp cận hơn nhưng kém khả năng hơn.
Hãy xem xét một công ty khởi nghiệp công nghệ y tế nhỏ đang phát triển một công cụ chẩn đoán hỗ trợ AI cho các phòng khám nông thôn. Sử dụng Model Distillation, công ty có thể đào tạo một mô hình nhỏ gọn nắm bắt được nhiều khả năng chẩn đoán của các mô hình lớn hơn trong khi chạy trên máy tính xách tay hoặc máy tính bảng tiêu chuẩn.
Điều này có thể mang lại khả năng AI tinh vi cho các môi trường hạn chế về nguồn lực, có khả năng cải thiện kết quả chăm sóc sức khỏe ở những khu vực thiếu thốn.
Sự thay đổi chiến lược của OpenAI: Xây dựng hệ sinh thái AI bền vững
DevDay 2024 của OpenAI đánh dấu bước ngoặt chiến lược của công ty, ưu tiên phát triển hệ sinh thái hơn là ra mắt sản phẩm gây chú ý.
Cách tiếp cận này, mặc dù không mấy thú vị đối với công chúng, nhưng lại cho thấy sự hiểu biết sâu sắc về những thách thức và cơ hội hiện tại của ngành AI.
Sự kiện khiêm tốn năm nay trái ngược hoàn toàn với DevDay 2023, sự kiện đã tạo nên sự phấn khích như trên iPhone với việc ra mắt Cửa hàng GPT và các công cụ tạo GPT tùy chỉnh.
Tuy nhiên, bối cảnh AI đã phát triển nhanh chóng kể từ đó. Các đối thủ cạnh tranh đã có những bước tiến đáng kể và mối quan tâm về tính khả dụng của dữ liệu để đào tạo đã tăng lên. Trọng tâm của OpenAI vào việc tinh chỉnh các công cụ hiện có và trao quyền cho các nhà phát triển dường như là một phản ứng được tính toán trước những thay đổi này. Bằng cách cải thiện hiệu quả và hiệu quả về chi phí của các mô hình của mình, OpenAI đặt mục tiêu duy trì lợi thế cạnh tranh của mình trong khi giải quyết các mối quan tâm về cường độ tài nguyên và tác động đến môi trường .
Khi OpenAI chuyển đổi từ một công ty phá vỡ thị trường sang một nhà cung cấp nền tảng, thành công của công ty sẽ phụ thuộc phần lớn vào khả năng thúc đẩy một hệ sinh thái nhà phát triển thịnh vượng.
Bằng cách cung cấp các công cụ cải tiến, giảm chi phí và tăng cường hỗ trợ, công ty đang đặt nền tảng cho sự tăng trưởng và ổn định lâu dài trong lĩnh vực AI.
Mặc dù tác động tức thời có thể ít thấy rõ, nhưng chiến lược này cuối cùng có thể dẫn đến việc áp dụng AI bền vững và rộng rãi hơn trong nhiều ngành công nghiệp.
THÔNG TIN LIÊN HỆ
SDT: 0977383456
EMAIL: kbtech.technology@gmail.com
WEBSITE : kbtech.com.vn
ĐĂNG KÝ ZALO OA : dangkyzalooa.com