OpenAI cho biết mô hình GPT-4o mới nhất của họ có rủi ro ‘trung bình’

Công ty khởi nghiệp đã công bố đánh giá về an toàn.

OpenAI đã phát hành Thẻ hệ thống GPT-4o , một tài liệu nghiên cứu nêu rõ các biện pháp an toàn và đánh giá rủi ro mà công ty khởi nghiệp này đã tiến hành trước khi phát hành mô hình mới nhất.

GPT-4o đã được ra mắt công khai vào tháng 5 năm nay. Trước khi ra mắt, OpenAI đã sử dụng một nhóm red teamer bên ngoài, hoặc các chuyên gia bảo mật đang cố gắng tìm ra điểm yếu trong hệ thống, để tìm ra những rủi ro chính trong mô hình (đây là một hoạt động khá chuẩn). Họ đã xem xét các rủi ro như khả năng GPT-4o sẽ tạo ra các bản sao trái phép giọng nói của ai đó, nội dung khiêu dâm và bạo lực hoặc các đoạn âm thanh có bản quyền được sao chép. Bây giờ, kết quả đang được công bố.

OpenAI cho biết mô hình GPT-4o mới nhất của họ có rủi ro 'trung bình'

Theo khuôn khổ riêng của OpenAI, các nhà nghiên cứu nhận thấy GPT-4o có rủi ro “trung bình”. Mức độ rủi ro chung được lấy từ mức đánh giá rủi ro cao nhất của bốn hạng mục chung: an ninh mạng, mối đe dọa sinh học , thuyết phục và tính tự chủ của mô hình. Tất cả những hạng mục này đều được coi là rủi ro thấp ngoại trừ khả năng thuyết phục, trong đó các nhà nghiên cứu nhận thấy một số mẫu văn bản từ GPT-4o có thể thuyết phục ý kiến ​​của người đọc tốt hơn so với văn bản do con người viết — mặc dù các mẫu của mô hình nhìn chung không thuyết phục hơn.

Người phát ngôn của OpenAI, Lindsay McCallum Rémy, chia sẻ với The Verge rằng thẻ hệ thống bao gồm các đánh giá mức độ sẵn sàng do một nhóm nội bộ tạo ra, cùng với các đơn vị thử nghiệm bên ngoài được liệt kê trên trang web của OpenAI là Model Evaluation and Threat Research (METR) và Apollo Research, cả hai đều xây dựng các đánh giá cho các hệ thống AI.

Đây không phải là thẻ hệ thống đầu tiên OpenAI phát hành; GPT-4 , GPT-4 có thị giác và DALL-E 3 cũng đã được thử nghiệm tương tự và nghiên cứu đã được công bố. Nhưng OpenAI phát hành thẻ hệ thống này vào thời điểm quan trọng. Công ty đã liên tục nhận được những lời chỉ trích về các tiêu chuẩn an toàn của mình , từ chính nhân viên của công ty cho đến các thượng nghị sĩ tiểu bang . Chỉ vài phút trước khi phát hành thẻ hệ thống GPT-4o, The Verge đã đưa tin độc quyền về một bức thư ngỏ từ Thượng nghị sĩ Elizabeth Warren (D-MA) và Đại diện Lori Trahan (D-MA) kêu gọi trả lời về cách OpenAI xử lý những người tố giác và đánh giá an toàn. Bức thư đó nêu ra nhiều vấn đề về an toàn đã được nêu ra công khai, bao gồm cả việc CEO Sam Altman bị loại khỏi công ty vào năm 2023 do những lo ngại của hội đồng quản trị và sự ra đi của một giám đốc điều hành an toàn , người tuyên bố rằng “văn hóa và quy trình an toàn đã phải nhường chỗ cho những sản phẩm sáng bóng”.

OpenAI cho biết mô hình GPT-4o mới nhất của họ có rủi ro 'trung bình'

Hơn nữa, công ty đang phát hành một mô hình đa phương thức có khả năng cao ngay trước cuộc bầu cử tổng thống Hoa Kỳ. Có nguy cơ tiềm ẩn rõ ràng là mô hình vô tình phát tán thông tin sai lệch hoặc bị những kẻ xấu chiếm đoạt — ngay cả khi OpenAI hy vọng nhấn mạnh rằng công ty đang thử nghiệm các tình huống thực tế để ngăn chặn việc sử dụng sai mục đích.

Đã có rất nhiều lời kêu gọi OpenAI minh bạch hơn, không chỉ với dữ liệu đào tạo của mô hình ( có được đào tạo trên YouTube không? ), mà còn với thử nghiệm an toàn của nó. Tại California, nơi OpenAI và nhiều phòng thí nghiệm AI hàng đầu khác đặt trụ sở, Thượng nghị sĩ Scott Wiener đang nỗ lực thông qua một dự luật để quản lý các mô hình ngôn ngữ lớn, bao gồm các hạn chế sẽ buộc các công ty phải chịu trách nhiệm pháp lý nếu AI của họ được sử dụng theo cách có hại. Nếu dự luật đó được thông qua, các mô hình biên giới của OpenAI sẽ phải tuân thủ các đánh giá rủi ro do tiểu bang yêu cầu trước khi cung cấp các mô hình để công chúng sử dụng. Nhưng điều đáng chú ý nhất từ ​​Thẻ hệ thống GPT-4o là, mặc dù có nhóm các nhóm đỏ và người thử nghiệm bên ngoài, phần lớn điều này dựa vào OpenAI để tự đánh giá.

THÔNG TIN  LIÊN HỆ 

SDT: 0977383456 

EMAIL:    kbtech.technology@gmail.com 

WEBSITE   :   kbtech.com.vn 

ĐĂNG KÝ ZALO OA  : dangkyzalooa.com

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *