Google đã mở mã nguồn công cụ đóng dấu bản quyền cho văn bản do AI tạo ra
Các nhà phát triển hiện có thể sử dụng công cụ đóng dấu văn bản SynthID của Google để phát hiện xem đầu ra văn bản có đến từ mô hình của riêng họ hay không.
Công nghệ đóng dấu văn bản SynthID của Google, một công cụ mà công ty tạo ra để giúp nhận dạng văn bản do AI tạo ra dễ dàng hơn, hiện đã có sẵn dưới dạng mã nguồn mở thông qua Bộ công cụ AI tạo ra có trách nhiệm của Google , công ty đã công bố trên X.
Pushmeet Kohli, phó chủ tịch nghiên cứu tại Google DeepMind, chia sẻ với MIT Technology Review rằng: “Giờ đây, các nhà phát triển AI [tạo sinh] khác sẽ có thể sử dụng công nghệ này để giúp họ phát hiện xem đầu ra văn bản có đến từ [mô hình ngôn ngữ lớn] của riêng họ hay không, giúp nhiều nhà phát triển dễ dàng xây dựng AI một cách có trách nhiệm hơn ” .
Dấu mờ đã trở thành công cụ ngày càng quan trọng khi các mô hình ngôn ngữ lớn được sử dụng để phát tán thông tin sai lệch về chính trị , tạo ra nội dung khiêu dâm không được đồng thuận và cho các mục đích độc hại khác. California đang xem xét việc bắt buộc sử dụng dấu mờ AI, trong khi chính phủ Trung Quốc bắt đầu yêu cầu điều này vào năm ngoái. Tuy nhiên, các công cụ vẫn đang trong quá trình hoàn thiện.
SynthID, được công bố vào tháng 8 năm ngoái , giúp phát hiện đầu ra do AI tạo ra bằng cách thêm hình mờ vô hình vào hình ảnh , âm thanh , video và văn bản khi chúng được tạo ra. Google cho biết phiên bản văn bản của SynthID hoạt động bằng cách làm cho đầu ra văn bản ít có khả năng xảy ra hơn một chút theo cách mà phần mềm có thể phát hiện được nhưng con người thì không:
LLM tạo ra văn bản từng mã thông báo một lần. Các mã thông báo này có thể biểu diễn một ký tự, từ hoặc một phần của cụm từ. Để tạo ra một chuỗi văn bản mạch lạc, mô hình dự đoán mã thông báo có khả năng tạo ra tiếp theo. Những dự đoán này dựa trên các từ trước đó và điểm xác suất được gán cho mỗi mã thông báo tiềm năng.
Ví dụ, với cụm từ “Trái cây nhiệt đới yêu thích của tôi là __.” LLM có thể bắt đầu hoàn thành câu bằng các mã thông báo “xoài”, “vải thiều”, “đu đủ” hoặc “sầu riêng” và mỗi mã thông báo được cung cấp một điểm xác suất. Khi có nhiều mã thông báo khác nhau để lựa chọn, SynthID có thể điều chỉnh điểm xác suất của mỗi mã thông báo dự đoán, trong trường hợp không ảnh hưởng đến chất lượng, độ chính xác và tính sáng tạo của đầu ra.
Quá trình này được lặp lại trong toàn bộ văn bản được tạo ra, do đó một câu có thể chứa mười hoặc nhiều hơn điểm xác suất đã điều chỉnh và một trang có thể chứa hàng trăm. Mẫu điểm cuối cùng cho cả hai lựa chọn từ của mô hình kết hợp với điểm xác suất đã điều chỉnh được coi là hình mờ.
Google tuyên bố hệ thống này, vốn đã được tích hợp vào chatbot Gemini của mình, không làm giảm chất lượng, độ chính xác, tính sáng tạo hoặc tốc độ của văn bản được tạo ra, vốn từ lâu đã là vấn đề với các hệ thống đóng dấu bản quyền. Google cho biết hệ thống này có thể hoạt động trên văn bản ngắn tới ba câu, cũng như văn bản đã được cắt xén, diễn giải hoặc sửa đổi. Nhưng hệ thống này gặp khó khăn với văn bản ngắn, nội dung đã được viết lại hoặc dịch, và thậm chí là phản hồi cho các câu hỏi thực tế.
“SynthID không phải là giải pháp hoàn hảo để xác định nội dung do AI tạo ra”, Google viết trong bài đăng trên blog vào tháng 5. “[Nhưng] nó là nền tảng quan trọng để phát triển các công cụ nhận dạng AI đáng tin cậy hơn và có thể giúp hàng triệu người đưa ra quyết định sáng suốt về cách họ tương tác với nội dung do AI tạo ra”
THÔNG TIN LIÊN HỆ
SDT: 0977383456
EMAIL: kbtech.technology@gmail.com
WEBSITE : kbtech.com.vn
ĐĂNG KÝ ZALO OA : dangkyzalooa.com