Google đã ra mắt mô hình Gemini đầu tiên vào tháng 12 năm 2023 khi chatbot của họ vẫn còn được gọi là Bard. Kể từ đó, gã khổng lồ tìm kiếm đã dần dần áp dụng tên Gemini cho hầu hết mọi thứ liên quan đến AI.
Chatbot Bard là chatbot đầu tiên bị loại bỏ, trở thành Gemini vào đầu năm nay. Ngay sau đó là Gemini Assistant thay thế phần lớn trợ lý trước đó trên Android. Công ty cũng sử dụng Gemini trong Docs và dành cho nhà phát triển.
Sau cơn sốt ban đầu, mọi thứ có vẻ chậm lại đối với Google. Thay vì một cái tên mới như trước đây, công ty đã tăng gấp đôi Gemini, thêm nó vào ngày càng nhiều sản phẩm và dịch vụ.
Sau đó, vào tháng 12, Google đã phát hành Gemini 2.0 . CEO Sundar Pichai mô tả bản phát hành này là sự khởi đầu của Kỷ nguyên Agent. Đây là nơi các mô hình AI thực hiện các nhiệm vụ thay mặt bạn dựa trên một bộ hướng dẫn ban đầu.
Mô hình Gemini đã được đào tạo không chỉ trên văn bản mà còn là một mô hình đa phương thức có thể xử lý hình ảnh, video, âm thanh và thậm chí là mã máy tính. Điều này tương tự như GPT-4o của OpenAI và kể từ Gemini 2, nó cũng có thể xuất ra các phương thức đó.
Phù hợp với phương thức hoạt động thông thường của Google, phiên bản mới nhất của mô hình này đã được phát triển âm thầm trong những tháng qua và cung cấp một số tính năng mà các sản phẩm được quảng cáo rầm rộ hơn như ChatGPT đã bỏ qua.
Ví dụ, hiện nay có hơn 50.000 biến thể của Gemini trên Hugging Face, bao gồm nhiều ngôn ngữ và cách sử dụng khác nhau.
Thật không may, sự đa dạng này đã tạo ra khá nhiều nhầm lẫn. Đợt ra mắt Gemini mới nhất đã khiến mọi thứ trở nên tồi tệ hơn, vì vậy chúng tôi nghĩ đã đến lúc phải lập một bản đồ rõ ràng về vũ trụ Gemini để mọi thứ dễ hiểu hơn.
Điều đầu tiên cần nhận ra là Google thích kết hợp và kết hợp công nghệ mô hình và ứng dụng, với các biến thể có cùng tên. Khi bạn hiểu rõ điều đó, mọi thứ khác bắt đầu khớp vào vị trí.
Khởi đầu là DeepMind, phòng thí nghiệm AI được ra mắt tại London vào năm 2010. Viên đá nền tảng của toàn bộ ngành công nghiệp AI này đã cung cấp các mô hình AI LaMDA, PaLM và Gato cho thế giới. Gemini là phiên bản mới nhất của gia đình thế hệ này.
Phiên bản 1.0 của mẫu Gemini được ra mắt với ba phiên bản, Ultra, Pro và Nano. Như tên gọi, các mẫu máy có công suất từ cao đến phiên bản nhỏ gọn được thiết kế để chạy trên điện thoại và các thiết bị nhỏ khác.
Lưu ý rằng phần lớn sự nhầm lẫn từ các lần ra mắt sau đó là do cuộc đấu tranh về mặt triết lý của Google giữa mảng kinh doanh tìm kiếm và AI.
Sự cạnh tranh khốc liệt của AI trong tìm kiếm luôn là một thanh kiếm treo lơ lửng trên đầu các công ty và đã góp phần đáng kể vào thái độ “muốn hay không” của công ty đối với việc phát hành các sản phẩm AI.
Gemini 1.5, được phát hành cách đây mười tháng, là một cải tiến gia tăng của mô hình ban đầu, kết hợp công nghệ chuyên gia (MoE), cửa sổ ngữ cảnh một triệu token và kiến trúc mới. Kể từ thời điểm đó, chúng ta đã thấy sự ra mắt của Gemini 1.5 Flash, Gemini 1.5 Pro-002 và Gemini 1.5 Flash-002 – phiên bản sau được phát hành cách đây chỉ ba tháng.
Cùng lúc đó, công ty cũng có một bước đột phá bất ngờ vào lãnh thổ mô hình mở, với việc ra mắt sản phẩm Gemma miễn phí. Các mô hình tham số 2B và 7B này được coi là phản ứng trực tiếp đối với việc Meta phát hành họ mô hình Llama. Gemma 2.0 được phát hành năm tháng sau đó.
Gemini 2.0 ra mắt vào tháng 12 năm 2024 và được coi là mô hình cho kỷ nguyên đại lý. Phiên bản đầu tiên được phát hành là Gemini 2.0 Flash Experimental, một mô hình đa phương thức hiệu suất cao, hỗ trợ sử dụng công cụ như tìm kiếm Google và gọi hàm để tạo mã.
Trong vòng vài tuần, công ty đã tung ra Gemini 2.0 Experimental Advanced, rõ ràng là phiên bản đầy đủ của thế hệ hiện tại. Chúng tôi nói rõ ràng vì tại thời điểm này không ai thực sự chắc chắn về bản đầy đủ và bản mã ban đầu.
Có thể khẳng định chắc chắn rằng Gemini 2.0 Flash Experimental là một mô hình AI có hiệu suất và khả năng cực kỳ mạnh mẽ.
Google vừa là công ty nghiên cứu vừa là công ty sản phẩm. DeepMind và Google AI dẫn đầu nghiên cứu và phát hành các mô hình. Phía bên kia của Google lấy các mô hình đó và đưa chúng vào sản phẩm. Điều này bao gồm phần cứng, phần mềm và dịch vụ.
Trò chuyện với bot Google
Chatbots dẫn đầu về mặt ứng dụng của Google, cũng như nhiều nhà cung cấp mô hình nền tảng khác. Một lần nữa, vì đây là Google, mọi thứ trở nên hơi mơ hồ về tên và chức năng.
Chatbot Gemini. Trước đây được gọi là Bard và hoàn toàn tách biệt với mô hình Gemini. Mười tháng trước, Bard và Duet AI, một sản phẩm khác của Google, đã được sáp nhập với nhau dưới thương hiệu Gemini với việc ra mắt ứng dụng Android.
Sau hành động đó, Gemini Chat hiện đã được tích hợp vào nhiều sản phẩm của Google hơn, bao gồm Android Assistant, trình duyệt Chrome , Google Photos và Google Workspace.
Vào thời điểm viết bài, Gemini Chatbot và Android Assistant cũ được cung cấp dưới dạng tùy chọn kép trên các phiên bản mới nhất của hệ điều hành điện thoại Android. Gemini Live được coi là giải pháp thay thế của Google cho Chế độ giọng nói nâng cao tốc độ cao, độ trễ thấp của OpenAI và dự kiến sẽ triển khai trên điện thoại thông minh Google Pixel trong tương lai gần.
Các sản phẩm
Trong khi Gemini với tư cách là một chatbot có thể nhận được hầu hết các mô hình mới và sự chú ý từ những người đam mê AI, thì hầu hết sự chú ý về AI sẽ đổ dồn vào Gemini trên thiết bị di động.
Tính năng này có hai hình thức, đầu tiên là thông qua ứng dụng Gemini trên iPhone và Android, sau đó là thông qua sự tích hợp sâu vào hệ điều hành Android.
Trên Android, các nhà phát triển thậm chí có thể sử dụng mô hình Gemini Nano trong ứng dụng của riêng họ mà không cần phải sử dụng mô hình đám mây hoặc tốn kém để thực hiện các tác vụ cơ bản.
Sự tích hợp sâu cho phép kích hoạt các chức năng hệ thống từ Gemini, cũng như sử dụng Gemini Live — trợ lý giọng nói AI — để phát bài hát và nhiều chức năng khác.
Thí nghiệm
Việc ra mắt mẫu Gemini mới nhất đã đi kèm với một loạt các bản phát hành hoặc bản xem trước ứng dụng Google lớn liên quan đến mẫu mới. Danh sách này dài và ấn tượng. Một số trong số chúng bao gồm:
Dự án Astra: minh chứng ngoạn mục về sức mạnh của khả năng hiểu biết trực quan dành cho trợ lý AI
Dự án Mariner: một ví dụ tuyệt vời về sức mạnh của AI đa phương thức cho các trường hợp sử dụng trong thế giới thực
NotebookLM: một mô hình mới tuyệt vời cho các ứng dụng nghiên cứu và học tập
Nghiên cứu sâu: công cụ nghiên cứu tác nhân cực kỳ mạnh mẽ với khả năng tìm kiếm sâu và bối cảnh rộng lớn
Ngoài các phiên bản di động và web của Gemini, còn có một số sản phẩm cao cấp và dành cho nhà phát triển. Những sản phẩm này thường cung cấp các mô hình và tính năng tiên tiến nhất như Nghiên cứu sâu trong Gemini Advanced.
Gemini Advanced: Cổng kết nối phức tạp theo hình thức đăng ký của Google tới các sản phẩm AI của mình.
Google Cloud: Thanh toán khi sử dụng để tiếp cận toàn bộ các sản phẩm dành cho doanh nghiệp và người tiêu dùng của Google
AI Studio: Sân chơi AI miễn phí để thử nghiệm và đánh giá phạm vi mô hình AI của Gemini
Vertex AI: Nền tảng phát triển AI được tích hợp như một phần của dịch vụ Google Cloud
Google One: Dịch vụ lưu trữ đám mây theo đăng ký dành cho người tiêu dùng
THÔNG TIN LIÊN HỆ
SDT: 0977383456
EMAIL: kbtech.technology@gmail.com
WEBSITE : kbtech.com.vn
ĐĂNG KÝ ZALO OA : dangkyzalooa.com