Google cuối cùng cũng tung ra Gemini, Cú sút mạnh nhất của họ vào OpenAI.

Sundar Pichai, CEO of Google, on stage during a presentation at Google I/O in Mountain View, California, on May 10, 2023

Sau nhiều tháng rục rịch, Google bắt đầu triển khai mô hình trí tuệ nhân tạo Generative AI, Gemini.

Mô hình mới, sẽ được ra mắt theo từng giai đoạn, là cơ hội của Google để ngăn chặn câu chuyện rằng họ đã tụt lại so với đối thủ như OpenAI.

Trong khi người dùng sẽ có thể truy cập vào Gemini trong tháng này thì phiên bản tiên tiến nhất của mô hình sẽ không xuất hiện cho đến đầu năm sau.

Gemini có ba phiên bản và sẽ được cung cấp theo từng giai đoạn: Ultra, Pro và Nano. Phiên bản cuối cùng sẽ được thiết kế để chạy trên thiết bị như điện thoại thông minh.

Google sẽ cung cấp phiên bản Pro cho người dùng vào thứ Tư thông qua chatbot Bard, và cung cấp cho khách hàng Cloud trong những ngày sắp tới, nhưng họ cho biết mô hình Ultra – mô hình lớn nhất và kỹ thuật tiên tiến nhất trong ba mô hình – vẫn đang trải qua thử nghiệm nội bộ và sẽ không triển khai cho đến đầu năm 2024.

Google cho biết họ dự định tích hợp Gemini vào các sản phẩm phổ biến nhất của mình theo thời gian. Họ cũng sẽ ra mắt Gemini Ultra cho một phiên bản mới của Bard gọi là Bard Advanced vào năm sau. Sissie Hsiao, Phó Chủ tịch và Quản lý chung của Bard và Assistant của Google, không nói rõ liệu việc sử dụng Bard Advanced có phải trả tiền hay không, nhưng cũng không phủ nhận khả năng này.

Hiện nay, có áp lực lớn đặt lên Google để chứng minh rằng họ vẫn là người dẫn đầu trong ngành công nghiệp trí tuệ nhân tạo với Gemini, một mô hình được huấn luyện đa phương tiện, có nghĩa là nó có thể xử lý nhiều loại dữ liệu như văn bản, hình ảnh, video và âm thanh. Nhưng Google tự hào cho biết Gemini cũng là mô hình “linh hoạt nhất” của họ, có khả năng chạy trên nhiều nguồn từ trung tâm dữ liệu đến điện thoại thông minh.

Trong một cuộc trò chuyện với các phóng viên trong tuần này, các nhà quản lý Google cho biết mô hình Ultra của Gemini là mô hình đầu tiên vượt qua các chuyên gia con người trong MMLU (Massive Multitask Language Understanding), một phép đo kiểm tra trên các chủ đề như toán, lịch sử, luật và đạo đức. Mô hình đạt điểm 90,0%, vượt qua 86,4% của GPT-4 của OpenAI.

Bard is getting its biggest upgrade yet with Gemini Pro

Mọi thứ nghe có vẻ tuyệt vời, nhưng chúng ta vẫn chưa thể thử nghiệm hết khả năng của Gemini ngay lúc này. Google cho biết mô hình Pro vượt trội so với GPT-3.5, nguồn động của phiên bản miễn phí của ChatGPT, và người dùng sẽ có thể thử nghiệm phiên bản được fine-tune tốt hơn cho Bard bắt đầu từ thứ Tư (Google nói: bắt đầu bằng tiếng Anh, và trừ UK). Nhưng khi được hỏi về cách Gemini so sánh với GPT-4 tổng thể, các nhà quản lý từ chối bình luận (tuy nhiên, họ đã đánh giá so sánh giữa Gemini Ultra và GPT-4 ở nhiều lĩnh vực khác nhau và công bố kết quả tại đây: https://blog.google/technology/ai/google-gemini-ai/#performance).

Một cách công khai, Google đã từ chối mọi ý kiến cho rằng họ đã vội vàng theo đuổi đối thủ, nhưng bên trong công ty mọi thứ trông rất khác khi họ đã nhanh chóng triển khai Gemini và đưa trí tuệ nhân tạo vào tất cả các sản phẩm chính của mình.

Đầu năm nay, CEO Sundar Pichai đã sáp nhập đơn vị quý giá DeepMind của Alphabet với nhóm trí tuệ nhân tạo nội bộ của mình (Brain) để nhanh chóng làm Gemini. Nhân viên cũng được thông báo rằng Google sẽ giảm lượng nghiên cứu được công bố để giới hạn đối thủ thương mại hóa ý tưởng của họ, theo báo cáo của BI.

Google tin rằng Gemini có ưu thế so với đối thủ ở điểm mà họ gọi là “suy luận tinh tế,” đó là cách mô hình xử lý thông tin phức tạp qua các loại dữ liệu (media) khác nhau.

Trong một bản demo được trình bày cho báo chí, các nghiên cứu viên của DeepMind đã sử dụng Gemini để lục soát hàng trăm nghìn bài nghiên cứu để trích xuất các loại dữ liệu cụ thể. Google cho biết Gemini có khả năng phân biệt giữa các bài nghiên cứu liên quan đến nghiên cứu và những bài không liên quan. Điều thú vị hơn, họ có thể hiển thị Gemini một biểu đồ với dữ liệu cũ và yêu cầu nó tạo ra phiên bản cập nhật, với dữ liệu mới được vẽ.

Mặc dù Gemini có thể xử lý nhiều loại dữ liệu (media) khác nhau, Eli Collins, Phó Chủ tịch Sản phẩm của DeepMind, nói rằng các mô hình Gemini ban đầu sẽ không thể tạo ra hình ảnh và video, nhưng gợi ý rằng điều này sẽ xuất hiện trong các mô hình khác trong tương lai.

Collins thêm vào đó rằng Google đã nhận thấy một số khả năng “độc đáo” trong Gemini có thể mang lại ưu thế so với các mô hình đối thủ, nhưng không giải thích chi tiết những điều đó có thể là gì.

Gemini đã được huấn luyện trên và sử dụng các bộ vi xử lý tensor (TPUs), và Google đang sử dụng triển khai Gemini để thông báo về Cloud TPU v5p mới và một siêu máy tính trí tuệ nhân tạo mới sẽ được sử dụng để cải thiện quá trình đào tạo và triển khai trí tuệ nhân tạo. Thú vị là, Amin Vahdat, Phó Chủ tịch tại Google Cloud AI, nói rằng Gemini sẽ chạy trên cả GPU và TPU trong tương lai, nhưng không đi sâu vào chi tiết hơn.

Google cho biết họ sẽ cung cấp Gemini Pro cho khách hàng doanh nghiệp thông qua chương trình Vertex AI của mình, và cho những nhà phát triển trong AI Studio, vào ngày 13 tháng 12.

Còn đối với các sản phẩm dành cho người tiêu dùng ngoài Bard, Google sẽ ra mắt Gemini Nano trên điện thoại thông minh Pixel 8 Pro vào thứ Tư, điều này sẽ kích hoạt các tính năng như tóm tắt nội dung của các bản ghi âm.

Google cũng cho biết họ dự định thêm Gemini vào SGE, phiên bản tìm kiếm của họ được cung cấp bởi trí tuệ nhân tạo Generative AI, cũng như Chrome, Duet AI và các sản phẩm khác, trong những tháng tới.

Theo businessinsider.com

0 Lời bình

Bạn cũng có thể đọc thêm:

5+ Mô Hình Mới Ra Mắt Chỉ Trong Một Tuần (Cập Nhật Tháng 5/2025)

Bùng Nổ AI Mã Nguồn Mở: Khám phá loạt mô hình AI mã nguồn mở mới nhất từ Microsoft (Phi-4), Xiaomi (MiMo-7B), Alibaba (Qwen 3), Allen AI (OLMo 2), Moonshot AI (Kimi-Audio). Cập Nhật Nóng: Loạt Mô Hình AI Mã Nguồn Mở Mới Đổ Bộ Trong Tuần Đầu Tháng 5/2025 1. Microsoft...

Các công cụ AI Coding có thể mang lại cho chúng ta ”one-employee unicorn”

Khi các tools và AI agents ngày càng có nhiều chức năng hơn, các billion-dollar startups chỉ với một human employee – hoặc thậm chí không có ai – có thể trở nên khả thi. Kỳ lân công nghệ với 1 nhân viên Sắp tới: Startup trị giá tỷ đô, chỉ với một ngườiTại sao việc...

A2A & MCP – Dream team dành cho các trợ lý AI.

Chào bạn! Chắc hẳn bạn đã nghe nhiều về Trí tuệ nhân tạo (AI), có thể đã dùng các trợ lý AI như Siri hay Google Assistant, hoặc thấy AI đánh bại con người trong các trò chơi phức tạp. Nhưng AI đang ngày càng thông minh và hữu ích hơn. Hãy tưởng tượng bạn không chỉ có...

Xu hướng phát triển Trí tuệ Nhân tạo năm 2025

1. Tóm tắt2. Tình hình AI năm 2025: Tổng quan thị trường và bối cảnh đầu tư3. Các lĩnh vực công nghệ tiên phong: Tiến bộ trong các công nghệ AI cốt lõi4. Tiêu điểm ngành: Các lĩnh vực ứng dụng AI tăng trưởng chính trong năm 20255. Các lực lượng định hình tương lai:...

Danh sách 20 máy chủ MCP bạn nên thử

Trong bối cảnh hỗ trợ AI đang phát triển nhanh chóng, các máy chủ Model Context Protocol (MCP) đã nổi lên như những yếu tố thay đổi cuộc chơi. Những công cụ mạnh mẽ này thu hẹp khoảng cách giữa các mô hình AI như Claude và các tài nguyên bên ngoài - từ hệ thống tệp...

Tiềm năng của thị trường AI Chatbot hỗ trợ dịch vụ khách hàng toàn cầu

Deep Research là một khả năng quan trọng của các AI Chatbot như Grok, Gemini, ChatGPT, Manus, Chúng là các AI Agent giúp thu thập, phân tích và tổng hợp thông tin từ nhiều nguồn để cung cấp những hiểu biết sâu sắc hơn (deep insight) trong chỉ vài phút. Những AI này...

« Mục Cũ hơn

Google cuối cùng cũng tung ra Gemini, Cú sút mạnh nhất của họ vào OpenAI.

0 Lời bình

Bạn cũng có thể đọc thêm:

5+ Mô Hình Mới Ra Mắt Chỉ Trong Một Tuần (Cập Nhật Tháng 5/2025)

Các công cụ AI Coding có thể mang lại cho chúng ta ”one-employee unicorn”

A2A & MCP – Dream team dành cho các trợ lý AI.

Xu hướng phát triển Trí tuệ Nhân tạo năm 2025

Danh sách 20 máy chủ MCP bạn nên thử

Tiềm năng của thị trường AI Chatbot hỗ trợ dịch vụ khách hàng toàn cầu

NLWeb: Microsoft Ra Mắt Công Nghệ Mở Biến Mọi Website Thành Ứng Dụng AI

HỘI DOANH NHÂN HỌ BÙI SÔI NỔI VỚI GIẢI PHÁP AI CHATBOT VÀ ỨNG DỤNG AI TRONG DOANH NGHIỆP

Greg Isenberg: 14+ Xu Hướng AI Đột Phá – Cơ Hội Khởi Nghiệp Chưa Từng Có

5+ Mô Hình Mới Ra Mắt Chỉ Trong Một Tuần (Cập Nhật Tháng 5/2025)

Các công cụ AI Coding có thể mang lại cho chúng ta ”one-employee unicorn”

Tìm hiểu về Giao thức Giao tiếp Agent (ACP) và Sự phát triển của nó từ MCP

Thông tin doanh nghiệp

CÔNG TY CỔ PHẦN CÔNG NGHỆ MITIGA

Tầng 6, 73 Đặng Xuân Bảng, KĐT Bắc Linh Đàm, P. Đại Kim, Q.Hoàng Mai, Hà Nội

0983 082 334

[email protected]

Ứng dụng sức mạnh của trí tuệ nhân tạo giúp doanh nghiệp tiết kiệm chi phí và hỗ trợ khách hàng 24/7.