OpenAI GPT-4o: Trợ lý giọng nói đột phá, các tính năng thị giác mới và mọi thứ bạn cần biết

ChatGPT có mô hình mới, trợ lý giọng nói được nâng cấp và dành nhiều tình cảm hơn cho người dùng miễn phí

OpenAI đã tổ chức sự kiện Spring Update trực tiếp ngày 14/05/2024 và nó đã vượt qua cả dự đoán về “phép thuật”, ra mắt model GPT-4o mới cho cả phiên bản miễn phí và trả phí của ChatGPT, trợ lý giọng nói có âm thanh tự nhiên và mang tính cảm xúc cùng các khả năng về thị giác.

Vẫn còn nhiều bản cập nhật mà OpenAI chưa tiết lộ, bao gồm model GPT-5 thế hệ tiếp theo, có thể sẽ cung cấp năng lượng cho phiên bản trả phí khi ra mắt. Chúng ta cũng chưa có cập nhật về việc phát hành model video AI Sora hoặc Voice Engine.

Tuy nhiên, có quá đủ thứ để khiến khán giả đam mê AI hào hứng trong sự kiện trực tiếp, bao gồm GPT-4o đa phương thức hoàn chỉnh, có thể tiếp nhận và hiểu nội dung giọng nói, hình ảnh và video, phản hồi bằng giọng nói hoặc văn bản.

Dưới đây là một số khoảnh khắc then chốt:

Người dùng ChatGPT miễn phí lần đầu tiên được quyền truy cập vào chatbot tùy chỉnh
Model GPT-4o mới, hiệu quả hơn sẽ cung cấp năng lượng cho các phiên bản miễn phí và trả phí
GPT-4o được thiết kế theo mô hình đa phương thức (multimodal), có khả năng phân tích hình ảnh, video và giọng nói
Model đa phương thức sẽ cung cấp năng lượng cho ChatGPT Voice mới, giống con người hơn Ứng dụng
ChatGPT Desktop ra mắt với các khả năng về giọng nói và thị giác
Mọi thứ dần dần ra mắt trong những tuần tới

https://youtu.be/DQacCB9tDaw

Introducing GPT-4o

https://youtu.be/c2DFg53Zhvw

GPT-4o as a live translation device

0 Lời bình

Bạn cũng có thể đọc thêm:

Vibe coding: AI Claude Code từ ngồi màn hình đến ghế sofa với Remote Control

Bỏ qua cảm giác gò bó tại bàn làm việc! Khám phá cách tính năng Remote Control của Claude Code giúp bạn điều khiển dự án local, duyệt code và giao việc cho AI trực tiếp từ điện thoại. Đã bao giờ bạn chán ngán cảnh còng lưng hàng giờ trước màn hình máy tính chỉ để chờ...

Case Study Spotify: Kỹ sư phần mềm không còn viết code và Siêu Tác Nhân AI tự chủ

Tại sự kiện báo cáo kết quả kinh doanh quý 4 năm 2025, Spotify đã khiến cả giới công nghệ chấn động khi tuyên bố: Những kỹ sư giỏi nhất của họ đã không còn viết một dòng mã thủ công nào từ tháng 12 năm 2025,. Thay vào đó, họ chuyển sang mô hình "Phát triển có giám...

OpenClaw và các biến thể: Đâu là trợ lý AI cá nhân tối ưu nhất?

Hệ sinh thái các trợ lý AI cá nhân đang phát triển mạnh mẽ kể từ khi OpenClaw ra đời, với nhiều biến thể được tối ưu hóa cho các mục đích và phần cứng khác nhau. Dưới đây là bài so sánh chi tiết giữa các công cụ nổi bật: OpenClaw, ZeroClaw, NullClaw, PicoClaw, Nanobot...

GEMINI 3.1 PRO: BƯỚC NHẢY VỌT VỀ TƯ DUY LOGIC VÀ KỶ NGUYÊN AI ĐA PHƯƠNG THỨC

Google vừa chính thức dội một "quả bom" vào thế giới công nghệ khi trình làng Gemini 3.1 Pro. Không chỉ dừng lại ở việc nâng cấp khả năng xử lý hình ảnh, video hay âm thanh, phiên bản 3.1 Pro còn đánh dấu một cột mốc chói lọi về khả năng tư duy (reasoning) – đưa AI...

Google AI Ra Mắt PaperBanana: “Cứu Tinh” Cho Dân Nghiên Cứu Trong Việc Tạo Sơ Đồ & Biểu Đồ Tự Động

Trong khi các nhà khoa học AI có thể dễ dàng xử lý hàng tá thuật toán phức tạp hay viết hàng ngàn dòng code, việc tạo ra các hình minh họa đạt chuẩn xuất bản (publication-ready) vẫn luôn là một "nút thắt cổ chai" tốn kém thời gian. Để giải quyết vấn đề này, Google AI...

Google ra mắt mô hình AI nguồn mở TranslateGemma: Bước tiến mới cho dịch thuật đa ngôn ngữ

Ngày 15 tháng 1 năm 2026 Google chính thức giới thiệu TranslateGemma, một bộ sưu tập các mô hình dịch thuật mở (open translation models) hoàn toàn mới. Điểm đáng chú ý nhất là TranslateGemma được xây dựng dựa trên kiến trúc Gemma 3, mang đến khả năng xóa bỏ rào cản...

« Mục Cũ hơn

Vibe coding: AI Claude Code từ ngồi màn hình đến ghế sofa với Remote Control

Vibe coding: AI Claude Code từ ngồi màn hình đến ghế sofa với Remote Control

Bỏ qua cảm giác gò bó tại bàn làm việc! Khám phá cách tính năng Remote Control của Claude Code giúp bạn điều khiển dự...

Case Study Spotify: Kỹ sư phần mềm không còn viết code và Siêu Tác Nhân AI tự chủ

Case Study Spotify: Kỹ sư phần mềm không còn viết code và Siêu Tác Nhân AI tự chủ

Tại sự kiện báo cáo kết quả kinh doanh quý 4 năm 2025, Spotify đã khiến cả giới công nghệ chấn động khi tuyên bố:...

OpenClaw và các biến thể: Đâu là trợ lý AI cá nhân tối ưu nhất?

OpenClaw và các biến thể: Đâu là trợ lý AI cá nhân tối ưu nhất?

Hệ sinh thái các trợ lý AI cá nhân đang phát triển mạnh mẽ kể từ khi OpenClaw ra đời, với nhiều biến thể được tối ưu...

GEMINI 3.1 PRO: BƯỚC NHẢY VỌT VỀ TƯ DUY LOGIC VÀ KỶ NGUYÊN AI ĐA PHƯƠNG THỨC

GEMINI 3.1 PRO: BƯỚC NHẢY VỌT VỀ TƯ DUY LOGIC VÀ KỶ NGUYÊN AI ĐA PHƯƠNG THỨC

Google vừa chính thức dội một "quả bom" vào thế giới công nghệ khi trình làng Gemini 3.1 Pro. Không chỉ dừng lại ở...

Google AI Ra Mắt PaperBanana: “Cứu Tinh” Cho Dân Nghiên Cứu Trong Việc Tạo Sơ Đồ & Biểu Đồ Tự Động

Google AI Ra Mắt PaperBanana: “Cứu Tinh” Cho Dân Nghiên Cứu Trong Việc Tạo Sơ Đồ & Biểu Đồ Tự Động

Trong khi các nhà khoa học AI có thể dễ dàng xử lý hàng tá thuật toán phức tạp hay viết hàng ngàn dòng code, việc tạo...

Google ra mắt mô hình AI nguồn mở TranslateGemma: Bước tiến mới cho dịch thuật đa ngôn ngữ

Google ra mắt mô hình AI nguồn mở TranslateGemma: Bước tiến mới cho dịch thuật đa ngôn ngữ

Ngày 15 tháng 1 năm 2026 Google chính thức giới thiệu TranslateGemma, một bộ sưu tập các mô hình dịch thuật mở (open...

« Mục Cũ hơn

Liên hệ