OpenAI trình làng GPT-4o mini, Mô hình nhỏ hơn và rẻ hơn

24/07/2026

OpenAI đã giới thiệu GPT-4o mini vào thứ Năm, mô hình AI nhỏ mới nhất của họ. Công ty cho biết GPT-4o mini, rẻ hơn và nhanh hơn các mô hình AI hàng đầu hiện tại của OpenAI, đang được phát hành cho các nhà phát triển, cũng như thông qua ứng dụng web và di động ChatGPT cho người dùng, bắt đầu từ hôm nay. Người dùng doanh nghiệp sẽ được truy cập vào tuần tới.

Công ty cho biết GPT-4o mini vượt trội hơn các mô hình AI nhỏ hàng đầu trong ngành về các nhiệm vụ suy luận liên quan đến văn bản và thị giác. Khi các mô hình AI nhỏ được cải thiện, chúng trở nên phổ biến hơn đối với các nhà phát triển do tốc độ và hiệu quả chi phí so với các mô hình lớn hơn, chẳng hạn như GPT-4 Omni hoặc Claude 3.5 Sonnet. Chúng là một lựa chọn hữu ích cho các tác vụ đơn giản, khối lượng lớn mà các nhà phát triển có thể liên tục yêu cầu mô hình AI thực hiện.

GPT-4o mini sẽ thay thế GPT-3.5 Turbo trở thành mô hình nhỏ nhất mà OpenAI cung cấp. Công ty tuyên bố mô hình AI mới nhất của họ đạt điểm 82% trên MMLU, một điểm chuẩn để đo lường khả năng suy luận, so với 79% của Gemini 1.5 Flash và 75% của Claude 3 Haiku, theo dữ liệu từ Artificial Analysis. Trên MGSM, đo lường khả năng suy luận toán học, GPT-4o mini đạt điểm 87%, so với 78% của Flash và 72% của Haiku.

Biểu đồ so sánh các mô hình AI nhỏ từ *Artificial Analysis*. Giá ở đây là sự kết hợp của token đầu vào và đầu ra.

Hơn nữa, OpenAI cho biết chi phí vận hành GPT-4o mini tiết kiệm đáng kể so với các mô hình tiên phong trước đó của họ, và rẻ hơn 60% so với GPT-3.5 Turbo. Hiện tại, GPT-4o mini hỗ trợ văn bản và thị giác trong API, và OpenAI cho biết mô hình sẽ hỗ trợ các khả năng về video và âm thanh trong tương lai.

“Để AI được trao quyền cho mọi ngóc ngách trên thế giới, chúng tôi cần phải làm cho các mô hình này có mức giá cả phải chăng hơn nhiều,” Olivier Godement, Giám đốc API Sản phẩm của OpenAI, cho biết trong một cuộc phỏng vấn với TechCrunch. “Tôi nghĩ GPT-4o mini là một bước tiến thực sự to lớn theo hướng đó.”

Đối với các nhà phát triển xây dựng trên API của OpenAI, GPT-4o mini có giá 15 cent cho mỗi triệu token đầu vào và 60 cent cho mỗi triệu token đầu ra. Mô hình có cửa sổ ngữ cảnh 128.000 token, xấp xỉ độ dài của một cuốn sách, và dữ liệu được cập nhật đến tháng 10 năm 2023.

OpenAI không tiết lộ chính xác kích thước của GPT-4o mini, nhưng cho biết nó nằm trong cùng phân cấp với các mô hình AI nhỏ khác, chẳng hạn như Llama 3 8b, Claude Haiku và Gemini 1.5 Flash. Tuy nhiên, công ty tuyên bố GPT-4o mini nhanh hơn, tiết kiệm chi phí hơn và thông minh hơn các mô hình nhỏ hàng đầu trong ngành, dựa trên các bài kiểm tra trước khi ra mắt trong lĩnh vực chatbot LMSYS.org. Các bài kiểm tra độc lập ban đầu dường như xác nhận điều này.

“So với các mô hình tương đương, GPT-4o mini rất nhanh, với tốc độ đầu ra trung bình là 202 token mỗi giây,” George Cameron, Đồng sáng lập tại Artificial Analysis, cho biết trong email gửi TechCrunch. “Điều này nhanh hơn gấp đôi so với GPT-4o và GPT-3.5 Turbo, và là một sản phẩm hấp dẫn cho các trường hợp sử dụng phụ thuộc vào tốc độ, bao gồm nhiều ứng dụng cho người tiêu dùng và các cách tiếp cận đại lý để sử dụng LLM.”

Công cụ mới của OpenAI dành cho ChatGPT Enterprise

Ngoài ra, OpenAI đã công bố các công cụ mới dành cho khách hàng doanh nghiệp vào thứ Năm. Trong một bài đăng trên blog, OpenAI đã công bố Enterprise Compliance API để giúp các doanh nghiệp trong các ngành được quản lý chặt chẽ như tài chính, chăm sóc sức khỏe, dịch vụ pháp lý và chính phủ tuân thủ các yêu cầu về nhật ký và kiểm toán.

Công ty cho biết các công cụ này sẽ cho phép quản trị viên kiểm tra và thực hiện hành động trên dữ liệu ChatGPT Enterprise của họ. API sẽ cung cấp bản ghi các tương tác có dấu thời gian, bao gồm cuộc hội thoại, tệp được tải lên, người dùng không gian làm việc, v.v.

OpenAI cũng cung cấp cho quản trị viên quyền kiểm soát chi tiết hơn đối với GPT trong không gian làm việc, một phiên bản ChatGPT tùy chỉnh được tạo cho các trường hợp sử dụng kinh doanh cụ thể. Trước đây, quản trị viên chỉ có thể cho phép hoặc chặn hoàn toàn các hành động của GPT được tạo trong không gian làm việc của họ, nhưng giờ đây, chủ sở hữu không gian làm việc có thể tạo một danh sách các miền được phê duyệt mà GPT có thể tương tác với.

Theo: https://techcrunch.com/2024/07/18/openai-unveils-gpt-4o-mini-a-small-ai-model-powering-chatgpt/

0 Lời bình

Gửi Lời bình Hủy

Bạn phải đăng nhập để gửi bình luận.

Bạn cũng có thể đọc thêm:

SpaceXAI Ra Mắt Mô hình Grok 4.5

Vừa qua, vào ngày 8 tháng 7 năm 2026, SpaceXAI (nhánh công nghệ AI vừa được tái cấu trúc từ xAI của tỷ phú Elon Musk) đã chính thức kích nổ một "quả bom tấn" trong cộng đồng công nghệ khi công bố thế hệ mô hình ngôn ngữ lớn mới nhất: Grok 4.5. Grok 4.5 được xây dựng...

Ra Mắt Mô hình AI Claude Sonnet 5 Và Khôi Phục Quyền Truy Cập “Siêu Mẫu” Claude Fable 5

Ngày 30/06/2026, Anthropic đã tạo nên một bước ngoặt lớn trong ngành công nghiệp trí tuệ nhân tạo khi chính thức ra mắt Claude Sonnet 5 – mô hình tầm trung với những nâng cấp mạnh mẽ về lập trình và an toàn. Cùng lúc đó, tập đoàn này cũng thông báo khôi phục quyền...

OmniChat – Hợp Nhất Hội Thoại Đa Kênh, Chuyển Lead Thông Minh Cho Doanh Nghiệp

Khách hàng nhắn tin mỗi ngày, nhưng bao nhiêu cơ hội đang bị bỏ lỡ? Doanh nghiệp đầu tư hàng triệu đồng mỗi ngày cho quảng cáo Facebook, Zalo hay các chiến dịch marketing. Khách hàng quan tâm và nhắn tin ngay lập tức. Tuy nhiên, thực tế thường xảy ra: Nhân viên phản...

Toàn Cảnh Thị Trường Bán Lẻ Việt Nam 2026: Làn Sóng Đóng Cửa Hàng Loạt Và Cuộc Đại Dịch Chuyển

Tại sao hàng loạt cửa hàng và shop online Việt Nam đóng cửa? Bản chất không phải do suy thoái sức mua, mà là cuộc đại thanh lọc mô hình kinh doanh. Cửa hàng vật lý đóng cửa do chi phí mặt bằng cao và xu hướng "Showrooming". Shop online truyền thống sập tiệm do mất lợi...

The Economist: AI của Anthropic đã xâm nhập gần như toàn bộ hệ thống mật của NSA chỉ trong vài giờ?

Một thông tin gây chấn động giới công nghệ và an ninh mạng vừa được tiết lộ bởi The Economist. Theo bài viết đăng ngày 14/06/2026, Thượng nghị sĩ Mark Warner, Phó Chủ tịch Ủy ban Tình báo Thượng viện Mỹ, cho biết Giám đốc NSA và Cyber Command, Tướng Joshua Rudd, đã...

Doanh nghiệp đang lãng phí bao nhiêu tiền cho tư vấn bán hàng?

5 dấu hiệu cho thấy bạn cần một Nhân viên số AI Bạn có đang gặp những tình huống sau? Khách hàng nhắn tin ngoài giờ hành chính nhưng không ai trả lời. Nhân viên phải trả lời cùng một câu hỏi hàng chục lần mỗi ngày. Đã từng bỏ sót khách hàng do quá nhiều kênh liên hệ....

« Mục Cũ hơn

OpenAI trình làng GPT-4o mini, Mô hình nhỏ hơn và rẻ hơn

Công cụ mới của OpenAI dành cho ChatGPT Enterprise

0 Lời bình

Gửi Lời bình Hủy

Bạn cũng có thể đọc thêm:

SpaceXAI Ra Mắt Mô hình Grok 4.5

Ra Mắt Mô hình AI Claude Sonnet 5 Và Khôi Phục Quyền Truy Cập “Siêu Mẫu” Claude Fable 5

OmniChat – Hợp Nhất Hội Thoại Đa Kênh, Chuyển Lead Thông Minh Cho Doanh Nghiệp

Toàn Cảnh Thị Trường Bán Lẻ Việt Nam 2026: Làn Sóng Đóng Cửa Hàng Loạt Và Cuộc Đại Dịch Chuyển

The Economist: AI của Anthropic đã xâm nhập gần như toàn bộ hệ thống mật của NSA chỉ trong vài giờ?

Doanh nghiệp đang lãng phí bao nhiêu tiền cho tư vấn bán hàng?

SpaceXAI Ra Mắt Mô hình Grok 4.5

Ra Mắt Mô hình AI Claude Sonnet 5 Và Khôi Phục Quyền Truy Cập “Siêu Mẫu” Claude Fable 5

OmniChat – Hợp Nhất Hội Thoại Đa Kênh, Chuyển Lead Thông Minh Cho Doanh Nghiệp

Toàn Cảnh Thị Trường Bán Lẻ Việt Nam 2026: Làn Sóng Đóng Cửa Hàng Loạt Và Cuộc Đại Dịch Chuyển

The Economist: AI của Anthropic đã xâm nhập gần như toàn bộ hệ thống mật của NSA chỉ trong vài giờ?

Doanh nghiệp đang lãng phí bao nhiêu tiền cho tư vấn bán hàng?

Thông tin doanh nghiệp

CÔNG TY CỔ PHẦN CÔNG NGHỆ MITIGA

VPGD: Tầng 6, 73 Đặng Xuân Bảng, KĐT Bắc Linh Đàm, P. Định Công, TP. Hà Nội

Hotline: 0983 082 334

Ứng dụng sức mạnh của trí tuệ nhân tạo giúp doanh nghiệp tiết kiệm chi phí và hỗ trợ khách hàng 24/7.