OpenAI trình làng GPT-4o mini, Mô hình nhỏ hơn và rẻ hơn

OpenAI đã giới thiệu GPT-4o mini vào thứ Năm, mô hình AI nhỏ mới nhất của họ. Công ty cho biết GPT-4o mini, rẻ hơn và nhanh hơn các mô hình AI hàng đầu hiện tại của OpenAI, đang được phát hành cho các nhà phát triển, cũng như thông qua ứng dụng web và di động ChatGPT cho người dùng, bắt đầu từ hôm nay. Người dùng doanh nghiệp sẽ được truy cập vào tuần tới.

Công ty cho biết GPT-4o mini vượt trội hơn các mô hình AI nhỏ hàng đầu trong ngành về các nhiệm vụ suy luận liên quan đến văn bản và thị giác. Khi các mô hình AI nhỏ được cải thiện, chúng trở nên phổ biến hơn đối với các nhà phát triển do tốc độ và hiệu quả chi phí so với các mô hình lớn hơn, chẳng hạn như GPT-4 Omni hoặc Claude 3.5 Sonnet. Chúng là một lựa chọn hữu ích cho các tác vụ đơn giản, khối lượng lớn mà các nhà phát triển có thể liên tục yêu cầu mô hình AI thực hiện.

GPT-4o mini sẽ thay thế GPT-3.5 Turbo trở thành mô hình nhỏ nhất mà OpenAI cung cấp. Công ty tuyên bố mô hình AI mới nhất của họ đạt điểm 82% trên MMLU, một điểm chuẩn để đo lường khả năng suy luận, so với 79% của Gemini 1.5 Flash và 75% của Claude 3 Haiku, theo dữ liệu từ Artificial Analysis. Trên MGSM, đo lường khả năng suy luận toán học, GPT-4o mini đạt điểm 87%, so với 78% của Flash và 72% của Haiku.

Biểu đồ so sánh các mô hình AI nhỏ từ *Artificial Analysis*. Giá ở đây là sự kết hợp của token đầu vào và đầu ra.

Hơn nữa, OpenAI cho biết chi phí vận hành GPT-4o mini tiết kiệm đáng kể so với các mô hình tiên phong trước đó của họ, và rẻ hơn 60% so với GPT-3.5 Turbo. Hiện tại, GPT-4o mini hỗ trợ văn bản và thị giác trong API, và OpenAI cho biết mô hình sẽ hỗ trợ các khả năng về video và âm thanh trong tương lai.

“Để AI được trao quyền cho mọi ngóc ngách trên thế giới, chúng tôi cần phải làm cho các mô hình này có mức giá cả phải chăng hơn nhiều,” Olivier Godement, Giám đốc API Sản phẩm của OpenAI, cho biết trong một cuộc phỏng vấn với TechCrunch. “Tôi nghĩ GPT-4o mini là một bước tiến thực sự to lớn theo hướng đó.”

Đối với các nhà phát triển xây dựng trên API của OpenAI, GPT-4o mini có giá 15 cent cho mỗi triệu token đầu vào và 60 cent cho mỗi triệu token đầu ra. Mô hình có cửa sổ ngữ cảnh 128.000 token, xấp xỉ độ dài của một cuốn sách, và dữ liệu được cập nhật đến tháng 10 năm 2023.

OpenAI không tiết lộ chính xác kích thước của GPT-4o mini, nhưng cho biết nó nằm trong cùng phân cấp với các mô hình AI nhỏ khác, chẳng hạn như Llama 3 8b, Claude Haiku và Gemini 1.5 Flash. Tuy nhiên, công ty tuyên bố GPT-4o mini nhanh hơn, tiết kiệm chi phí hơn và thông minh hơn các mô hình nhỏ hàng đầu trong ngành, dựa trên các bài kiểm tra trước khi ra mắt trong lĩnh vực chatbot LMSYS.org. Các bài kiểm tra độc lập ban đầu dường như xác nhận điều này.

“So với các mô hình tương đương, GPT-4o mini rất nhanh, với tốc độ đầu ra trung bình là 202 token mỗi giây,” George Cameron, Đồng sáng lập tại Artificial Analysis, cho biết trong email gửi TechCrunch. “Điều này nhanh hơn gấp đôi so với GPT-4o và GPT-3.5 Turbo, và là một sản phẩm hấp dẫn cho các trường hợp sử dụng phụ thuộc vào tốc độ, bao gồm nhiều ứng dụng cho người tiêu dùng và các cách tiếp cận đại lý để sử dụng LLM.”

Công cụ mới của OpenAI dành cho ChatGPT Enterprise

Ngoài ra, OpenAI đã công bố các công cụ mới dành cho khách hàng doanh nghiệp vào thứ Năm. Trong một bài đăng trên blog, OpenAI đã công bố Enterprise Compliance API để giúp các doanh nghiệp trong các ngành được quản lý chặt chẽ như tài chính, chăm sóc sức khỏe, dịch vụ pháp lý và chính phủ tuân thủ các yêu cầu về nhật ký và kiểm toán.

Công ty cho biết các công cụ này sẽ cho phép quản trị viên kiểm tra và thực hiện hành động trên dữ liệu ChatGPT Enterprise của họ. API sẽ cung cấp bản ghi các tương tác có dấu thời gian, bao gồm cuộc hội thoại, tệp được tải lên, người dùng không gian làm việc, v.v.

OpenAI cũng cung cấp cho quản trị viên quyền kiểm soát chi tiết hơn đối với GPT trong không gian làm việc, một phiên bản ChatGPT tùy chỉnh được tạo cho các trường hợp sử dụng kinh doanh cụ thể. Trước đây, quản trị viên chỉ có thể cho phép hoặc chặn hoàn toàn các hành động của GPT được tạo trong không gian làm việc của họ, nhưng giờ đây, chủ sở hữu không gian làm việc có thể tạo một danh sách các miền được phê duyệt mà GPT có thể tương tác với.

Theo: https://techcrunch.com/2024/07/18/openai-unveils-gpt-4o-mini-a-small-ai-model-powering-chatgpt/

0 Lời bình

Gửi Lời bình Hủy

Bạn phải đăng nhập để gửi bình luận.

Bạn cũng có thể đọc thêm:

Vibe coding: AI Claude Code từ ngồi màn hình đến ghế sofa với Remote Control

Bỏ qua cảm giác gò bó tại bàn làm việc! Khám phá cách tính năng Remote Control của Claude Code giúp bạn điều khiển dự án local, duyệt code và giao việc cho AI trực tiếp từ điện thoại. Đã bao giờ bạn chán ngán cảnh còng lưng hàng giờ trước màn hình máy tính chỉ để chờ...

Case Study Spotify: Kỹ sư phần mềm không còn viết code và Siêu Tác Nhân AI tự chủ

Tại sự kiện báo cáo kết quả kinh doanh quý 4 năm 2025, Spotify đã khiến cả giới công nghệ chấn động khi tuyên bố: Những kỹ sư giỏi nhất của họ đã không còn viết một dòng mã thủ công nào từ tháng 12 năm 2025,. Thay vào đó, họ chuyển sang mô hình "Phát triển có giám...

OpenClaw và các biến thể: Đâu là trợ lý AI cá nhân tối ưu nhất?

Hệ sinh thái các trợ lý AI cá nhân đang phát triển mạnh mẽ kể từ khi OpenClaw ra đời, với nhiều biến thể được tối ưu hóa cho các mục đích và phần cứng khác nhau. Dưới đây là bài so sánh chi tiết giữa các công cụ nổi bật: OpenClaw, ZeroClaw, NullClaw, PicoClaw, Nanobot...

GEMINI 3.1 PRO: BƯỚC NHẢY VỌT VỀ TƯ DUY LOGIC VÀ KỶ NGUYÊN AI ĐA PHƯƠNG THỨC

Google vừa chính thức dội một "quả bom" vào thế giới công nghệ khi trình làng Gemini 3.1 Pro. Không chỉ dừng lại ở việc nâng cấp khả năng xử lý hình ảnh, video hay âm thanh, phiên bản 3.1 Pro còn đánh dấu một cột mốc chói lọi về khả năng tư duy (reasoning) – đưa AI...

Google AI Ra Mắt PaperBanana: “Cứu Tinh” Cho Dân Nghiên Cứu Trong Việc Tạo Sơ Đồ & Biểu Đồ Tự Động

Trong khi các nhà khoa học AI có thể dễ dàng xử lý hàng tá thuật toán phức tạp hay viết hàng ngàn dòng code, việc tạo ra các hình minh họa đạt chuẩn xuất bản (publication-ready) vẫn luôn là một "nút thắt cổ chai" tốn kém thời gian. Để giải quyết vấn đề này, Google AI...

Google ra mắt mô hình AI nguồn mở TranslateGemma: Bước tiến mới cho dịch thuật đa ngôn ngữ

Ngày 15 tháng 1 năm 2026 Google chính thức giới thiệu TranslateGemma, một bộ sưu tập các mô hình dịch thuật mở (open translation models) hoàn toàn mới. Điểm đáng chú ý nhất là TranslateGemma được xây dựng dựa trên kiến trúc Gemma 3, mang đến khả năng xóa bỏ rào cản...

« Mục Cũ hơn

OpenAI trình làng GPT-4o mini, Mô hình nhỏ hơn và rẻ hơn

Công cụ mới của OpenAI dành cho ChatGPT Enterprise

0 Lời bình

Gửi Lời bình Hủy

Bạn cũng có thể đọc thêm:

Vibe coding: AI Claude Code từ ngồi màn hình đến ghế sofa với Remote Control

Case Study Spotify: Kỹ sư phần mềm không còn viết code và Siêu Tác Nhân AI tự chủ

OpenClaw và các biến thể: Đâu là trợ lý AI cá nhân tối ưu nhất?

GEMINI 3.1 PRO: BƯỚC NHẢY VỌT VỀ TƯ DUY LOGIC VÀ KỶ NGUYÊN AI ĐA PHƯƠNG THỨC

Google AI Ra Mắt PaperBanana: “Cứu Tinh” Cho Dân Nghiên Cứu Trong Việc Tạo Sơ Đồ & Biểu Đồ Tự Động

Google ra mắt mô hình AI nguồn mở TranslateGemma: Bước tiến mới cho dịch thuật đa ngôn ngữ

Vibe coding: AI Claude Code từ ngồi màn hình đến ghế sofa với Remote Control

Case Study Spotify: Kỹ sư phần mềm không còn viết code và Siêu Tác Nhân AI tự chủ

OpenClaw và các biến thể: Đâu là trợ lý AI cá nhân tối ưu nhất?

GEMINI 3.1 PRO: BƯỚC NHẢY VỌT VỀ TƯ DUY LOGIC VÀ KỶ NGUYÊN AI ĐA PHƯƠNG THỨC

Google AI Ra Mắt PaperBanana: “Cứu Tinh” Cho Dân Nghiên Cứu Trong Việc Tạo Sơ Đồ & Biểu Đồ Tự Động

Google ra mắt mô hình AI nguồn mở TranslateGemma: Bước tiến mới cho dịch thuật đa ngôn ngữ

Thông tin doanh nghiệp

CÔNG TY CỔ PHẦN CÔNG NGHỆ MITIGA

VPGD: Tầng 6, 73 Đặng Xuân Bảng, KĐT Bắc Linh Đàm, P. Định Công, TP. Hà Nội

Hotline: 0983 082 334

Ứng dụng sức mạnh của trí tuệ nhân tạo giúp doanh nghiệp tiết kiệm chi phí và hỗ trợ khách hàng 24/7.