OpenAI trình làng GPT-4o mini, Mô hình nhỏ hơn và rẻ hơn

OpenAI đã giới thiệu GPT-4o mini vào thứ Năm, mô hình AI nhỏ mới nhất của họ. Công ty cho biết GPT-4o mini, rẻ hơn và nhanh hơn các mô hình AI hàng đầu hiện tại của OpenAI, đang được phát hành cho các nhà phát triển, cũng như thông qua ứng dụng web và di động ChatGPT cho người dùng, bắt đầu từ hôm nay. Người dùng doanh nghiệp sẽ được truy cập vào tuần tới.

Công ty cho biết GPT-4o mini vượt trội hơn các mô hình AI nhỏ hàng đầu trong ngành về các nhiệm vụ suy luận liên quan đến văn bản và thị giác. Khi các mô hình AI nhỏ được cải thiện, chúng trở nên phổ biến hơn đối với các nhà phát triển do tốc độ và hiệu quả chi phí so với các mô hình lớn hơn, chẳng hạn như GPT-4 Omni hoặc Claude 3.5 Sonnet. Chúng là một lựa chọn hữu ích cho các tác vụ đơn giản, khối lượng lớn mà các nhà phát triển có thể liên tục yêu cầu mô hình AI thực hiện.

GPT-4o mini sẽ thay thế GPT-3.5 Turbo trở thành mô hình nhỏ nhất mà OpenAI cung cấp. Công ty tuyên bố mô hình AI mới nhất của họ đạt điểm 82% trên MMLU, một điểm chuẩn để đo lường khả năng suy luận, so với 79% của Gemini 1.5 Flash và 75% của Claude 3 Haiku, theo dữ liệu từ Artificial Analysis. Trên MGSM, đo lường khả năng suy luận toán học, GPT-4o mini đạt điểm 87%, so với 78% của Flash và 72% của Haiku.

Biểu đồ so sánh các mô hình AI nhỏ từ Artificial Analysis. Giá ở đây là sự kết hợp của token đầu vào và đầu ra.

Hơn nữa, OpenAI cho biết chi phí vận hành GPT-4o mini tiết kiệm đáng kể so với các mô hình tiên phong trước đó của họ, và rẻ hơn 60% so với GPT-3.5 Turbo. Hiện tại, GPT-4o mini hỗ trợ văn bản và thị giác trong API, và OpenAI cho biết mô hình sẽ hỗ trợ các khả năng về video và âm thanh trong tương lai.

“Để AI được trao quyền cho mọi ngóc ngách trên thế giới, chúng tôi cần phải làm cho các mô hình này có mức giá cả phải chăng hơn nhiều,” Olivier Godement, Giám đốc API Sản phẩm của OpenAI, cho biết trong một cuộc phỏng vấn với TechCrunch. “Tôi nghĩ GPT-4o mini là một bước tiến thực sự to lớn theo hướng đó.”

Đối với các nhà phát triển xây dựng trên API của OpenAI, GPT-4o mini có giá 15 cent cho mỗi triệu token đầu vào và 60 cent cho mỗi triệu token đầu ra. Mô hình có cửa sổ ngữ cảnh 128.000 token, xấp xỉ độ dài của một cuốn sách, và dữ liệu được cập nhật đến tháng 10 năm 2023.

OpenAI không tiết lộ chính xác kích thước của GPT-4o mini, nhưng cho biết nó nằm trong cùng phân cấp với các mô hình AI nhỏ khác, chẳng hạn như Llama 3 8b, Claude Haiku và Gemini 1.5 Flash. Tuy nhiên, công ty tuyên bố GPT-4o mini nhanh hơn, tiết kiệm chi phí hơn và thông minh hơn các mô hình nhỏ hàng đầu trong ngành, dựa trên các bài kiểm tra trước khi ra mắt trong lĩnh vực chatbot LMSYS.org. Các bài kiểm tra độc lập ban đầu dường như xác nhận điều này.

“So với các mô hình tương đương, GPT-4o mini rất nhanh, với tốc độ đầu ra trung bình là 202 token mỗi giây,” George Cameron, Đồng sáng lập tại Artificial Analysis, cho biết trong email gửi TechCrunch. “Điều này nhanh hơn gấp đôi so với GPT-4o và GPT-3.5 Turbo, và là một sản phẩm hấp dẫn cho các trường hợp sử dụng phụ thuộc vào tốc độ, bao gồm nhiều ứng dụng cho người tiêu dùng và các cách tiếp cận đại lý để sử dụng LLM.”

Công cụ mới của OpenAI dành cho ChatGPT Enterprise

Ngoài ra, OpenAI đã công bố các công cụ mới dành cho khách hàng doanh nghiệp vào thứ Năm. Trong một bài đăng trên blog, OpenAI đã công bố Enterprise Compliance API để giúp các doanh nghiệp trong các ngành được quản lý chặt chẽ như tài chính, chăm sóc sức khỏe, dịch vụ pháp lý và chính phủ tuân thủ các yêu cầu về nhật ký và kiểm toán.

Công ty cho biết các công cụ này sẽ cho phép quản trị viên kiểm tra và thực hiện hành động trên dữ liệu ChatGPT Enterprise của họ. API sẽ cung cấp bản ghi các tương tác có dấu thời gian, bao gồm cuộc hội thoại, tệp được tải lên, người dùng không gian làm việc, v.v.

OpenAI cũng cung cấp cho quản trị viên quyền kiểm soát chi tiết hơn đối với GPT trong không gian làm việc, một phiên bản ChatGPT tùy chỉnh được tạo cho các trường hợp sử dụng kinh doanh cụ thể. Trước đây, quản trị viên chỉ có thể cho phép hoặc chặn hoàn toàn các hành động của GPT được tạo trong không gian làm việc của họ, nhưng giờ đây, chủ sở hữu không gian làm việc có thể tạo một danh sách các miền được phê duyệt mà GPT có thể tương tác với.

Theo: https://techcrunch.com/2024/07/18/openai-unveils-gpt-4o-mini-a-small-ai-model-powering-chatgpt/

0 Lời bình

Gửi Lời bình

Bạn cũng có thể đọc thêm:

(Tia sáng) VIỆT NAM DỰ VÀO A.I. CỦA AI, DỮ LIỆU CỦA AI, LUẬT CHƠI CỦA AI?

----Nguyễn Tiến Dũng----𝐀𝐈 đ𝐮̛𝐨̛̣𝐜 𝐠𝐨̣𝐢 𝐥𝐚̀ 𝐜𝐨̛ 𝐡𝐨̣̂𝐢 𝐯𝐚̀𝐧𝐠 𝐜𝐡𝐨 𝐕𝐢𝐞̣̂𝐭 𝐍𝐚𝐦, 𝐧𝐡𝐮̛𝐧𝐠 𝐧𝐞̂́𝐮 𝐜𝐡𝐢̉ 𝐝𝐮̛̀𝐧𝐠 𝐨̛̉ 𝐠𝐢𝐚 𝐜𝐨̂𝐧𝐠 𝐫𝐞̉ 𝐯𝐚̀ đ𝐢𝐞̂̀𝐮 𝐜𝐡𝐢̉𝐧𝐡 (𝐟𝐢𝐧𝐞-𝐭𝐮𝐧𝐞) 𝐭𝐮̛̀ 𝐦𝐨̂ 𝐡𝐢̀𝐧𝐡 𝐧𝐠𝐨𝐚̣𝐢, 𝐕𝐢𝐞̣̂𝐭 𝐍𝐚𝐦 𝐜𝐨́ 𝐭𝐡𝐞̂̉ 𝐥𝐚̣̆𝐩 𝐥𝐚̣𝐢 đ𝐮́𝐧𝐠 𝐜𝐨𝐧 đ𝐮̛𝐨̛̀𝐧𝐠 𝐜𝐮̃ 𝐜𝐮̉𝐚 𝐜𝐨̂𝐧𝐠 𝐧𝐠𝐡𝐢𝐞̣̂𝐩 𝐡𝐨́𝐚 𝐩𝐡𝐮̣ 𝐭𝐡𝐮𝐨̣̂𝐜....

Năm 2026: AI chuyển mình từ Kỳ vọng sang Thực tiễn

Nếu 2025 là năm AI trải qua một đợt "vibe check" (kiểm chứng thực tế), thì 2026 sẽ là năm công nghệ này đi vào thực tiễn. Trọng tâm đang dịch chuyển: thay vì chạy đua xây dựng các mô hình ngôn ngữ ngày càng lớn, ngành công nghiệp đang tập trung vào công việc khó khăn...

Kỷ Nguyên AI Tự Chủ: Từ Phi Công Đến Kiểm Soát Viên Không Lưu

Chúng ta đang đứng trước một điểm uốn lịch sử của công nghệ. Nếu như năm 2025 được dự báo là năm của sự gián đoạn, thì 2026 sẽ là năm của sự thay đổi căn bản. Chào mừng bạn đến với Kỷ nguyên của AI tự chủ (Autonomous AI) – nơi thế giới không chỉ dừng lại ở việc đặt...

OpenAI Chính Thức Ra Mắt GPT-5.2: “Lời Đáp Trả” Dành Cho Gemini 3 Pro?

Chỉ một thời gian ngắn sau khi cộng đồng công nghệ xôn xao trước sự ra đời của Gemini 3 Pro từ Google, OpenAI đã không để đối thủ độc chiếm "ánh đèn sân khấu" quá lâu. Hôm nay, OpenAI chính thức thông báo phát hành GPT-5.2 trên cả API và ChatGPT.Đây không chỉ là một...

Cục Diện Cuộc Chiến AI 2025: Khi “Báo Động Đỏ” Đảo Chiều – Google Trỗi Dậy, OpenAI Đối Mặt Nghịch Lý Tài Chính

Phân tích bối cảnh AI cuối năm 2025: Trong khi Google Alphabet báo lãi kỷ lục nhờ chiến lược "Tích hợp dọc" và Gemini 3, OpenAI lại đối mặt với khoản lỗ khổng lồ. Liệu dự đoán của Geoffrey Hinton về chiến thắng của gã khổng lồ tìm kiếm có đang trở thành hiện thực? Ba...

Liên hệ