OpenAI trình làng GPT-4o mini, Mô hình nhỏ hơn và rẻ hơn

OpenAI đã giới thiệu GPT-4o mini vào thứ Năm, mô hình AI nhỏ mới nhất của họ. Công ty cho biết GPT-4o mini, rẻ hơn và nhanh hơn các mô hình AI hàng đầu hiện tại của OpenAI, đang được phát hành cho các nhà phát triển, cũng như thông qua ứng dụng web và di động ChatGPT cho người dùng, bắt đầu từ hôm nay. Người dùng doanh nghiệp sẽ được truy cập vào tuần tới.

Công ty cho biết GPT-4o mini vượt trội hơn các mô hình AI nhỏ hàng đầu trong ngành về các nhiệm vụ suy luận liên quan đến văn bản và thị giác. Khi các mô hình AI nhỏ được cải thiện, chúng trở nên phổ biến hơn đối với các nhà phát triển do tốc độ và hiệu quả chi phí so với các mô hình lớn hơn, chẳng hạn như GPT-4 Omni hoặc Claude 3.5 Sonnet. Chúng là một lựa chọn hữu ích cho các tác vụ đơn giản, khối lượng lớn mà các nhà phát triển có thể liên tục yêu cầu mô hình AI thực hiện.

GPT-4o mini sẽ thay thế GPT-3.5 Turbo trở thành mô hình nhỏ nhất mà OpenAI cung cấp. Công ty tuyên bố mô hình AI mới nhất của họ đạt điểm 82% trên MMLU, một điểm chuẩn để đo lường khả năng suy luận, so với 79% của Gemini 1.5 Flash và 75% của Claude 3 Haiku, theo dữ liệu từ Artificial Analysis. Trên MGSM, đo lường khả năng suy luận toán học, GPT-4o mini đạt điểm 87%, so với 78% của Flash và 72% của Haiku.

Biểu đồ so sánh các mô hình AI nhỏ từ Artificial Analysis. Giá ở đây là sự kết hợp của token đầu vào và đầu ra.

Hơn nữa, OpenAI cho biết chi phí vận hành GPT-4o mini tiết kiệm đáng kể so với các mô hình tiên phong trước đó của họ, và rẻ hơn 60% so với GPT-3.5 Turbo. Hiện tại, GPT-4o mini hỗ trợ văn bản và thị giác trong API, và OpenAI cho biết mô hình sẽ hỗ trợ các khả năng về video và âm thanh trong tương lai.

“Để AI được trao quyền cho mọi ngóc ngách trên thế giới, chúng tôi cần phải làm cho các mô hình này có mức giá cả phải chăng hơn nhiều,” Olivier Godement, Giám đốc API Sản phẩm của OpenAI, cho biết trong một cuộc phỏng vấn với TechCrunch. “Tôi nghĩ GPT-4o mini là một bước tiến thực sự to lớn theo hướng đó.”

Đối với các nhà phát triển xây dựng trên API của OpenAI, GPT-4o mini có giá 15 cent cho mỗi triệu token đầu vào và 60 cent cho mỗi triệu token đầu ra. Mô hình có cửa sổ ngữ cảnh 128.000 token, xấp xỉ độ dài của một cuốn sách, và dữ liệu được cập nhật đến tháng 10 năm 2023.

OpenAI không tiết lộ chính xác kích thước của GPT-4o mini, nhưng cho biết nó nằm trong cùng phân cấp với các mô hình AI nhỏ khác, chẳng hạn như Llama 3 8b, Claude Haiku và Gemini 1.5 Flash. Tuy nhiên, công ty tuyên bố GPT-4o mini nhanh hơn, tiết kiệm chi phí hơn và thông minh hơn các mô hình nhỏ hàng đầu trong ngành, dựa trên các bài kiểm tra trước khi ra mắt trong lĩnh vực chatbot LMSYS.org. Các bài kiểm tra độc lập ban đầu dường như xác nhận điều này.

“So với các mô hình tương đương, GPT-4o mini rất nhanh, với tốc độ đầu ra trung bình là 202 token mỗi giây,” George Cameron, Đồng sáng lập tại Artificial Analysis, cho biết trong email gửi TechCrunch. “Điều này nhanh hơn gấp đôi so với GPT-4o và GPT-3.5 Turbo, và là một sản phẩm hấp dẫn cho các trường hợp sử dụng phụ thuộc vào tốc độ, bao gồm nhiều ứng dụng cho người tiêu dùng và các cách tiếp cận đại lý để sử dụng LLM.”

Công cụ mới của OpenAI dành cho ChatGPT Enterprise

Ngoài ra, OpenAI đã công bố các công cụ mới dành cho khách hàng doanh nghiệp vào thứ Năm. Trong một bài đăng trên blog, OpenAI đã công bố Enterprise Compliance API để giúp các doanh nghiệp trong các ngành được quản lý chặt chẽ như tài chính, chăm sóc sức khỏe, dịch vụ pháp lý và chính phủ tuân thủ các yêu cầu về nhật ký và kiểm toán.

Công ty cho biết các công cụ này sẽ cho phép quản trị viên kiểm tra và thực hiện hành động trên dữ liệu ChatGPT Enterprise của họ. API sẽ cung cấp bản ghi các tương tác có dấu thời gian, bao gồm cuộc hội thoại, tệp được tải lên, người dùng không gian làm việc, v.v.

OpenAI cũng cung cấp cho quản trị viên quyền kiểm soát chi tiết hơn đối với GPT trong không gian làm việc, một phiên bản ChatGPT tùy chỉnh được tạo cho các trường hợp sử dụng kinh doanh cụ thể. Trước đây, quản trị viên chỉ có thể cho phép hoặc chặn hoàn toàn các hành động của GPT được tạo trong không gian làm việc của họ, nhưng giờ đây, chủ sở hữu không gian làm việc có thể tạo một danh sách các miền được phê duyệt mà GPT có thể tương tác với.

Theo: https://techcrunch.com/2024/07/18/openai-unveils-gpt-4o-mini-a-small-ai-model-powering-chatgpt/

0 Lời bình

Gửi Lời bình

Bạn cũng có thể đọc thêm:

Tái định hình mô hình Spotify cho human-AI enterprise

Các doanh nghiệp phải tiến hóa: Kiến trúc Spotify 2.0 tái định hình các đội agile với các tác tử AI để thúc đẩy quy mô, tốc độ và sự thực thi thông minh hơn, linh hoạt hơn. Tại sao phải phát minh lại mô hình Spotify?1. Composite squad: Các đội ngũ kết hợp Người-AI2....

Các Startup AI Agent Đang Trở Thành Cỗ Máy Doanh Thu — Xếp Hạng Top 20

Các công ty AI agent đã và đang thành công thương mại hóa từ hàng tỷ đô la huy động được. Chúng tôi đã sử dụng dữ liệu doanh thu của CB Insights để xếp hạng top các startup tư nhân hàng đầu cung cấp AI agent. Dựa trên dữ liệu Commercial Maturity của CB Insights, 42%...

Trump: Cần Ít Quy Định Hơn Để Thắng Trong Cuộc Đua AI Toàn Cầu

Vào thứ Tư, Tổng thống Donald Trump đã công bố một kế hoạch hành động sâu rộng nhằm đảm bảo Hoa Kỳ thống trị ngành công nghiệp trí tuệ nhân tạo (AI) toàn cầu. Ông đã ký các sắc lệnh hành pháp giúp tăng tốc cấp phép cho các trung tâm dữ liệu (data centers), tài trợ...

Liên hệ