OpenAI trình làng GPT-4o mini, Mô hình nhỏ hơn và rẻ hơn

OpenAI đã giới thiệu GPT-4o mini vào thứ Năm, mô hình AI nhỏ mới nhất của họ. Công ty cho biết GPT-4o mini, rẻ hơn và nhanh hơn các mô hình AI hàng đầu hiện tại của OpenAI, đang được phát hành cho các nhà phát triển, cũng như thông qua ứng dụng web và di động ChatGPT cho người dùng, bắt đầu từ hôm nay. Người dùng doanh nghiệp sẽ được truy cập vào tuần tới.

Công ty cho biết GPT-4o mini vượt trội hơn các mô hình AI nhỏ hàng đầu trong ngành về các nhiệm vụ suy luận liên quan đến văn bản và thị giác. Khi các mô hình AI nhỏ được cải thiện, chúng trở nên phổ biến hơn đối với các nhà phát triển do tốc độ và hiệu quả chi phí so với các mô hình lớn hơn, chẳng hạn như GPT-4 Omni hoặc Claude 3.5 Sonnet. Chúng là một lựa chọn hữu ích cho các tác vụ đơn giản, khối lượng lớn mà các nhà phát triển có thể liên tục yêu cầu mô hình AI thực hiện.

GPT-4o mini sẽ thay thế GPT-3.5 Turbo trở thành mô hình nhỏ nhất mà OpenAI cung cấp. Công ty tuyên bố mô hình AI mới nhất của họ đạt điểm 82% trên MMLU, một điểm chuẩn để đo lường khả năng suy luận, so với 79% của Gemini 1.5 Flash và 75% của Claude 3 Haiku, theo dữ liệu từ Artificial Analysis. Trên MGSM, đo lường khả năng suy luận toán học, GPT-4o mini đạt điểm 87%, so với 78% của Flash và 72% của Haiku.

Biểu đồ so sánh các mô hình AI nhỏ từ Artificial Analysis. Giá ở đây là sự kết hợp của token đầu vào và đầu ra.

Hơn nữa, OpenAI cho biết chi phí vận hành GPT-4o mini tiết kiệm đáng kể so với các mô hình tiên phong trước đó của họ, và rẻ hơn 60% so với GPT-3.5 Turbo. Hiện tại, GPT-4o mini hỗ trợ văn bản và thị giác trong API, và OpenAI cho biết mô hình sẽ hỗ trợ các khả năng về video và âm thanh trong tương lai.

“Để AI được trao quyền cho mọi ngóc ngách trên thế giới, chúng tôi cần phải làm cho các mô hình này có mức giá cả phải chăng hơn nhiều,” Olivier Godement, Giám đốc API Sản phẩm của OpenAI, cho biết trong một cuộc phỏng vấn với TechCrunch. “Tôi nghĩ GPT-4o mini là một bước tiến thực sự to lớn theo hướng đó.”

Đối với các nhà phát triển xây dựng trên API của OpenAI, GPT-4o mini có giá 15 cent cho mỗi triệu token đầu vào và 60 cent cho mỗi triệu token đầu ra. Mô hình có cửa sổ ngữ cảnh 128.000 token, xấp xỉ độ dài của một cuốn sách, và dữ liệu được cập nhật đến tháng 10 năm 2023.

OpenAI không tiết lộ chính xác kích thước của GPT-4o mini, nhưng cho biết nó nằm trong cùng phân cấp với các mô hình AI nhỏ khác, chẳng hạn như Llama 3 8b, Claude Haiku và Gemini 1.5 Flash. Tuy nhiên, công ty tuyên bố GPT-4o mini nhanh hơn, tiết kiệm chi phí hơn và thông minh hơn các mô hình nhỏ hàng đầu trong ngành, dựa trên các bài kiểm tra trước khi ra mắt trong lĩnh vực chatbot LMSYS.org. Các bài kiểm tra độc lập ban đầu dường như xác nhận điều này.

“So với các mô hình tương đương, GPT-4o mini rất nhanh, với tốc độ đầu ra trung bình là 202 token mỗi giây,” George Cameron, Đồng sáng lập tại Artificial Analysis, cho biết trong email gửi TechCrunch. “Điều này nhanh hơn gấp đôi so với GPT-4o và GPT-3.5 Turbo, và là một sản phẩm hấp dẫn cho các trường hợp sử dụng phụ thuộc vào tốc độ, bao gồm nhiều ứng dụng cho người tiêu dùng và các cách tiếp cận đại lý để sử dụng LLM.”

Công cụ mới của OpenAI dành cho ChatGPT Enterprise

Ngoài ra, OpenAI đã công bố các công cụ mới dành cho khách hàng doanh nghiệp vào thứ Năm. Trong một bài đăng trên blog, OpenAI đã công bố Enterprise Compliance API để giúp các doanh nghiệp trong các ngành được quản lý chặt chẽ như tài chính, chăm sóc sức khỏe, dịch vụ pháp lý và chính phủ tuân thủ các yêu cầu về nhật ký và kiểm toán.

Công ty cho biết các công cụ này sẽ cho phép quản trị viên kiểm tra và thực hiện hành động trên dữ liệu ChatGPT Enterprise của họ. API sẽ cung cấp bản ghi các tương tác có dấu thời gian, bao gồm cuộc hội thoại, tệp được tải lên, người dùng không gian làm việc, v.v.

OpenAI cũng cung cấp cho quản trị viên quyền kiểm soát chi tiết hơn đối với GPT trong không gian làm việc, một phiên bản ChatGPT tùy chỉnh được tạo cho các trường hợp sử dụng kinh doanh cụ thể. Trước đây, quản trị viên chỉ có thể cho phép hoặc chặn hoàn toàn các hành động của GPT được tạo trong không gian làm việc của họ, nhưng giờ đây, chủ sở hữu không gian làm việc có thể tạo một danh sách các miền được phê duyệt mà GPT có thể tương tác với.

Theo: https://techcrunch.com/2024/07/18/openai-unveils-gpt-4o-mini-a-small-ai-model-powering-chatgpt/

0 Lời bình

Gửi Lời bình

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Bạn cũng có thể đọc thêm:

Bắt đầu từ đâu với Generative AI

Nội dung:Giới thiệu về Generative AIHiểu các thuật ngữ GenAITrí tuệ nhân tạo (Artificial Intelligence)Máy học (Machine Learning)Xử lý ngôn ngữ tự nhiên - Natural Language Processing (NLP)Mô hình Transformer (Transformer Models)Trí tuệ nhân tạo tạo sinh (Generative AI...

Tiếp cận AI First: Kế hoạch dành cho doanh nhân

Hiểu về Cách tiếp cận "AI first"Triển khai Cách tiếp cận "AI first": Bài học từ ArkReachTương lai của Tinh thần Khởi nghiệp "AI first": Cơ hội và Thách thức Trí tuệ nhân tạo (AI) đang cách mạng hóa các ngành công nghiệp, định hình lại nền kinh tế và thay đổi hoàn toàn...

Công ty 1 người: Xu hướng tương lai hay viễn tưởng xa vời?

Sự phát triển vượt bậc của Trí tuệ nhân tạo (AI), đặc biệt là các mô hình ngôn ngữ lớn (LLM), đang mở ra những viễn cảnh mới cho tương lai của doanh nghiệp. Một trong những ý tưởng thu hút sự chú ý ngày càng tăng là mô hình "công ty một người" (one-man company), nơi...

Xây dựng AI Chatbot cho nghành y tế

Chatbot Trí tuệ nhân tạo (AI chatbot) đang cách mạng hóa ngành y tế, với các chatbot AI nổi lên như một công cụ mạnh mẽ để cải thiện chăm sóc bệnh nhân, nâng cao hiệu quả và giảm chi phí. Bài viết này hướng dẫn toàn diện về cách xây dựng một chatbot AI cho ngành y tế,...

Liên hệ