Recent News

Copyright © 2025 Người Việt 4 Phương. All Right Reserved.

OpenAI ra mắt o3 và o4-mini: mô hình AI tư duy vượt trội

Share It:

Table of Content

Ngày 16/4/2025, OpenAI chính thức công bố hai mô hình trí tuệ nhân tạo mới thuộc dòng o-series: o3 và o4-mini. Đây là các mô hình có khả năng tư duy sâu hơn trước khi phản hồi, đồng thời được huấn luyện để sử dụng linh hoạt toàn bộ công cụ có trong ChatGPT như: Python, trình duyệt web, phân tích hình ảnh và tạo hình ảnh.

OpenAI o3 – mô hình tư duy mạnh nhất từng ra mắt

OpenAI o3 là mô hình tiên tiến nhất hiện nay của hãng, đặc biệt vượt trội trong các lĩnh vực: lập trình, toán học, khoa học tự nhiên và xử lý hình ảnh. O3 thiết lập các kỷ lục mới trên nhiều benchmark như Codeforces, SWE-benchMMMU.

So với o1, o3 giảm đến 20% lỗi nghiêm trọng khi thực hiện các tác vụ phức tạp, đặc biệt trong các lĩnh vực kỹ thuật, sinh học, phân tích kinh doanh và sáng tạo ý tưởng.

OpenAI o4-mini – hiệu năng cao, tốc độ nhanh, chi phí tối ưu

O4-mini là phiên bản nhỏ gọn hơn, được tối ưu để xử lý khối lượng lớn tác vụ với chi phí hợp lý. Mặc dù có quy mô nhỏ hơn, o4-mini vẫn đạt hiệu suất vượt trội trong các bài thi AIME 2024 và 2025, cũng như trong lập trình và phân tích hình ảnh.

Phân tích hiệu suất mô hình AI mới (o-series)

Toán thi đấu (AIME 2024–2025):
O4-mini (no tools) đạt độ chính xác cao nhất: 93.4% (2024)92.7% (2025)

Lập trình thi đấu (Codeforces):
O4-mini + tools đạt ELO 2719 – ngang cao thủ Codeforces chuyên nghiệp

Câu hỏi khoa học PhD (GPQA Diamond):
O3 (no tools) dẫn đầu: 83.3%, vượt o4-mini → thể hiện ưu thế trong học thuật chuyên sâu

Đề thi liên môn (Humanity’s Last Exam):
O4-mini (no tools) dẫn đầu: 24.90%, gần sát ngưỡng “deep research” (26.6%)

Hiệu suất lập trình và chỉnh sửa mã nguồn

SWE-Lancer (Freelance Coding):
o3-high: $65,250 | o4-mini-high: $56,375 | o1-high: $28,500

SWE-Bench (Software Engineering):
o3: 69.1% | o4-mini: 68.1% | o1: 48.9%

Aider Polyglot (Code Editing):
o3-high dẫn đầu: 81.3% (whole), 79.6% (diff) | o4-mini-high: 68.9% / 58.2%

Khả năng xử lý tác vụ phức tạp và sử dụng công cụ linh hoạt

Instruction Following (Multi-turn):
o3 dẫn đầu: 56.51% | o1: 44.93% | o4-mini: 42.99%

Agentic Browsing:
o4 + browsing: 49.7% | o4-mini + browsing: 28.3% | ngưỡng deep research: 51.5%

Function Calling (Tau-bench):

  • Retail: o1-high: 70.8% | o3-high: 70.4% | o4-mini-high: 65.6%
  • Airline: o3-high: 52.0% | o1-high: 50.0% | o4-mini-high: 49.2%

Tích hợp hình ảnh vào quá trình tư duy

Mô hình o3 lần đầu tiên có khả năng đưa hình ảnh vào chuỗi lập luận, thay vì chỉ nhận dạng. Khi được cung cấp một bức ảnh về tàu, o3 có thể:

  • Phóng to, crop lại góc hình chứa đối tượng chính
  • Nhận diện tàu lớn nhất dựa trên đặc điểm thị giác (thân tàu đỏ)
  • Đưa ra kết luận về khả năng tên tàu bị mờ do khoảng cách xa

Mô hình còn có khả năng xử lý:

Ảnh trên bảng trắng (nền trắng), sơ đồ trong sách giáo khoa, hoặc bản vẽ tay, và mô hình có thể hiểu được nội dung—ngay cả khi hình ảnh bị mờ, lộn ngược, hoặc chất lượng thấp. Khi sử dụng công cụ, mô hình có thể thao tác với hình ảnh ngay lập tức—xoay, phóng to, hoặc biến đổi chúng như một phần trong quá trình suy luận.

Nâng cấp khả năng tư duy thành năng lực hành động

Toàn bộ các kết quả từ đánh giá toán học, lập trình, xử lý đa bước đến nhận diện thị giác cho thấy rõ:

O3 và o4-mini không chỉ là những mô hình ngôn ngữ mạnh mẽ, mà còn có khả năng tự đưa ra chiến lược hành động phù hợp theo mục tiêu.

Đây là bước chuyển mình rõ rệt từ một hệ thống phản hồi sang một AI có năng lực tác vụ chủ động (agentic AI), góp phần định hình thế hệ trí tuệ nhân tạo kế tiếp trong lĩnh vực tự động hóa quy trình, trợ lý thông minh và sáng tạo có định hướng.

Tags :

One thought on “OpenAI ra mắt o3 và o4-mini: mô hình AI tư duy vượt trội

  1. Hai mô hình AI mới nhất của OpenAI – o3 và o4-mini – hiện đã chính thức được tích hợp vào GitHub Copilot và GitHub Models. Với khả năng tư duy sâu, hỗ trợ gọi hàm, đầu ra có cấu trúc và xử lý ngữ cảnh dài lên đến 200K tokens, đây là bước nâng cấp mạnh mẽ cho lập trình viên khi làm việc với các tác vụ phức tạp, đa tầng và cần phản hồi chính xác theo ngữ cảnh.

    Người dùng GitHub Copilot có thể bắt đầu sử dụng o4-mini trên tất cả các gói trả phí, trong khi o3 hiện khả dụng cho các gói Enterprise và Pro+. Bạn có thể chọn mô hình trực tiếp trong Visual Studio Code hoặc tại giao diện Copilot Chat trên GitHub. Với GitHub Models Playground, cả hai mô hình cũng có thể được sử dụng để thử nghiệm, tinh chỉnh prompt và xây dựng ứng dụng tích hợp AI nhanh chóng hơn bao giờ hết.

Leave a Reply

Your email address will not be published. Required fields are marked *

Grid News

Latest Post

Find Us on Youtube

Cộng đồng Người Việt khắp nơi trên thế giới. Không thuộc bất kỳ đảng phái chính trị nào trong nước và hải ngoại

Liên lạc: [email protected]

Bài viết mới nhất

quan tâm

Copyright © 2025 Người Việt 4 Phương All Right Reserved.