✏️ Kết quả cuộc thi CSAT giữa Google Gemini 3.0 và OpenAI ChatGPT (5.2)
OpenAI đã đáp trả bằng việc tung ra mô hình "Gemini 3.0" của Google với mô hình "ChatGPT 5.2".
1️⃣ ChatGPT 5.2: "Bậc thầy Toán học"
Điểm tuyệt đối môn Toán: Nó thể hiện hiệu suất vượt trội trong môn toán, giải quyết Bài toán Hình học 29, được coi là một bài toán khó, chỉ trong bốn phút.
Điểm tổng thể: Nó vượt trội hơn Gemini 3.0 ở bốn trong sáu môn học.
Tính năng "Tư duy sâu" được cho là đã làm tăng thời gian tính toán và cải thiện độ chính xác.
2️⃣ Gemini 3.0: "Mạnh mẽ trong thông tin và suy luận trực quan"
Điểm tuyệt đối môn Lịch sử Hàn Quốc: Nó thể hiện kỹ năng "đa phương thức" xuất sắc, tích hợp hình ảnh và sơ đồ với văn bản để đưa ra suy luận. Khả năng diễn giải hình ảnh của nó rất xuất sắc, bằng chứng là khả năng dự đoán chính xác các sự kiện tiếp theo từ các bức ảnh về binh lính Mỹ bị bắt trong chiến dịch Shinmiyangyo.
Điểm yếu được cải thiện: Khả năng diễn giải hình ảnh đã được cải thiện đáng kể, thậm chí đến mức hiểu được các hình minh họa trong các tài liệu cổ.
3️⃣ Hạn chế của mô hình
ChatGPT: Ngay cả khi giải quyết vấn đề thành công, đôi khi nó vẫn không hiểu được văn bản phức tạp chứa cả văn bản và bảng biểu, dẫn đến câu trả lời không chính xác.
Tình trạng của AI trong nước: Do hiệu suất của nó tụt hậu so với các mô hình quốc tế, một số người cho rằng nó nên được phân biệt với AI đa năng bằng cách tập trung vào các mô hình chuyên biệt.