OpenAI vừa nâng cấp mô hình mặc định của ChatGPT — Đây là những gì GPT-5.5 Instant thực sự làm được.

Bài viết này được dịch máy
Xem bản gốc

OpenAI vừa thay thế bộ xử lý đồ họa bên trong ChatGPT. Bắt đầu từ hôm nay, GPT-5.5 Instant sẽ thay thế GPT-5.3 Instant làm mô hình mặc định được sử dụng bởi hàng trăm triệu người dùng mở ChatGPT mỗi ngày.

Đây không phải là một màn ra mắt hào nhoáng; không có chế độ mới, không có bản demo gây kinh ngạc. Nhưng "cải tiến nhỏ" là một thuật ngữ tương đối khi bản nâng cấp này giảm ảo giác xuống hơn một nửa.

Dòng sản phẩm GPT của OpenAI được phân cấp theo nhiều phiên bản. Instant là mô hình thông thường, được xây dựng cho tốc độ và sử dụng chung; Thinking là phiên bản chậm hơn, phân tích kỹ hơn dành cho các vấn đề phức tạp; và Pro là phiên bản mạnh mẽ nhất dành cho các tác vụ đòi hỏi hiệu năng cao.

GPT-5.5 Instant là bản cập nhật mới nhất cho phiên bản mà hầu hết người dùng ChatGPT sẽ tương tác, dù họ có nhận ra điều đó hay không.

Theo OpenAI, mô hình mới tạo ra ít tuyên bố sai lệch hơn so với GPT-5.3 Instant trong các câu hỏi quan trọng thuộc lĩnh vực y tế, luật và tài chính. Sai lệch trong tuyên bố là nhược điểm dai dẳng nhất của ChatGPT kể từ khi ra đời.

OpenAI cũng đã thử nghiệm với các cuộc hội thoại mà người dùng thực tế trước đó đã đánh dấu là có lỗi sai sự thật. Trên những cuộc hội thoại đó, số lượng tuyên bố không chính xác đã giảm 37,3%.

Trên HealthBench—một bộ công cụ đánh giá hiệu năng phản hồi của AI đối với các câu hỏi y tế thực tế, được chấm điểm từ 0 đến 100—GPT-5.5 Instant đạt 51,4 điểm, tăng từ 49,6 điểm. Trên HealthBench Professional, phiên bản dành cho sử dụng lâm sàng, điểm số của nó tăng vọt từ 32,9 lên 38,4 điểm.

Các câu hỏi về sức khỏe nằm trong số những điều phổ biến nhất mà mọi người hỏi ChatGPT, điều này khiến việc trả lời chính xác các câu hỏi đó trở nên quan trọng hơn cả một bài tập đánh giá chuẩn. Kết quả này có nghĩa là GPT 5.5 Instant đã tăng độ chính xác bằng cách trả lời đúng 38,4% số lần.

GPT-5.5 Instant cũng chủ động hơn trong việc truy xuất thông tin từ các cuộc trò chuyện trước đây, các tệp đã lưu và tài khoản Gmail được kết nối để đưa ra câu trả lời phù hợp với cá nhân bạn. Giờ đây, khi thực hiện điều này, nó sẽ hiển thị chính xác ngữ cảnh đã sử dụng và cho phép bạn xóa hoặc chỉnh sửa. "Bạn vẫn kiểm soát được những gì được lưu trữ trong bộ nhớ của mình," OpenAI viết. Các cuộc trò chuyện tạm thời vẫn cho phép bạn chọn không sử dụng tính năng này.

Khi Decrypt đưa tin vềsự ra mắt dòng sản phẩm GPT-5.5 cách đây hai tuần, câu chuyện tập trung vào lập trình tự động và quy trình làm việc trên thiết bị đầu cuối. GPT-5.5 Instant là một câu chuyện khác – nó xử lý những tác vụ “cơ bản” hơn như kế hoạch bữa ăn và bản nháp email, chứ không phải các quy trình lập trình tự động nhiều bước. Tuy nhiên, đừng hỏi chúng tôi về GPT 5.4 Instant. Có lẽ nó đang nằm yên vị bên cạnh mô hình O2 chưa từng tồn tại.

Phiên bản đầy đủ của GPT-5.5 đạt 82,7% trên Terminal-Bench 2.0, một công cụ đo lường hiệu năng thực thi các tác vụ dòng lệnh phức tạp. Phiên bản Instant là phiên bản mà phần lớn người dùng nhận được, và có lẽ cũng sẽ hài lòng với hiệu năng này.

Một chi tiết đáng chú ý trong thẻ hệ thống: GPT-5.5 Instant là mô hình cấp Instant đầu tiên mà OpenAI phân loại là "Năng lực cao" trong cả lĩnh vực an ninh mạng và sinh học — đủ năng lực để yêu cầu các biện pháp bảo vệ tự động tương tự như trước đây chỉ dành cho các biến thể Tư duy mạnh mẽ hơn. Nó sẽ không giúp bạn hack bất cứ thứ gì, nhưng OpenAI đã xây dựng các rào chắn phòng ngừa trong trường hợp ai đó cố gắng.

Phiên bản mặc định trước đó, GPT-5.3 Instant, ra mắt vào tháng 3 với lời hứa sẽ giảm thiểu các thông báo từ chối gây khó chịu và cải thiện độ chính xác. GPT-5.5 Instant tiếp tục theo đuổi mục tiêu đó. Người dùng trả phí muốn sử dụng phiên bản cũ có ba tháng trước khi GPT-5.3 Instant bị ngừng hỗ trợ. Tính năng cá nhân hóa nâng cao thông qua Gmail sẽ được triển khai trước tiên cho người dùng Plus và Pro trên web, tiếp theo là các gói Free, Go, Business và Enterprise trong những tuần tới.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
55
Thêm vào Yêu thích
15
Bình luận