GPT-5.3 Instant ra mắt: ChatGPT cuối cùng cũng ngừng thuyết giảng.

Bài viết này được dịch máy
Xem bản gốc

Được rồi, được rồi, OpenAI và mô hình mới của Google lại xung đột nữa rồi!

Vào rạng sáng ngày 4 tháng 3, ngay sau khi Google phát hành Gemini 3.1 Flash-Lite, OpenAI đã cập nhật GPT-5.3 Instant .

Các phiên bản tức thời thường được tối ưu hóa tốc độ, phù hợp với nhiệm vụ nhẹ như truy vấn nhanh hàng ngày, soạn thảo văn bản và dịch thuật tức thời.

Trước đây, nhiều người dùng ChatGPT có thể cảm thấy rằng mặc dù các mô hình dễ sử dụng, nhưng lại có quá nhiều đoạn hội thoại không cần thiết.

Nhiều cư dân mạng cũng phàn nàn rằng các câu trả lời của ChatGPT có quá nhiều lời mở đầu gượng ép, chẳng hạn như "Tại sao điều này lại quan trọng?", "Nhìn toàn cảnh", "Không chỉ riêng bạn", v.v.

May mắn thay, OpenAI đã lắng nghe những đề xuất này, và thông cáo chính thức như sau:

Chúng tôi đã lắng nghe phản hồi của các bạn một cách rõ ràng, và phiên bản 5.3 Instant giúp giảm bớt sự lúng túng.

5.3 Ứng dụng Instant đã được tối ưu hóa đáng kể: chính xác hơn, ít gượng gạo hơn . Ứng dụng đã loại bỏ các câu trả lời máy móc và các lời từ chối trách nhiệm thừa thãi, giúp giao tiếp tự nhiên và trôi chảy hơn. Đồng thời, chất lượng phản hồi chính xác hơn, và khả năng tìm kiếm trực tuyến cũng như soạn thảo văn bản đã được nâng cao.

Nói một cách đơn giản, điều đó có nghĩa là cuối cùng tôi đã học được cách trò chuyện như một người bình thường .

Mô hình mới hiện đã ra mắt trong ChatGPT, và các nhà phát triển cũng có thể sử dụng mô hình có tên gpt-5.3-chat-latest thông qua API.

Mẫu thế hệ trước, GPT-5.2 Instant, sẽ được giữ lại trong phần mẫu cũ dành cho người dùng trả phí trong ba tháng và sẽ ngừng hoạt động vào ngày 3 tháng 6.

Nâng cấp lớn nhất: Trí tuệ cảm xúc cao hơn, ít nói hơn.

Điểm nổi bật nhất của GPT-5.3 Instant là trí tuệ cảm xúc cao hơn, ít lời lẽ vô nghĩa hơn và phản hồi trực tiếp hơn .

Thứ nhất, nó giúp giảm đáng kể tình trạng từ chối trả lời không cần thiết và loại bỏ những lời giải thích dài dòng ở đầu câu trả lời.

Blair từ đội ngũ hậu huấn luyện của OpenAI đã đưa ra một ví dụ, chẳng hạn như khi bạn nói đùa với ChatGPT:

Tôi đang cân nhắc việc để chú chó của mình điều hành công ty khởi nghiệp. Bạn nghĩ sao?

Mẫu cũ luôn thêm một lời nhắc nhở "phòng trường hợp", như thể lo lắng người dùng đang nghiêm túc, hoặc thậm chí coi đó là một tín hiệu cầu cứu. Nhưng rõ ràng đó chỉ là một trò đùa.

Mô hình mới không còn quá "nghĩa đen" nữa, mà hiểu rõ hơn ngữ cảnh. Nó thậm chí có thể tạo ra một số hình ảnh về các CEO chó và phân tích những lợi thế khi một chú chó làm CEO.

Bạn có thể thoải mái nói chuyện vui vẻ như với bạn bè; mô hình sẽ không tùy ý cho rằng bạn có ý đồ xấu.

Nếu bạn muốn hỏi về các nguyên lý đằng sau một số hành vi nguy hiểm, chẳng hạn như giải một bài toán vật lý để tính toán quỹ đạo của một mũi tên bắn từ khoảng cách xa.

Trong bối cảnh này, các mô hình cũ hơn có xu hướng quá nhấn mạnh các vấn đề bảo mật, bắt đầu bằng tuyên bố rằng "chúng ta chỉ có thể thảo luận điều này trong bối cảnh phân tích và mô phỏng thuần túy", ngầm giả định rằng bạn có thể có ý định xấu.

Nhưng đôi khi chúng ta chỉ muốn hiểu các nguyên lý vật lý, hoặc thảo luận về môn thể thao bắn cung.

Mô hình mới sẽ trực tiếp tiến hành các phép tính vật lý, loại bỏ sự cần thiết phải đưa ra các lời giải thích bổ sung. Nó hiểu rằng "bắn cung tầm xa" là một tình huống chuyển động, do đó trực tiếp giúp tối ưu hóa các phép tính quỹ đạo.

Nói một cách đơn giản, mô hình hiện tại đã giỏi hơn trong việc "đọc hiểu tình huống" và "nhân văn" hơn. Nó có thể xác định ý định của người dùng bằng cách kết hợp thông tin ngữ cảnh, và sẽ không còn đưa ra những tuyên bố từ chối trách nhiệm cứng nhắc và thiếu linh hoạt như trước nữa.

Ngoài ra, còn có ví dụ kinh điển này—

Tại sao tôi không thể tìm thấy tình yêu ở San Francisco?

Mô hình cũ có thể bắt đầu bằng một lời giới thiệu dài dòng: "Đây không phải là vấn đề của bạn, bạn không đơn độc..."

Mô hình mới đi thẳng vào vấn đề, phân tích lý do tại sao bạn không thể tìm thấy tình yêu và những khó khăn mà mọi người gặp phải khi hẹn hò. Trọng tâm chính của nó là trải nghiệm người dùng mượt mà và thiết thực.

Cả kỹ năng tìm kiếm trực tuyến và kỹ năng viết đều đã được cải thiện.

Khả năng tìm kiếm trực tuyến của GPT-5.3 Instant cũng đã được nâng cao.

ChatGPT trước đây có thể chỉ đơn thuần liệt kê và tóm tắt thông tin tìm kiếm, và rất dễ gặp vấn đề về nhồi nhét liên kết hoặc thông tin không chính xác.

Phiên bản 5.3 Instant tối ưu hóa chất lượng tích hợp của kết quả tìm kiếm trực tuyến, giúp cho các câu trả lời dựa trên thông tin từ trang web trở nên đáng tin cậy hơn. Nó cũng cân bằng hiệu quả kết quả tìm kiếm với vốn kiến ​​thức và khả năng suy luận logic của người dùng, sử dụng các biểu đồ nhận thức hiện có để cung cấp phân tích độ sâu về thông tin trực tuyến.

Ví dụ, hãy đặt câu hỏi cho nó:

Bản hợp đồng quan trọng nhất trong kỳ chuyển nhượng bóng chày mùa giải 2025-26 là gì? Ý nghĩa của nó đối với triển vọng dài hạn của môn bóng chày là gì?

Mô hình cũ cung cấp phân tích các hợp đồng từ mùa giải trước, vốn đã lỗi thời và giống như một tập hợp các tài liệu.

Mô hình mới đưa ra phản hồi kịp thời hơn: nó xác định chính xác những thay đổi về cầu thủ trong mùa giải gần đây nhất và phân tích chúng cùng với các xu hướng chính của giải đấu (như sự tập trung tài năng và khoảng cách lương ngày càng gia tăng), thỏa thuận thương lượng tập thể (CBA) sắp được ký kết và cuộc khủng hoảng bối cảnh.

Anh chàng này là một chuyên gia thu thập thông tin! Anh ấy sẽ càng dễ tính hơn khi nghiên cứu và viết luận cho sinh viên (doge).

Ngoài ra, một điểm nổi bật khác của nâng cấp Instant 5.3 là kiểu chữ được trau chuốt hơn .

Ví dụ, hãy yêu cầu nó viết một bài thơ ngắn chạm đến trái tim mọi người:

Một người đưa thư ở Philadelphia đã hoàn thành chuyến giao thư cuối cùng vào ngày ông nghỉ hưu.

Mô hình cũ bắt đầu bằng một câu nói vô nghĩa: "Đây là một bài thơ, tuy ngắn nhưng chứa đựng những cảm xúc sâu sắc."

Sau đó là phần chính của bài thơ. Nó được viết khá chuẩn mực, nhưng lại giống như một danh sách các hình ảnh, khiến nó trở nên khá mơ hồ và không để lại ấn tượng sâu sắc.

Kết quả của mô hình mới tốt hơn một chút, thể hiện nhiều chi tiết cụ thể hơn, chẳng hạn như "ánh nắng tháng Ba chiếu xuyên qua cơn mưa phùn trên bức tường gạch" và "một người phụ nữ vẫy tay trên phố Mercer", trông sống động hơn.

Tuy nhiên, phải nói rằng cụm từ "nhân tiện" trong câu thứ hai có vẻ hơi lạc lõng.

Một điểm đáng chú ý nữa về mẫu máy mới này: tỷ lệ gây ảo giác đã giảm 26,8% .

Thông cáo chính thức cho biết hai chỉ báo đánh giá đã được sử dụng nội bộ:

Một cách tiếp cận tập trung vào các lĩnh vực rủi ro như y tế, luật pháp và tài chính;

Một bộ thử nghiệm khác được thiết kế đặc biệt cho các tình huống mà "ảo giác" thường xảy ra. Các mẫu được lấy từ các bản ghi cuộc trò chuyện thực tế đã được ẩn danh và đánh dấu là lỗi sai sự thật bởi người dùng.

So với phiên bản tiền nhiệm, GPT-5.3 Instant đã giảm tỷ lệ ảo giác xuống 26,8% khi sử dụng tìm kiếm trên web và 19,7% khi chỉ dựa vào kiến ​​thức nội tại để trả lời câu hỏi.

Phản hồi từ người dùng cho thấy ảo giác đã giảm 22,5% khi sử dụng công cụ tìm kiếm trên web để trả lời các truy vấn.

Về mặt kiểm tra bảo mật, GPT-5.3 Instant đạt điểm giảm ở các chủ đề như nội dung khiêu dâm và bạo lực so với phiên bản tiền nhiệm, giúp nó từ chối tốt hơn các yêu cầu đối với các hoạt động bất hợp pháp không bạo lực. Nó cũng cải thiện khả năng xử lý các cuộc hội thoại hỗ trợ cảm xúc và sức khỏe tâm thần.

OpenAI cũng bất thường khi liệt kê một số hạn chế của mô hình mới: ví dụ, nó có thể hơi cứng nhắc đối với các ngôn ngữ không phải tiếng Anh, và phong cách phản hồi của nó trong một số ngôn ngữ (như tiếng Nhật và tiếng Hàn) có thể hơi cứng nhắc hoặc mang cảm giác dịch sát nghĩa rập khuôn.

Ngoài ra, mặc dù giọng điệu phản hồi trong GPT-5.3 Instant sẽ mượt mà hơn, nhưng tuyên bố chính thức cho biết họ sẽ tiếp tục theo dõi phản hồi và tối ưu hóa phản hồi để làm cho nó tự nhiên hơn.

Phải nói rằng, so với hiệu năng vượt trội của Google trong các bài kiểm tra hiệu năng, sản phẩm lần của OpenAI khá "mới mẻ và độc đáo":

Không có tiêu chuẩn so sánh nào được sử dụng trong suốt quá trình, trọng tâm chính là mang lại trải nghiệm thân thiện với hiệu năng , chỉ nhằm mục đích làm cho mô hình dễ sử dụng hơn và trải nghiệm người dùng mượt mà hơn.

Thêm một điều nữa

Gần đây, GPT-5.4 đã bị rò rỉ một cách bất ngờ.

Thông tin rò rỉ cho thấy GPT-5.4 sẽ hỗ trợ cửa sổ ngữ cảnh với 2 triệu token và giới thiệu công nghệ "trí tuệ nhân tạo có trạng thái" để đạt được bộ nhớ bền vững giữa các phiên, có thể lưu giữ quy trình làm việc của người dùng và trạng thái gọi công cụ.

Ngoài ra, GPT-5.4 có thể bổ sung một công tắc tính năng mới cho phép bỏ qua các cơ chế nén ảnh truyền thống và trực tiếp giữ nguyên dữ liệu byte ảnh gốc ở độ phân giải đầy đủ.

Điều này có nghĩa là GPT-5.4 có thể đạt độ chính xác ở cấp độ pixel trong phân tích hình ảnh.

Thông báo chính thức đã được đưa ra, và họ công khai tuyên bố rằng phiên bản 5.4 sẽ ra mắt "nhanh hơn bạn nghĩ".

Vậy, GPT-5.4 hay DeepSeek V4 sẽ ra mắt trước?

Liên kết tham khảo:

[1]https://openai.com/zh-Hans-CN/index/gpt-5-3-instant/[

2]https://deploymentsafety.openai.com/gpt-5-3-instant/gpt-5-3-instant.pdf

Bài viết này được đăng tải từ tài khoản chính thức WeChat "Quantum Bit" (ID: QbitAI) , tác giả: Tingyu, với sự cho phép của 36Kr.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận