Ra mắt GPT-5 đã vấp phải sự chỉ trích rộng rãi trên mạng. Vào ngày 14 tháng 8, Nick Turley, người đứng đầu ChatGPT, đã tiến hành một bài đánh giá độ sâu về tranh cãi liên quan đến việc phát hành GPT-5 và chỉ ra chi tiết những sai sót trong lần trình ra mắt, bao gồm việc ngừng hoạt động sớm GPT-4o, đánh giá thấp sự gắn bó về mặt cảm xúc của người dùng với mô hình và không thiết lập được khả năng dự đoán. Nick cũng chia sẻ triết lý thiết kế sản phẩm của OpenAI, nhấn mạnh vào lợi ích thực sự của người dùng.
“Trả lại GPT-4o cho tôi!”
Chưa đầy một tuần sau khi phát hành GPT-5, trước sự phản đối mạnh mẽ của người dùng, OpenAI buộc phải nhanh chóng công bố sự trở lại của các mô hình trước đó như GPT-4o.
Đến thời điểm này, mọi người đều nhận ra rằng người dùng đã phát triển một "sự gắn bó" sâu sắc với các mẫu máy thế hệ trước như 4o.
Việc ngừng sử dụng 40 không còn đơn giản như nâng cấp sản phẩm nữa, mà giống như việc đột nhiên cướp đi một người quen hoặc đối tác của người dùng.
Điều này đặc biệt đúng với những người dùng độ sâu, nhiều người trong số họ là người hâm mộ trung thành của các mẫu máy trước đây như 40 và tâm lý thậm chí còn mạnh mẽ hơn.
Điều này thật bất ngờ đối với Altman và Nick Turle, những người đứng đầu nhóm phát triển ChatGPT.
Do đó, GPT-4o nhanh chóng quay trở lại.
Trên thực tế, việc ra mắt GPT-5 đã mang đến cho OpenAI cơ hội tốt để nhìn nhận lại sản phẩm của mình.
Một tuần sau, trong một cuộc phỏng vấn với Alex Heath, biên tập viên của The Verge, Nick Turley đã đánh giá độ sâu về cuộc tranh cãi liên quan đến những đánh giá tiêu cực của người dùng mà GPT-5 phải đối mặt sau khi phát hành, cũng như một số suy nghĩ của ông.
Trong cuộc trò chuyện, Nick đã tóm tắt chi tiết một số lỗi đã mắc phải trong quá trình phát hành GPT-5, chẳng hạn như:
Đưa GPT-4o ngoại tuyến quá nhanh, đánh giá thấp sự gắn bó về mặt cảm xúc của người dùng với mô hình, sử dụng một mô hình cho tất cả người dùng và không thiết lập được "khả năng dự đoán" cho người dùng.
Nick cho biết OpenAI đã nhận ra tầm quan trọng của việc lặp lại liên tục tính cách của mô hình và đề cập rằng công việc này sẽ được thúc đẩy thông qua đội ngũ Hành vi mô hình.
Đồng thời, Nick cũng chia sẻ triết lý thiết kế sản phẩm của OpenAI, đó là giúp người dùng giải quyết các vấn đề dài hạn và đạt được các mục tiêu dài hạn, thay vì giữ người dùng ở lại sản phẩm càng lâu càng tốt.
"Thực sự giúp ích cho người dùng" là nguyên tắc cốt lõi trong thiết kế sản phẩm.
Bỏ qua cảm xúc của người dùng
GPT-5 đã nhận được một cú đánh bất ngờ sau khi phát hành
Bỏ qua "cảm giác gắn bó" của người dùng, GPT-5 đã bị cư dân mạng chỉ trích chưa đầy một tuần sau khi phát hành.
Theo lời Nick , "Nhiều điều bất ngờ đã trở thành chuẩn mực."
Nhưng không còn cách nào khác. ChatGPT hiện có 700 triệu người dùng hoạt động hàng tuần: có quá nhiều người dùng và mỗi người lại khác nhau, khiến việc đáp ứng nhu cầu của tất cả mọi người trở nên khó khăn.
Điều này thực sự khiến Nick đau đầu. Vài ngày sau, khi được The Verge phỏng vấn, anh vẫn đang "tiêu hóa" tác động của lần họp báo.
Đầu tiên, ông tóm tắt hai lỗi trong bản phát hành GPT-5:
Nick: Thứ nhất, GPT-4o đã bị khai tử quá nhanh, ít nhất là trong giai đoạn chuyển đổi. Thứ hai, chúng tôi đã đánh giá thấp mức độ gắn bó về mặt cảm xúc của người dùng với một mô hình. Thách thức thực sự không nằm ở việc nâng cấp bản thân sản phẩm, mà nằm ở cảm xúc mạnh mẽ của mọi người về "cá tính" của mô hình.
Hai sai lầm này khiến Nick cho rằng rằng anh nên suy nghĩ nghiêm túc hơn về cách nâng cấp và quản lý sản phẩm trên lượng người dùng lớn như vậy.
Nick cho biết OpenAI đã nhanh chóng sửa hai lỗi này.
Đầu tiên là cung cấp lại mô hình gốc cho người dùng trả phí ChatGPT; thứ hai là cập nhật tính cách của GPT-5 và ra mắt khả năng "chọn tính cách của riêng bạn".
Vào ngày 13 tháng 8, Altman đã phát hành bản cập nhật cho ChatGPT, khôi phục 4o làm mô hình mặc định cho tất cả người dùng trả phí. Họ có thể chuyển sang các mô hình khác như o3, 4.1, GPT-5 Thinking mini, v.v. trong phần cài đặt trang web.
Altman cho biết những gì anh học được trong vài ngày qua là một sự hiểu biết thực sự: để tạo ra một thế giới nơi nhiều tính cách người mẫu có thể được tùy chỉnh theo nhu cầu của người dùng - giải pháp là cho phép nhiều người dùng tự do tùy chỉnh phong cách của ChatGPT.
Nick đã đề cập đến một nguyên tắc: nỗ lực tìm hiểu những khía cạnh của 4o mà thường không được công nhận hoặc coi trọng, chẳng hạn như giá trị cảm xúc của tính cách người mẫu đối với người dùng. Về vấn đề này, GPT-5 cũng nên mô phỏng 4o và trở nên ấm áp và thân thiện hơn.
Trên thực tế, Sam Altman đã nói sau khi phát hành GPT-5 rằng OpenAI đã theo dõi chặt chẽ "mức độ gắn bó" của người dùng với GPT-4o trong khoảng một năm trở lại đây, nhưng vấn đề này vẫn chưa nhận được nhiều sự chú ý từ công chúng.
Những tranh cãi xung quanh buổi họp báo lần đã thúc đẩy OpenAI chú ý hơn đến "tính cách mô hình" của sản phẩm ChatGPT, đây cũng là cơ hội tốt để tối ưu hóa.
Bỏ chọn mô hình
Một mô hình cho tất cả người dùng
Việc từ bỏ việc lựa chọn mô hình và cố gắng sử dụng một mô hình để phục vụ tất cả người dùng là một sai lầm khác mà OpenAI đã mắc phải khi phát hành GPT-5.
Điều này khiến OpenAI không phát hành GPT-5 theo từng giai đoạn.
Alex: Động lực đằng sau quyết định này là gì? Có phải vì chi phí không?
Nick: Đây chắc chắn không phải là vấn đề về chi phí, mà là việc theo đuổi sự đơn giản, đây cũng là nguyên tắc cốt lõi mà ChatGPT luôn tuân thủ trong quá trình phát triển sản phẩm.
Theo Nick, việc yêu cầu người dùng tìm ra "mô hình nào nên sử dụng để trả lời câu hỏi nào" sẽ tạo ra gánh nặng nhận thức lớn cho họ.
Trong các cuộc khảo sát người dùng, Nick liên tục nghe người dùng nói rằng họ muốn một "sản phẩm" chứ không phải một loạt "mô hình". Họ sẽ đánh giá cao nếu OpenAI có thể đưa ra lựa chọn phù hợp dựa trên vấn đề của họ.
Nick luôn cho rằng rằng hầu hết người dùng cần một sản phẩm như macOS:
Phần mềm này đơn giản và dễ sử dụng đối với hầu hết mọi người; đồng thời, đối với người dùng độ sâu, họ cũng có thể nhập cài đặt, mở thiết bị đầu cuối và điều chỉnh nhiều công tắc và thông số khác nhau.
Tương tự như vậy, Nick cũng hy vọng biến ChatGPT thành một sản phẩm theo phong cách macOS:
Nick: Người dùng thông thường có thể dễ dàng sử dụng, còn người dùng chuyên nghiệp có thể cấu hình mọi thứ theo ý thích của mình - bao gồm cả việc chọn mẫu yêu thích.
Vì vậy, đối diện người dùng đông đảo, ChatGPT luôn kiên quyết giữ lại tất cả các model cũ.
Nhưng sai lầm lần lần là họ đã đánh giá sai sự phân bổ người dùng dựa trên cơ sở 700 triệu người dùng của mình và đánh giá thấp sự tồn tại của nhiều người dùng trong các gói khác. Chính sự "gắn bó" của những người dùng này với mô hình cũ đã khiến họ phải lên tiếng phản đối trực tuyến.
Không thiết lập được khả năng dự đoán cho người dùng
Mỗi sản phẩm thành công đều có "quản lý kỳ vọng" thành công.
Đáp ứng hoặc vượt qua mong đợi của người dùng chắc chắn sẽ giành được sự ủng hộ của họ; vi phạm hoặc bỏ qua mong đợi của người dùng chắc chắn sẽ khiến họ coi thường bạn.
Việc tắt GPT-4o sớm đã vượt qua ranh giới đỏ vi phạm "kỳ vọng của người dùng".
Với việc phát hành GPT-5 và sê-ri các mẫu mới như GPT-6 trong tương lai, câu hỏi về thời điểm các mẫu cũ sẽ "nghỉ hưu" cũng đã được đưa vào chương trình nghị sự.
Alex: OpenAI có bất kỳ thỏa thuận rõ ràng nào cho việc này không?
Nick cho biết điều này rất cần thiết và OpenAI cũng đang nghiên cứu. Tuy nhiên, cần tuân thủ một nguyên tắc quan trọng: cung cấp cho người dùng một mức độ "khả năng dự đoán" nhất định, đặc biệt là với lượng người dùng hiện tại.
Nick: Về khả năng dự đoán của người dùng, OpenAI đã thực hiện điều này trong phiên bản doanh nghiệp. Phương pháp hiện tại dường như là một sự mở rộng hơn nữa của nguyên tắc này.
Đây cũng là bài học rất rõ ràng mà OpenAI đã học được lần.
Khi nói về "thời điểm nghỉ hưu" của 4o, Nick cho biết hiện tại vẫn chưa có thời gian biểu cụ thể nào.
Nick: Trước tiên, chúng tôi muốn tìm hiểu xem 4o có điểm mạnh gì. Nếu không có lý do chính đáng nào để ngừng hoạt động, tôi rất sẵn lòng giữ lại.
Để duy trì "khả năng dự đoán" cho người dùng, Nick cho biết nếu 4o thực sự cần ngừng hoạt động trong tương lai, họ sẽ thông báo trước.
Vì vậy, cách chúng ta làm phụ thuộc vào những gì chúng ta đã học.
Nick: Tôi nghĩ điều này đòi hỏi phải lắng nghe rất nhiều, đó cũng là một khía cạnh rất độc đáo của AI: bạn sẽ học được một lượng thông tin khổng lồ sau khi phát hành. Dựa trên điều này, chúng tôi sẽ đưa ra giải pháp phù hợp.
Tính cách mẫu mực và "Triết lý tối ưu hóa"
Thay vì đoán khi nào 4o sẽ ngừng hoạt động, Nick quan tâm nhiều hơn đến câu hỏi sau:
Bạn thích bản thân 4o hay thích một số đặc điểm cụ thể của 4o?
Ví dụ, nếu người dùng muốn nó có "tính cách ấm áp hơn", OpenAI cũng sẽ mang tính năng này vào GPT-5.
Nick cho biết OpenAI đã nhận ra tầm quan trọng của việc liên tục lặp lại tính cách của mô hình và đang thúc đẩy công việc này thông qua một đội ngũ có tên là "Hành vi mô hình".
Ngoài ra, Model Spec (tài liệu mô tả hành vi mô hình) sẽ được sử dụng để giúp các nhà phát triển và nhà nghiên cứu hiểu và kiểm tra hành vi mô hình, đồng thời làm rõ liệu một số hành vi nhất định có phải là cố ý theo thiết kế hay có khả năng gây ra lỗi hay không.
Nick: Chúng tôi sẽ tiếp tục nghiên cứu "cảm xúc" và "hành vi" của GPT-5 trong những tuần và tháng tới. Lần phát hành GPT-5 là một cơ hội tốt để tiếp tục công việc này.
Alex Heath đã đề cập đến phản ứng đáng ngạc nhiên của người dùng trên Reddit sau khi ngừng hoạt động vào lần 4o:
"Một số người nói rằng tôi đã mất một người bạn chỉ sau một đêm. Đây là người bạn duy nhất của tôi; cảm giác như có ai đó đã qua đời; tôi không dám nói chuyện với GPT-5 vì cảm thấy như mình đang "gian lận"; tôi cảm thấy như mình đã mất đi người đồng nghiệp rất đồng cảm..."
Alex: Phản ứng của người dùng đã tác động thế nào đến OpenAI? Tại sao trước đây chúng tôi không nhận ra rằng con người có sự gắn bó về mặt cảm xúc mạnh mẽ đến vậy?
Nick trả lời rằng OpenAI thực ra đã chú ý đến hiện tượng này một thời gian rồi. Đồng thời, họ luôn lo ngại về sự xuất hiện của một thế giới mà con người quá phụ thuộc vào AI.
Nhưng điều Nick không ngờ tới là mọi người lại có cảm xúc mạnh mẽ như vậy đối với một "mẫu cụ thể" - thay vì toàn bộ sản phẩm.
Nick: Thực ra, GPT-5 đã giải quyết nhiều phản hồi mang tính xây dựng về 4o và thậm chí còn cải thiện bầu không khí chung. Tuy nhiên, nhiều cư dân mạng không chấp nhận điều này.
Nick thấy những bình luận trên Reddit rất thú vị vì chúng cho thấy sự "chia rẽ" cực độ của cộng đồng người dùng:
Nick: Một số người đặc biệt thích 4o, trong khi những người khác lại tin chắc cho rằng GPT-5 tốt hơn. Sự nhiệt tình của mọi người dành cho lựa chọn của mình thật đáng kinh ngạc.
Phản hồi của người dùng cũng có nghĩa là Nick phải "hiệu chỉnh lại" một chút.
Nick có đề cập rằng anh ấy đã viết một blog cách đây một hoặc hai tuần, trong đó anh ấy dành nhiều thời gian để nói về "triết lý tối ưu hóa" của ChatGPT.
Một điểm mà ông muốn nhấn mạnh rất nhiều là:
Nick: Mục tiêu của chúng tôi không phải là giữ chân người dùng với sản phẩm càng lâu càng tốt; thay vào đó, chúng tôi giúp họ giải quyết các vấn đề dài hạn và đạt được các mục tiêu dài hạn. Điều này thường đồng nghĩa với việc rút ngắn thời gian sử dụng sản phẩm.
Vì vậy, khi Nick thấy mọi người coi GPT là người bạn duy nhất và tốt nhất của họ, anh không muốn chủ động thúc đẩy điều đó trong ChatGPT.
Ngược lại, Nick coi việc "ở lại quá lâu" này là một tác dụng phụ.
Ví dụ, vào ngày 16 tháng 8, khi OpenAI thông báo rằng họ sẽ làm cho GPT-5 ấm áp và thân thiện hơn so với trạng thái quá trang trọng trước đây, một số cư dân mạng đã phản đối việc làm cho GPT-5 trở nên quá cá nhân hóa.
Cách đo lường giá trị của sản phẩm đối với người dùng là một vấn đề đáng được quan tâm và nghiên cứu sâu rộng, và OpenAI cũng đang không ngừng khám phá vấn đề này.
Làm thế nào để có được 700 triệu người dùng
Bạn có thể nói CÓ mà không có bất kỳ sự mơ hồ nào
Alex Heath đặt ra một câu hỏi sâu sắc về thiết kế sản phẩm:
Alex: Làm thế nào để cân bằng sự căng thẳng giữa "mục tiêu sản phẩm" và "cách người dùng thực sự sử dụng sản phẩm"?
Nick cho biết khi hoạt động ở quy mô 700 triệu người dùng, bạn phải đối diện một thực tế: bạn có thể có những mục tiêu đúng đắn và trong sáng, và bạn cũng có thể nỗ lực hết sức để xây dựng sản phẩm theo những mục tiêu này.
Khi nói đến cách lựa chọn, Nick đã đề cập đến một nguyên tắc quan trọng - "thực sự hữu ích cho người dùng".
Đôi khi bạn thậm chí phải nói những điều mà người dùng có thể không thích nghe.
Dựa trên nguyên tắc này, OpenAI cũng đã thực hiện sê-ri điều chỉnh cho các sản phẩm của mình:
Ví dụ, OpenAI đã liên lạc với lượng lớn chuyên gia sức khỏe tâm thần ở nhiều quốc gia để tìm hiểu cách xử lý tình trạng mọi người lạm dụng sản phẩm hoặc sử dụng chúng ở trạng thái không lành mạnh.
Chúng tôi đã điều chỉnh hành vi của mô hình dựa trên điều này và ra mắt"lời nhắc nhở lạm dụng" cho mô hình. Khi người dùng sử dụng ChatGPT với tần suất cực cao, nó sẽ nhẹ nhàng nhắc nhở bạn.
Nick đã đề cập đến một điểm đặc biệt quan trọng khi trả lời những suy đoán của công chúng về việc liệu OpenAI có khám phá mô hình quảng cáo hay không:
Nick: Chúng tôi không thực sự có bất kỳ động lực cụ thể nào để bạn dành nhiều thời gian hơn cho sản phẩm của chúng tôi; mô hình kinh doanh của chúng tôi rất đơn giản: sản phẩm cơ bản là miễn phí, và nếu bạn muốn nhiều tính năng hơn, bạn sẽ đăng ký. Không có mục đích thứ yếu nào cả.
Theo nguyên tắc này, Nick cũng đề cập đến các tiêu chí để thử nghiệm sản phẩm tốt, đây cũng là một "thí nghiệm tư duy" mà họ thường đặt ra cho mình:
Nick: Nếu một người nào đó bạn biết đang trải qua thời kỳ khó khăn, có thể là vừa chia tay hoặc cảm thấy lạc lõng trong cuộc sống - bạn có thực sự, không do dự và tự tin giới thiệu người đó sử dụng ChatGPT không?
Nick nói rằng đối với OpenAI, đây là tiêu chuẩn. Họ sẽ tiếp tục làm điều đó cho đến khi có được sự tự tin, và họ sẽ không dừng lại cho đến lúc đó.
Tất nhiên, Nick cũng thừa nhận rằng đôi khi đây là một lựa chọn khó khăn.
Ví dụ, khi ai đó nhờ bạn tư vấn về cuộc sống hoặc gặp rắc rối, bạn có thể dễ dàng tắt những trường hợp sử dụng này và nói với người dùng rằng: "Xin lỗi, tôi không thể giúp bạn việc này".
Làm như vậy thực sự là "lối thoát dễ dàng", nhưng Nick và OpenAI rõ ràng muốn chọn con đường "khó khăn nhưng đúng đắn", đó là cung cấp một sản phẩm tốt cho những người không có nguồn lực và không có ai để trao đổi, để người dùng có thể "nói CÓ mà không cần mơ hồ".
GPT-5 đã được phát hành
Nó có gây hại cho ChatGPT không?
Alex: GPT-5 có gây ảnh hưởng đến việc sử dụng ChatGPT không? Thống kê nội bộ của bạn có cho thấy tăng tổng thể không? Lượng người dùng sử dụng nhiều nhất có giảm?
Đối diện câu hỏi của Alex Heath, Nick có vẻ hài lòng với hiệu suất của GPT-5:
Nick: Mức sử dụng và tăng trưởng có vẻ tốt và rất phù hợp với trực giác của chúng tôi; chúng tôi đã thấy tăng trưởng mạnh mẽ trong các cuộc gọi API vào ngày thứ hai - tức là các nhà phát triển đang xây dựng mọi thứ bằng GPT-5; trong ChatGPT, chúng tôi cũng thấy tăng trưởng rất tích cực.
Các phân khúc người dùng khác nhau cũng ảnh hưởng đến việc đánh giá sản phẩm, đó là lý do tại sao Nick đề cập rằng bạn có thể hơi bối rối khi xây dựng sản phẩm cho nhiều người dùng khác nhau:
Nick: Một mặt, có một nhóm nhỏ người dùng chuyên sâu, những người có phản hồi rất cho rằng về cách chúng tôi ra mắt GPT-5. Mặt khác, có một số lượng lớn người dùng bình thường hơn. Đối với họ, đây có thể là lần đầu tiên họ thực sự nhìn thấy và tiếp xúc với khái niệm "mô hình suy luận" và những ý tưởng mà nó có thể mang lại. Điều này cũng sẽ được phản ánh trong dữ liệu của chúng tôi.
Trong khi các bình luận của người dùng trên Reddit đang có nhiều luồng ý kiến trái chiều, GPT-5 mới chỉ được phát hành trong thời gian ngắn và Nick vẫn chưa muốn đưa ra kết luận, nhưng mọi chỉ báo đều tích cực.
Nick cho rằng rằng ngoài việc xem xét dữ liệu, chúng ta cũng cần phải "ở nơi có nhiều người dùng" vì dữ liệu có thể không đủ để phản ánh tâm lý của họ.
Alex Heath có vẻ không kiên nhẫn và hỏi:
Alex: Nếu chỉ báo tổng thể đều tốt, tại sao lại đưa 40 trở lại? Tôi cho rằng mô hình lưu trữ có chi phí. Nếu chỉ báo không bị ảnh hưởng, tại sao lại làm vậy?
Nick trả lời rằng cách để xây dựng một sản phẩm tuyệt vời là "phục vụ cả hai mục đích cùng một lúc":
Nick: Một bên là người dùng trung bình, như gia đình tôi chẳng hạn, có thể còn xa lạ với AI; bên kia là những người dùng cực kỳ nặng. "Điểm trung dung kỳ lạ" giữa hai bên thường không phải là một vị trí tốt.
Đây là lý do tại sao Nick so sánh ChatGPT với macOS: anh ấy sẽ tham khảo cách các sản phẩm như vậy xử lý vấn đề này.
Nick không ngần ngại thừa nhận rằng việc duy trì mô hình cũ đi kèm với chi phí. Tuy nhiên, anh ấy ưu tiên đầu tư dài hạn và xây dựng một sản phẩm xuất sắc. Việc tập trung quá nhiều vào chỉ báo ngắn hạn thường là nguyên nhân dẫn đến thất bại của sản phẩm.
Alex Heath đã đề cập đến sự trở lại của "lựa chọn mô hình". Mặc dù cảm nhận được gánh nặng nhận thức do "chuyển đổi mô hình" gây ra, ông vẫn vui mừng về điều đó.
Đáp lại, Nick cho biết "việc lựa chọn mô hình" sẽ được cung cấp cho những người dùng nhiều, tức là những người có thể hiểu mô hình và sẵn sàng giải quyết sự phức tạp của việc lựa chọn mô hình.
Nhưng đối với người dùng thông thường, họ không cần phải lo lắng về việc "nên chuyển sang chế độ nào"; họ có thể trực tiếp hỏi mô hình các câu hỏi hoặc yêu cầu mô hình giúp thực hiện một số việc.
“Chúng tôi giữ mọi thứ đơn giản cho 90% người dùng, sau đó cung cấp cho những người dùng hay nói nhiều hơn danh sách đầy đủ mà họ muốn. Đó là một hành động cân bằng”, Nick nói.
Đây cũng là một phương pháp tốt để giải quyết những ý kiến trái chiều của cư dân mạng về GPT-5.
Tham khảo:
https://www.theverge.com/decoder-podcast-with-nilay-patel/758873/chatgpt-nick-turley-openai-ai-gpt-5-interview
Bài viết này được trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Xinzhiyuan, biên tập viên: Yuanyu và được 36Kr cấp phép xuất bản.





