Liệu GPT-5 có phải là sự kết hợp của tất cả những điều này không? !
Ngay sau khi phát hành "Bộ luật lập trình mạnh mẽ nhất", OpenAI đã tổ chức sự kiện "Hỏi và trả lời" trên Reddit.
Jerry Tworek, phó chủ tịch nghiên cứu của công ty, đã cung cấp một cái nhìn thoáng qua về tin tức mới nhất về mẫu xe cơ sở thế hệ tiếp theo, GPT-5:
Để giảm việc chuyển đổi mô hình, chúng tôi có kế hoạch tích hợp Codex, Operator, Deep Research và Memory trong tương lai .
Ngoài ra, các thành viên khác đội ngũ Codex cũng đã bắt đầu tiết lộ thông tin, chẳng hạn như:
Codex ban đầu là một dự án phụ, được triển khai khi họ nhận ra rằng các mô hình chưa được sử dụng hết công suất trong quy trình làm việc nội bộ của họ;
Khi sử dụng Codex nội bộ, hiệu quả lập trình tăng khoảng 3 lần;
OpenAI đang khám phá các tùy chọn giá linh hoạt, bao gồm cả hình thức trả tiền khi sử dụng.
o3-pro hoặc codex-1-pro cuối cùng sẽ được ra mắt khi khả năng đội ngũ cho phép;
…
Được thôi, chúng ta cùng ăn dưa nhé.
Trả lời 10 câu hỏi chính
Nhìn chung, đội ngũ OpenAI lần chia sẻ thông tin chi tiết về Codex và kế hoạch phát triển tương lai của công ty.
Để bám sát tối đa vào ý định ban đầu của người hỏi, chúng ta sẽ bắt đầu cuộc trò chuyện trực tiếp dưới dạng đối thoại.
Câu hỏi 1 : Tại sao công cụ Codex CLI được viết bằng TypeScript thay vì Python?
A1 : Bởi vì các nhà phát triển đã quen thuộc với TypeScript và nó phù hợp với UI (bao gồm cả giao diện đầu cuối). Tuy nhiên, trong tương lai sẽ có một công cụ hiệu suất cao hỗ trợ liên kết bằng nhiều ngôn ngữ và các nhà phát triển có thể mở rộng bằng ngôn ngữ mà họ quen thuộc .
Câu hỏi 2 : Tại sao bạn lại chọn chạy mã trên đám mây thay vì chạy Agent cục bộ (chẳng hạn như sử dụng MCP)?
A2 : Mặc dù Codex CLI có thể chạy Agent cục bộ nhưng thường chỉ chạy một luồng do hạn chế về hiệu suất máy tính. Chạy trên đám mây cho phép song song hóa và thử nghiệm, cho phép mô hình chạy mã một cách an toàn mà không cần sự giám sát của con người.
Câu hỏi 3 : Khi sử dụng Codex, đội ngũ đã khám phá ra những thay đổi mô hình nào khác biệt so với “mã hóa rung cảm” hiện tại? Nguồn cảm hứng để phát triển công cụ này là gì?
A3 : Sự khác biệt chính là có thể tạo ra lượng lớn phiên bản mã cùng một lúc, sau đó có thể chọn phiên bản có chất lượng mã tốt nhất. Giống như bạn có thể đào tạo một số lượng lớn lập trình viên trẻ thích lập trình, sau đó chọn ra phiên bản mã tốt nhất từ họ. Trên thực tế, công cụ Codex bắt đầu như một dự án phụ của một nhóm kỹ sư cảm thấy thất vọng vì không tận dụng hết các mô hình trong công việc hàng ngày tại OpenAI.
Câu hỏi 4 : Liệu GPT-5 có thể làm được nhiều việc hơn là chỉ hỗ trợ viết mã mà còn có thể thực hiện nhiều nhiệm vụ hơn trên máy tính không? Nói cách khác, liệu nó có trở thành trợ lý thực sự thay vì chỉ cung cấp lời khuyên không?
A4 : GPT-5 là model cơ bản thế hệ tiếp theo của chúng tôi. Mục tiêu cốt lõi của nó là nâng cao khả năng của các mô hình hiện có và giảm việc chuyển đổi mô hình.
Đã có sản phẩm có thể thực hiện nhiệm vụ trên máy tính - Operator. Mặc dù vẫn đang trong giai đoạn xem trước nghiên cứu, nhưng nó sẽ được cải thiện trong tương lai và trở thành một công cụ rất hữu ích.
Kế hoạch trong tương lai là kết hợp các công cụ hiện có như Codex, Operator, Deep Research, Memory để chúng trở thành một khối thống nhất.
Câu hỏi 5 : Codex chỉ phù hợp với các kỹ sư cao cấp phải không?
A5 : Có lẽ phù hợp hơn với những người muốn giải quyết những vấn đề tẻ nhạt hơn là những vấn đề siêu khó.
Câu hỏi 6 : Codex có tận dụng hiệu quả kiến thức mới nhất về thư viện và các nguồn tài nguyên khác thông qua tìm kiếm không?
A6 : Hiện tại, nó chủ yếu tận dụng thông tin được tải vào thời gian chạy của container, bao gồm kho lưu trữ GitHub và các tệp khác được tải trong quá trình thiết lập container. Nó không cung cấp quyền truy cập trực tiếp vào tài liệu thư viện mới nhất hoặc thông tin thời gian thực thông qua tìm kiếm.
Tuy nhiên, chúng tôi đang xem xét làm thế nào để mô hình có thể tận dụng tốt hơn kiến thức mới nhất. Trong tương lai, công nghệ thế hệ tăng cường truy xuất (RAG) có thể được kết hợp để giải quyết vấn đề thông tin lỗi thời bằng cách tham chiếu động đến các cơ sở kiến thức bên ngoài.
Câu hỏi 7 : OpenAI có phương pháp nghiên cứu nào tương tự như phương pháp được đề cập trong bài báo “Absolute Zero: Reinforced Self-play Reasoning with Zero Data” không, chẳng hạn như cho phép LLM mã hóa cải thiện trình độ mã hóa của mình thông qua “trò chơi tự thân” và học tăng cường (RL)?
A7 : Trong dự án Codex, chúng tôi đã sử dụng phương pháp học tăng cường để cải thiện khả năng mã hóa, phong cách mã hóa và độ chính xác báo cáo mô hình.
Là những nhà nghiên cứu trong lĩnh vực học tăng cường, chúng tôi rất hào hứng với hướng nghiên cứu này và cho rằng học tăng cường có triển vọng ứng dụng rộng rãi trong lĩnh vực LLM và mã hóa.
Câu hỏi 8 : Nếu chúng ta định lượng sự cải thiện về hiệu quả lập trình đạt được nhờ Codex, thì hiệu quả phát triển tổng thể đã được cải thiện bao nhiêu?
A8 : Vẫn còn quá sớm, nhưng dữ liệu nội bộ cho thấy nếu các dự án tận dụng tối đa các tác nhân Codex ngay từ đầu, thì việc cung cấp mã và tính năng có thể tăng lên khoảng 3 lần.
Các biện pháp thực hành kỹ thuật phần mềm tốt quan trọng hơn bao giờ hết, bao gồm phân chia rõ ràng mô-đun mã, thử nghiệm đầy đủ các chức năng chính, quy trình thử nghiệm hiệu quả và cấu trúc mã giúp dễ dàng xem xét. Khi những yếu tố này được kết hợp với khả năng tự động hóa của Codex, hiệu quả phát triển có thể được cải thiện đáng kể.
Câu hỏi 9 : Đội ngũ Codex cho rằng kỹ thuật phần mềm sẽ như thế nào trong 10 năm tới?
A9 : Chúng tôi mong đợi có thể chuyển đổi các yêu cầu phần mềm thành các phiên bản phần mềm có thể chạy được một cách hiệu quả và đáng tin cậy.
Câu hỏi 10 : Làm thế nào để đảm bảo Codex được sử dụng để nâng cao năng lực của các nhà phát triển con người thay vì thay thế họ, đặc biệt là các nhà phát triển mới vào nghề, những người dựa vào phương pháp học bằng thực hành và các lập trình viên tự học?
A10 : Bằng cách cung cấp nhân vật tương tự như một giáo viên giỏi, chúng tôi giảm bớt khó khăn cho người mới bắt đầu và giúp thế hệ lập trình viên mới học nhanh hơn.
Các mô hình hiện tại, chẳng hạn như Codex, vẫn còn lâu mới có thể thay thế được con người, những người có trí nhớ dài hơn và kiến thức bối cảnh rộng hơn. Nếu người mẫu có thể đảm nhiệm một số công việc, con người sẽ có nhiều cơ hội hơn để tập trung vào những gì họ thực sự giỏi.
Cuối cùng, đội ngũ cho biết họ sẽ ra mắt chương trình tín dụng API miễn phí cho người dùng Plus/Pro để sử dụng Codex CLI.
Để biết thêm câu trả lời, vui lòng truy cập trang chủ của blogger có tiếng Bald Brother, nơi chủ yếu giải thích các chi tiết chức năng của Codex.
Một điều nữa
Cùng lúc đó, OpenAI chính thức phát hành "Hướng dẫn bắt đầu sử dụng Codex" .
Nó chủ yếu bao gồm các nội dung sau:
Kiến thức cơ bản về Codex
Làm thế nào để kết nối GitHub của bạn?
Làm thế nào để gửi nhiệm vụ tới Codex và thực hiện chúng?
Một số mẹo khi sử dụng từ gợi ý là gì?
Liên kết tham khảo:
[1]https://www.reddit.com/r/ChatGPT/comments/1ko3tp1/ama_with_openai_codex_team/
[2]https://x.com/AndrewCurran_/status/1923448161621696712
[3]https://x.com/btibor91/status/1923511453002145854[4]https://x.com/OpenAIDevs/status/1923492740526112819
Bài viết này trích từ tài khoản công khai WeChat "Quantum Bit" , tác giả: Tập trung vào công nghệ tiên tiến và được 36Kr cho phép xuất bản.




