Karpathy hướng dẫn bạn cách làm cho ChatGPT xứng đáng với "giá vé" 200 USD. Các kỹ sư khởi nghiệp tiết lộ các khả năng cốt lõi của ChatGPT

avatar
36kr
06-03
Bài viết này được dịch máy
Xem bản gốc

Chuyên gia AI Karpathy đích thân hướng dẫn sử dụng mô hình ChatGPT: o3 phù hợp để xử lý nhiệm vụ phức tạp, 4o có năng lực giải quyết các câu hỏi hàng ngày và GPT-4.1 được sử dụng để viết mã. Eric Hayes tiết lộ hệ thống bộ nhớ cốt lõi đằng sau ChatGPT, giúp ChatGPT hiểu bạn hơn.

Bạn có thể đã sử dụng ChatGPT và rất thích nó, nhưng rất có thể bạn đang sử dụng phương pháp không đúng cách!

Đừng lo lắng, đây là những gì Andrej Karpathy, người sáng lập OpenAI, đã nói. Ông "đam mê" việc phổ cập AI và đã có một động thái khác.

Lần Andrej Karpathy sử dụng hình ảnh để hướng dẫn bạn cách chọn mô hình ChatGPT!

Như chúng ta đã biết, OpenAI đã đặt cho mô hình này rất nhiều tên: GPT-4o, o3, o4-mini, o4-mini-high, o1 pro mode...

Nó chói lóa đến nỗi mọi người không thể phân biệt được sự khác nhau giữa các mô hình này.

Thậm chí do không thể chọn đúng model nên việc sử dụng hàng ngày không đáng với "mức giá" 20 USD Plus mỗi tháng, chưa kể đến gói thành viên Pro 200 USD.

Nhiều người không biết rằng các mô hình ChatGPT này rất khác nhau, ví dụ:

o3 là ​​lựa chọn tốt nhất để giải quyết các vấn đề quan trọng hoặc khó khăn.

Đây là mô hình có khả năng suy luận rất mạnh, mạnh hơn 4o. Nếu bạn sử dụng ChatGPT một cách chuyên nghiệp và không sử dụng o3, bạn có thể sẽ bị lỗ.

4o và o4 là hai thứ hoàn toàn khác nhau.

Ngay cả Karpathy vĩ đại cũng phải nói đùa rằng cách đặt tên của OpenAI thực sự gây nhầm lẫn.

4o là lựa chọn tốt cho những người làm việc hàng ngày để giải quyết các vấn đề từ đơn giản đến trung bình. Tuy nhiên, o4 hiện chỉ có phiên bản mini, không tốt bằng o3.

Đừng sử dụng những mô hình này!

Karpathy cũng nhấn mạnh rằng các mô hình như o4-mini, o4-mini-high và o1-pro không nên được sử dụng vì chúng không mang lại lợi ích gì cả!

Karpathy cho biết ông thậm chí còn không hiểu tại sao OpenAI lại phát hành o4-mini vào thời điểm này.

Các chuyên gia AI hướng dẫn bạn cách chơi ChatGPT

Dựa trên kinh nghiệm của mình và sự khác biệt giữa các mô hình ChatGPT, Karpathy cung cấp "Hướng dẫn sử dụng" sau đây.

Bất kỳ câu hỏi đơn giản nào

Ví dụ, "Những loại thực phẩm nào giàu chất xơ?" => Sử dụng 4o (khoảng 40% lượng Karpathy sử dụng)

Bất kỳ vấn đề khó khăn hoặc quan trọng nào, miễn là tôi sẵn sàng chờ thêm một chút nữa

Giống như “Giúp tôi hiểu vấn đề thuế này…”) => sử dụng o3 (cũng chiếm khoảng 40% mức sử dụng của Karpathy)

Khi viết mã tùy ý hoặc thay đổi mã theo ý bạn

Ví dụ: “Đổi mã này thành…” => Sử dụng GPT-4.1 (khoảng 10%)

Bạn muốn hiểu sâu hơn về một chủ đề nào đó?

Tôi hy vọng GPT dành 10 phút, kiểm tra nhiều liên kết và tóm tắt thông tin đầy đủ.

Ví dụ, “Giúp tôi hiểu về sự trỗi dậy và sụp đổ của Luminar” => Nghiên cứu sâu (khoảng 10%)

Lưu ý: Nghiên cứu sâu không phải là một phiên bản trong trình chọn mô hình (!!!), mà là một chức năng được bật trong công cụ Công cụ.

Ở cấp độ cơ bản nhất, nó dựa trên o3, nhưng Karpathy cho rằng nó không hoàn toàn giống với việc sử dụng trực tiếp o3 (mặc dù Karpathy không chắc chắn).

Nếu bạn nắm vững cách sử dụng đúng mô hình do Karpathy đưa ra, bạn sẽ thấy ChatGPT ngày càng tốt hơn.

Và càng sử dụng, bạn sẽ thấy ChatGPT ngày càng hiểu bạn hơn, như thể nó đã trở thành "Jarvis" của bạn và ghi nhớ mọi thứ về cuộc sống hàng ngày của bạn.

Lý do đằng sau điều này thực chất là vì ChatGPT có trí nhớ siêu phàm, đó là lý do tại sao mọi người vẫn thích sử dụng ChatGPT mặc dù tên gọi của nó khá "khó hiểu", và không còn nghi ngờ gì nữa, đây là công cụ AI có hoạt động hàng tuần cao nhất.

Ra mắt “Siêu trí nhớ” của ChatGPT

ChatGPT sẽ hiểu bạn hơn, có khả năng ghi nhớ sở thích trước đây của bạn và thậm chí kết nối ngữ cảnh trong nhiều cuộc trò chuyện.

Không chỉ có một cửa sổ ngữ cảnh đơn giản; còn có một hệ thống bộ nhớ phức tạp và tinh vi đang hoạt động.

Gần đây, Eric Hayes, một kỹ sư của một công ty khởi nghiệp, đã tiết lộ hệ thống bộ nhớ phức tạp đằng sau ChatGPT thông qua một bài đăng trên blog.

Hôm nay, hãy theo chân Eric Hayes để phân tích sâu hơn về "phép thuật trí nhớ" giúp ChatGPT trở nên nổi bật!

Hệ thống bộ nhớ của ChatGPT giúp trải nghiệm vượt trội hơn nhiều so với các mô hình ngôn ngữ lớn (LLM) khác.

Điều này chủ yếu là do nó chia hệ thống bộ nhớ thành hai loại: "Bộ nhớ đã lưu" và "Lịch sử trò chuyện".

Bộ nhớ đã lưu

Hãy tưởng tượng rằng bạn cho ChatGPT biết sở thích của mình và nó sẽ ghi nhớ chúng. Đây là chức năng "lưu bộ nhớ".

Đây là một hệ thống đơn giản, có thể điều khiển bởi người dùng, nơi bạn có thể cập nhật những ký ức này bằng các hướng dẫn rõ ràng như "Hãy nhớ rằng tôi là một kỹ sư phần mềm" hoặc "Khi tôi giới thiệu một công thức nấu ăn, hãy nhớ rằng tôi là người ăn chay".

Những ký ức này được đưa vào lời nhắc hệ thống như những sự kiện ảnh hưởng đến các cuộc trò chuyện tiếp theo. Ví dụ, bạn có thể để ChatGPT nhớ rằng bạn thích những câu trả lời ngắn gọn hoặc bạn là chuyên gia về lập trình Rust và nó sẽ điều chỉnh các phản hồi dựa trên những sở thích này.

ChatGPT cung cấp giao diện người dùng đơn giản cho phép bạn xem và xóa những ký ức này. Bạn cũng có thể yêu cầu ChatGPT xóa những ký ức đã lưu thông qua lệnh.

Tính năng này cũng thông minh. Nó thực hiện kiểm tra sự trùng lặp và không nhất quán ở mức tối thiểu.

Ví dụ, nếu bạn nói "Tôi là kỹ sư phần mềm", nó có thể lưu thông tin đó, nhưng nếu bạn nói "Tôi không phải là kỹ sư phần mềm", nó sẽ từ chối và yêu cầu bạn làm rõ.

Tuy nhiên, đối với những thông tin có liên quan chặt chẽ nhưng khác nhau (như "kỹ sư phần mềm", "kỹ sư giao diện"), thì chúng được phép cùng tồn tại.

Hệ thống này được triển khai thông qua một công cụ gọi là "bio tool". Eric Hayes đã đảo ngược hệ thống bộ nhớ của ChatGPT và phát hiện ra phương pháp này gọi là bio.

Lịch lịch sử

Hệ thống "lịch sử trò chuyện" phức tạp hơn nhiều so với "lưu bộ nhớ" và có thể là chìa khóa để cải thiện khả năng phản hồi của ChatGPT. Nó có thể được chia thành ba hệ thống con:

1. Lịch sử phiên hiện tại

Đây giống như một "bộ nhớ ngắn hạn" ngắn hạn cho bot. Nó ghi lại các tin nhắn gần đây nhất của người dùng trong phiên hiện tại.

Nhật ký này có kích thước nhỏ, chỉ chứa các tin nhắn của ngày hôm trước, thường ít hơn 10 tin nhắn.

Nó có thể tham chiếu trực tiếp đến tin nhắn được người dùng gửi trong phiên hiện tại.

2. Lịch sử thoại

Hệ thống này có nhiệm vụ ghi nhớ ngữ cảnh liên quan từ các cuộc trò chuyện trước đây của bạn với ChatGPT.

Và nó có thể thực hiện bộ nhớ trò chuyện chéo, ChatGPT có thể tham chiếu các tin nhắn trực tiếp mà bạn đã gửi trong các cuộc trò chuyện khác.

Khi thử nghiệm, Eric Hayes phát hiện ChatGPT có thể trích dẫn chính xác tin nhắn trong vòng hai tuần.

Sau hai tuần, thông thường nó chỉ cung cấp bản tóm tắt tin nhắn của bạn thay vì trích dẫn trực tiếp.

Việc truy xuất tin nhắn được lập chỉ mục theo "tóm tắt cuộc trò chuyện" và "nội dung tin nhắn".

Điều này có nghĩa là ngay cả khi bạn không nhớ chính xác các từ, ChatGPT vẫn có thể tìm thấy thông tin có liên quan miễn là bạn mô tả nội dung hoặc chủ đề của cuộc trò chuyện.

Đối với các cuộc trò chuyện cũ hơn, hệ thống có thể lưu trữ thông tin suy đoán, cung cấp ngữ cảnh nhỏ hơn và ít cụ thể hơn.

3. Thông tin chi tiết về người dùng

Đây có thể là dạng bộ nhớ mạnh mẽ và "thông minh" nhất dành cho ChatGPT!

Đây là phiên bản tiên tiến hơn và khó hiểu hơn của việc "bảo tồn trí nhớ".

Những hiểu biết này được hệ thống tự động tạo ra bằng cách phân tích hành vi và câu hỏi của người dùng qua nhiều cuộc trò chuyện. Chúng sẽ bao gồm phạm vi thời gian và mức độ tin cậy.

Thông tin chi tiết về người dùng có thể nắm bắt thông tin chuyên sâu như lĩnh vực chuyên môn, sở thích và phong cách đặt câu hỏi của bạn.

Ví dụ, nó có thể ghi rằng bạn có "kinh nghiệm và kiến ​​thức sâu rộng về lập trình Rust" hoặc "thích câu trả lời ngắn gọn".

Với những thông tin chi tiết này, ChatGPT có thể giảm thiểu những tương tác gây khó chịu và trình bày thông tin theo cách mà người dùng có thể dễ dàng hiểu được.

Eric Hayes cho rằng hệ thống phân tích thông tin người dùng có thể chịu trách nhiệm cho hơn 80% sự cải thiện về trí thông minh của ChatGPT!

Eric Hayes cũng phát hiện ra rằng những thông tin chi tiết này có thể không được tạo ra theo thời gian thực mà được cập nhật thông qua xử lý hàng loạt (chẳng hạn như nhiệm vụ cron chạy một lần một tuần).

Nó rút những thông tin chi tiết độc đáo và hữu ích từ lượng lớn tin nhắn lịch sử bằng cách mô hình hóa các truy vấn của người dùng như một vấn đề tối ưu hóa cụm.

Điều này có ý nghĩa gì đối với trải nghiệm của người dùng?

Chính những hệ thống bộ nhớ phức tạp này khiến ChatGPT trở nên "dễ sử dụng" đến vậy!

Tiết kiệm bộ nhớ cho phép bạn thiết lập tùy chọn trực tiếp và để ChatGPT tùy chỉnh phản hồi cho bạn.

Thông tin chi tiết của người dùng tự động hóa quá trình này. Ngay cả khi bạn không nói rõ, ChatGPT vẫn có thể tự động điều chỉnh phản hồi dựa trên hành vi lịch sử của bạn, cung cấp giải thích phù hợp hơn và tránh các câu hỏi lặp lại.

Hệ thống lịch sử trò chuyện đảm bảo tính liên tục của cuộc trò chuyện, cho phép bạn xem lại các chủ đề cũ trong khi ChatGPT vẫn duy trì kiến ​​thức chung về các tương tác trước đó, tránh các tương tác lặp lại, luẩn quẩn hoặc mâu thuẫn.

Có thể nói rằng hệ thống bộ nhớ của ChatGPT vượt qua một cửa sổ ngữ cảnh đơn giản và cải thiện đáng kể trải nghiệm của người dùng bằng cách lưu trữ và truy xuất thông tin theo cách phân cấp và thông minh, khiến người dùng cảm thấy giống như một đối tác thông minh có thể học hỏi và phát triển.

Tham khảo

https://x.com/karpathy/status/1929597620969951434

https://macro.com/app/md/54115a42-3409-4f5b-9120-f144d3ecd23a

Bài viết này trích từ tài khoản công khai WeChat "Xinzhiyuan" , tác giả: Dinghui và được 36Kr cho phép xuất bản.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận