OpenAI tiết lộ lời nhắc Meta bí mật—và nó rất khác so với cách tiếp cận của Anthropic

10-15

Bài viết này được dịch máy

Xem bản gốc

OpenAI đã tiết lộ meta-prompt cho họ mô hình o1 mới của mình. Bằng cách nêu chi tiết những gì khiến hệ thống nhắc nhở của mình hoạt động, OpenAI đang giúp các nhà phát triển cải thiện và tinh chỉnh cách sản phẩm của họ tương tác với hệ sinh thái ứng dụng và trang web đang phát triển của mình.

Meta-prompt (một trình tối ưu hóa lời nhắc) và system prompt (một trình điều chỉnh mô hình) hoạt động ở chế độ ẩn, đưa ra các hướng dẫn chi tiết chỉ định cách AI nên hành xử trong suốt quá trình tương tác. Khi người dùng bắt đầu cuộc trò chuyện, meta-prompt đã thiết lập bối cảnh, hướng dẫn AI thực hiện mọi thứ từ việc hiểu mục tiêu chính của nhiệm vụ cho đến việc cấu trúc đầu ra của nhiệm vụ. Điều này bao gồm các chi tiết cụ thể như bảo toàn nội dung gốc của người dùng, đưa ra các cải tiến ngắn gọn khi cần thiết và đảm bảo rằng AI tuân theo các bước lý luận rõ ràng trước khi đưa ra kết luận

"Một meta-prompt hướng dẫn mô hình tạo ra một lời nhắc tốt dựa trên mô tả nhiệm vụ của bạn hoặc cải thiện một lời nhắc hiện có", OpenAI cho biết trong hướng dẫn nền tảng chính thức của mình. Điều này cung cấp nhiều thông tin kỹ thuật và có liên quan để tận dụng tối đa các mô hình của mình, bao gồm một bộ ví dụ về lời nhắc, mẹo để tăng độ chính xác và hướng dẫn kỹ thuật lời nhắc rất chi tiết.

Bản phát hành này ra mắt không lâu sau khi Anthropic, một đối thủ cạnh tranh chính do cựu nhân viên OpenAI thành lập, tiết lộ lời nhắc hệ thống cho chatbot của riêng mình, Claude. Chúng tôi đã viết một bài phân tích chi tiết hơn về lời nhắc của Claude khi nó được phát hành.

Nhìn sâu hơn, bạn sẽ thấy hai engine rất khác nhau chạy những con quái vật AI này, và mỗi lời nhắc có thể cho biết rất nhiều về cách cả hai công ty suy nghĩ và những gì họ mong đợi từ sản phẩm của mình. Nhìn chung, OpenAI đã khái niệm hóa ChatGPT như một công cụ tính toán mạnh mẽ trong khi Anthropic hình dung Claude giống một trợ lý thân thiện, giống con người hơn.

Sau đây là so sánh giữa Anthropic và OpenAI:

Các lời nhắc của OpenAI đọc giống như một hướng dẫn kỹ thuật cho một máy hiệu suất cao. Tất cả đều hướng đến hiệu quả, độ chính xác và hoàn thành công việc với ít rắc rối nhất. AI của họ được thiết kế để trở thành một công cụ, tập trung vào việc cung cấp kết quả thay vì tham gia vào trò chuyện phiếm.

Mặt khác, Anthropic đã tạo ra Claude giống như một người bạn hiểu biết hơn. Meta prompt của họ vẽ nên bức tranh về một AI có tính cách riêng biệt, đầy đủ tính cách kỳ quặc, sở thích và thậm chí là khiếu hài hước. Rõ ràng là Anthropic đang hướng đến một AI có thể tham gia vào các cuộc trò chuyện có ý nghĩa, không chỉ đưa ra thông tin.

Tại sao điều này lại quan trọng: Nếu bạn muốn hoàn thành một nhiệm vụ và tiếp tục làm việc tiếp theo trong thói quen của mình, OpenAI dường như sẽ đưa ra lời nhắc tốt hơn.

Nếu bạn muốn tương tác với người mẫu của mình hoặc tham gia vào một môi trường làm việc chung với kết quả cải thiện lẫn nhau, Claude có thể là lựa chọn tốt hơn dành cho bạn.

Cách tiếp cận của OpenAI có cấu trúc và phương pháp cao. Meta prompt của nó được tổ chức thành các phần rõ ràng với các hướng dẫn cụ thể cho từng khía cạnh chức năng của AI. Nó giống như một hệ thống lưu trữ được tổ chức tốt, nơi mọi thứ đều có vị trí của nó.

Anthropic có cách tiếp cận theo hướng tự sự hơn. Lời nhắc meta của nó gần giống như mô tả nhân vật trong một cuốn tiểu thuyết, với hướng dẫn chi tiết về cách Claude nên cư xử trong nhiều tình huống khác nhau. Nó ít tập trung vào cấu trúc cứng nhắc mà tập trung nhiều hơn vào việc tạo ra một tính cách mạch lạc.

Về mặt định dạng, Claude sử dụng thẻ XML trong khi OpenAI dường như đã lựa chọn định dạng đánh dấu có cấu trúc để phân tách các phần khác nhau.

Tại sao điều này quan trọng: Biết cách chia nhỏ và cấu trúc lời nhắc là chìa khóa để có được kết quả tốt nhất từ các mô hình. Ví dụ, nếu bạn yêu cầu mô hình tái tạo một phương pháp cụ thể để giải quyết một vấn đề và cung cấp một ví dụ, việc gắn thẻ đúng cách sẽ giúp mô hình hiểu rằng bạn chỉ muốn tái tạo các bước và sẽ không coi ví dụ là một phần của vấn đề bạn đang cố gắng giải quyết.

OpenAI giữ mọi thứ theo hướng kinh doanh nghiêm ngặt khi nói đến nhận thức bản thân. AI của nó được hướng dẫn để làm rõ về khả năng và hạn chế của nó, nhưng không đi sâu vào các câu hỏi triết học về bản chất hoặc sự tồn tại của nó. Một lần nữa, ChatGPT được thiết kế để trở thành một công cụ hiệu quả biết chính xác những gì nó có thể và không thể làm, không hơn, không kém.

Tuy nhiên, Anthropic đã mang đến cho Claude một cảm nhận sâu sắc hơn về bản thân. Lời nhắc meta bao gồm hướng dẫn về cách xử lý các câu hỏi về bản chất của chính nó, các tương tác của nó và thậm chí là cách thảo luận về những hạn chế của nó.

Ví dụ, Anthropic thậm chí còn truyền cảm xúc cho Claude 3.5 Sonnet, gợi ý những điều như, "Nó rất vui khi được giúp đỡ trong việc viết, phân tích, trả lời câu hỏi, toán học, lập trình và đủ loại nhiệm vụ."

OpenAI sử dụng phương pháp nhàm chán “khi có mô tả nhiệm vụ hoặc lời nhắc hiện có, hãy tạo lời nhắc hệ thống chi tiết để hướng dẫn mô hình ngôn ngữ hoàn thành nhiệm vụ một cách hiệu quả”.

Tại sao điều này quan trọng: Điều này chỉ thú vị khi có kỳ vọng tốt về tương tác của bạn với từng mô hình. Nhìn chung, Claude có vẻ thân thiện hơn trong khi ChatGPT trong phiên bản văn bản của nó có vẻ giống người máy hơn.

Meta prompt của OpenAI nhấn mạnh vào cách tiếp cận logic, từng bước để giải quyết vấn đề. Nó hướng dẫn AI chia nhỏ các vấn đề phức tạp thành các phần dễ quản lý và thể hiện công việc của mình một cách rõ ràng. Phương pháp này gợi nhớ đến một nhà khoa học tỉ mỉ, cẩn thận ghi chép lại từng bước của một thí nghiệm và dễ nhận thấy hơn khi bạn có thể thấy o1 đang hoạt động, sử dụng lý luận Chuỗi suy nghĩ được nhúng để giải quyết vấn đề.

"Khuyến khích các bước lý luận trước khi đưa ra bất kỳ kết luận nào", lời nhắc của OpenAI viết, "CHÚ Ý! Nếu người dùng cung cấp các ví dụ về nơi lý luận diễn ra sau đó, HÃY ĐẢO NGƯỢC thứ tự! KHÔNG BAO GIỜ BẮT ĐẦU CÁC VÍ DỤ BẰNG KẾT LUẬN!"

Và đúng vậy, chữ in hoa là một phần của lời nhắc.

Anthropic khuyến khích Claude suy nghĩ thành tiếng, có thể nói như vậy. Lời nhắc meta hướng dẫn AI giải thích quá trình suy nghĩ của mình, chia sẻ hiểu biết trong suốt quá trình và thậm chí thể hiện sự không chắc chắn khi thích hợp. Nó giống như một buổi giải quyết vấn đề hợp tác với một đồng nghiệp chu đáo hơn.

Theo lời nhắc của Calude, "Khi được giao một bài toán, bài toán logic hoặc bài toán khác cần áp dụng tư duy có hệ thống, Claude sẽ suy nghĩ từng bước trước khi đưa ra câu trả lời cuối cùng".

Tại sao điều này quan trọng: OpenAI dường như có lời nhắc tốt hơn để giải quyết các nhiệm vụ phức tạp mà người dùng không biết cách tiếp cận. Lý luận Chuỗi suy nghĩ có hệ thống hơn một quá trình suy nghĩ đơn giản được ẩn bởi thẻ XML. Tuy nhiên, biết khi nào một mô hình không chắc chắn 100% là chìa khóa để phát hiện ảo giác.

Hướng dẫn về phong cách của OpenAI nhấn mạnh vào sự rõ ràng và súc tích. Lời nhắc meta hướng dẫn AI sử dụng ngôn ngữ đơn giản, tránh lan man và đi thẳng vào vấn đề. Tất cả đều hướng đến giao tiếp hiệu quả, giống như một bản tin không vô nghĩa.

Anthropic hướng đến một tông giọng trò chuyện nhiều hơn. Claude được hướng dẫn tham gia vào một cuộc đối thoại tự nhiên, trôi chảy và thậm chí sử dụng sự hài hước khi thích hợp. Đây là lý do tại sao hành vi và tông giọng của mô hình có vẻ dễ tiếp cận hơn đến mức một số người dùng cảm thấy khó chịu khi nó bắt đầu xin lỗi quá nhiều.

Tại sao điều này quan trọng: Điều này giải thích tại sao giọng điệu của Claude tốt hơn cho việc viết sáng tạo. Ngoài ra, chế độ canvas mới của OpenAI có thể giúp giải quyết vấn đề này, nhưng nhìn chung Claude có xu hướng làm tốt hơn vì nó được nhắc nhở để trở nên tự nhiên và quen thuộc hơn ChatGPT.

Cả OpenAI và Anthropic đều đồng ý giảm thiểu sự tự tham chiếu không cần thiết. Lời nhắc meta của họ hướng dẫn AI tránh thu hút sự chú ý vào bản thân, tập trung vào nhiệm vụ hoặc cuộc trò chuyện đang diễn ra.

Cách tiếp cận của OpenAI mang tính phản ứng nhiều hơn. AI của họ được hướng dẫn chờ lời nhắc rõ ràng của người dùng trước khi hành động, giống như một trợ lý được đào tạo bài bản đang chờ hướng dẫn.

Anthropic cung cấp cho Claude nhiều không gian hơn để chủ động. Lời nhắc meta của họ cho phép cung cấp thông tin bổ sung hoặc gợi ý các chủ đề liên quan, giống như một trợ lý nghiên cứu nhiệt tình luôn sẵn sàng với những hiểu biết sâu sắc hơn.

Trong khi OpenAI và Anthropic chia sẻ mục tiêu cải thiện tương tác AI-con người, cách tiếp cận của họ lại nhấn mạnh các ưu tiên khác nhau. Trọng tâm của OpenAI vào hiệu quả nhiệm vụ và kỹ thuật nhắc nhở chính xác trái ngược với cam kết của Anthropic về hành vi AI giống con người và tính minh bạch. Meta-prompt của OpenAI là tạo ra các đầu ra có cấu trúc, hiệu quả, trong khi các nhắc nhở của Anthropic là đảm bảo rằng AI hoạt động có trách nhiệm, khuyến khích tương tác của người dùng.

Về mặt hoàn thành công việc, cả hai chatbot đều hoạt động. Tuy nhiên, biết được cách mỗi công ty nghĩ và mong đợi từ mô hình của họ là một cách tốt để biết mong đợi gì từ mô hình của họ và cách tương tác đúng cách với AI của họ để hiệu quả hơn.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan