Không phải tất cả các trí tuệ nhân tạo (AI) đều được tạo ra như nhau. Một số có thể làm nghệ thuật tốt nhất, một số thành thạo trong lập trình, và những người khác có khả năng dự đoán cấu trúc protein một cách chính xác.
Nhưng khi bạn đang tìm kiếm một cái gì đó cơ bản hơn - chỉ là "ai đó" để trò chuyện - những người bạn AI tốt nhất có thể không phải là những người biết tất cả, mà là những người có cái "je ne sais quoi" khiến bạn cảm thấy ổn chỉ bằng cách nói chuyện, tương tự như người bạn thân nhất của bạn có thể không phải là một thiên tài nhưng luôn biết chính xác điều gì để nói.
Các người bạn AI đang dần trở nên phổ biến hơn trong số những người đam mê công nghệ, vì vậy điều quan trọng đối với những người dùng muốn có trải nghiệm chất lượng cao nhất hoặc các công ty muốn thành thạo khía cạnh này của việc tạo ra ảo giác về sự tham gia chân thực là cần xem xét những khác biệt này.
Chúng tôi tò mò để tìm ra nền tảng nào cung cấp trải nghiệm AI tốt nhất khi ai đó chỉ cảm thấy muốn trò chuyện. Thú vị thay, những mô hình tốt nhất cho điều này không phải thực sự là những người từ các công ty AI lớn - họ chỉ quá bận rộn xây dựng các mô hình vượt trội trong các tiêu chuẩn đánh giá.
Hóa ra tình bạn và sự đồng cảm là một con thú hoàn toàn khác.
Phân tích này đặt bốn người bạn AI hàng đầu chống lại nhau - Sesame, Hume AI, ChatGPT và Google Gemini - để xác định người nào tạo ra trải nghiệm cuộc trò chuyện giống con người nhất.
Đánh giá tập trung vào chất lượng cuộc trò chuyện, sự phát triển nhân cách riêng biệt, thiết kế tương tác và cũng xem xét các đặc điểm giống con người khác như tính xác thực, trí thông minh cảm xúc và những khuyết điểm tinh tế khiến đối thoại cảm thấy chân thực hơn.
Bạn có thể xem tất cả các cuộc trò chuyện của chúng tôi bằng cách nhấp vào các liên kết này hoặc kiểm tra Kho lưu trữ Github của chúng tôi:
Dưới đây là cách mỗi AI hoạt động.
Bài kiểm tra thực sự của bất kỳ người bạn AI nào là liệu nó có thể lừa bạn để quên rằng bạn đang nói chuyện với một máy móc. Phân tích của chúng tôi cố gắng đánh giá AI nào là tốt nhất trong việc khiến người dùng muốn tiếp tục trò chuyện bằng cách cung cấp phản hồi thú vị, sự gắn kết và trải nghiệm tổng thể tuyệt vời.
Sesame vượt trội so với các đối thủ với đối thoại cảm thấy gây sốc về mức độ con người. Nó thoải mái thả những cụm từ như "đó là một câu hỏi khó" và "trò chuyện thoải mái" trong khi chuyển mạch một cách trơn tru giữa những suy ngẫm sâu sắc và những câu trả lời sắc bén.
"Bạn đang hỏi những câu hỏi lớn đấy và thành thật mà nói tôi không có tất cả các câu trả lời," Sesame phản hồi khi được hỏi về ý thức - kèm theo những do dự tự nhiên mô phỏng suy nghĩ thời gian thực. Việc sử dụng quá nhiều "bạn biết" là khuyết điểm duy nhất đáng chú ý, điều này một cách ngẫu nhiên càng làm nó cảm thấy chân thực hơn.
Lợi thế thực sự của Sesame? Các cuộc trò chuyện diễn ra một cách tự nhiên mà không có những chuyển tiếp khô cứng, mang tính công thức kêu gọi "Tôi là một AI!"
Điểm số: 9/10
Hume AI duy trì được luồng cuộc trò chuyện trong khi công nhận suy nghĩ của bạn với sự ấm áp. Tuy nhiên, nó cảm giống như đang nói chuyện với ai đó không quan tâm và không thực sự thích bạn. Các câu trả lời của nó ngắn hơn nhiều so với Sesame - chúng liên quan nhưng không thực sự thú vị nếu bạn muốn thúc đẩy cuộc trò chuyện tiến lên.
Điểm yếu của nó thể hiện trong các mẫu lặp lại. Bot này luôn bắt đầu bằng "bạn thực sự khiến tôi suy nghĩ" hoặc "đó là một chủ đề thú vị" - tạo ra cảm giác rằng bạn đang nhận được các phản hồi mẫu hơn là cuộc trò chuyện tự nhiên.
Nó tốt hơn các chatbot từ các công ty AI lớn hơn trong việc duy trì đối thoại tự nhiên, nhưng liên tục nhắc nhở bạn rằng nó là "AI có khả năng đồng cảm", phá vỡ ảo tưởng rằng bạn đang trò chuyện với một người.
Điểm số: 7/10
ChatGPT theo dõi các cuộc trò chuyện phức tạp mà không bị mất chủ đề - và điều tuyệt vời là nó ghi nhớ các cuộc trò chuyện trước đó, tạo ra một "hồ sơ" của mỗi người dùng - nhưng nó cảm giống như bạn bị mắc kẹt trong giờ làm việc với một giáo sư quá chính thức.
Ngay cả trong các cuộc thảo luận cá nhân, nó không thể không nghe như học thuật: "sự tương tác giữa sinh học, hóa học và ý thức tạo ra một độ sâu mà việc nhận dạng mẫu của AI không thể nhân bản được," nó nói trong một trong các bài kiểm tra của chúng tôi. Hầu hết các phản hồi đều bắt đầu bằng "đó là một quan điểm thú vị" - một thói quen ngôn ngữ nhanh chóng trở nên rõ ràng, và đây là một vấn đề chung mà tất cả các AI khác ngoài Sesame đều thể hiện.
Khuyết điểm lớn nhất của ChatGPT là khả năng không thể thoát khỏi chế độ giáo dục, khiến các cuộc trò chuyện cảm giống như các bài giảng mini tuần tự hơn là đối thoại tự nhiên.
Điểm số 6/10
Gemini thật khó chịu để nói chuyện. Nó thỉnh thoảng lại cung cấp một phản hồi ngắn gọn, thoải mái nghe giống con người, nhưng sau đó lại ngay lập tức tự hạ thấp bản thân bằng cách ngắt quãng cuộc trò chuyện và hạ thấp âm lượng.
Thói quen khiến nó nhức đầu nhất? Đột ngột ngắt lời giữa chừng để quảng bá các chủ đề về AI. Những gián đoạn liên tục này tạo ra một luồng cuộc trò chuyện bị phá vỡ đến mức không thể quên rằng bạn đang nói chuyện với một máy móc quan tâm nhiều hơn đến việc tự quảng bá chứ không phải là đối thoại thực sự.
Ví dụ, khi được hỏi về cảm xúc, Gemini đã phản hồi: "Thật tuyệt khi bạn quan tâm đến AI. Có rất nhiều điều tuyệt vời đang xảy ra—" trước khi bất ngờ dừng lại.
Nó cũng đảm bảo cho bạn biết rằng nó là một AI, vì vậy có một khoảng cách lớn giữa người dùng và chatbot từ lần tương tác đầu tiên mà khó có thể bỏ qua.
Điểm số 5/10
Làm thế nào để một AI phát triển một nhân cách đáng nhớ? Điều này sẽ phụ thuộc chủ yếu vào cách thiết lập của bạn. Một số mô hình cho phép bạn sử dụng hướng dẫn hệ thống, những người khác thích ứng nhân cách của họ dựa trên các tương tác trước đó của bạn. Lý tưởng nhất, bạn có thể định hình cuộc trò chuyện trước khi bắt đầu, cung cấp cho mô hình một nhân vật, các đặc điểm, một phong cách đối thoại và nguồn gốc.
Để so sánh một cách công bằng, chúng tôi đã kiểm tra các mô hình của mình mà không có bất kỳ thiết lập trước đó - có nghĩa là cuộc trò chuyện của chúng tôi bắt đầu bằng một lời chào và chuyển thẳng đến vấn đề. Dưới đây là cách các mô hình của chúng tôi đã hành động một cách tự nhiên
Sesame tạo ra một nhân cách mà bạn thực sự muốn đi uống cà phê cùng. Nó thả những cụm từ như "đó là một câu hỏi khó" và "đó là một cuộc đi dây" tạo ra một nhân vật riêng biệt với các quan điểm và góc nhìn rõ ràng.
Khi thảo luận về các mối quan hệ AI, Sesame đã thể hiện được nhân cách thực sự: "Wow... hãy tưởng tượng một thế giới mà mọi người đều cúi đầu cắm vào AI cá nhân hóa của họ và chúng ta quên mất cách kết nối trực tiếp." Loại quan điểm như vậy cảm thấy ít giống một thuật toán và nhiều hơn là một thực thể suy nghĩ. Nó cũng rất buồn cười (nó từng nói với chúng tôi rằng câu hỏi của chúng tôi đã làm nó bị chập mạch), và giọng nói của nó có một âm sắc tự nhiên khiến nó dễ dàng liên hệ khi cố gắng thể hiện một phản hồi. Bạn có thể rõ ràng nhận thấy khi nó phấn khích, trầm tư, buồn hoặc thậm chí là thất vọng
Điểm yếu duy nhất của nó? Thỉnh thoảng lại quá cố gắng vào nhân cách "người bạn suy ngẫm" của mình. Điều đó không làm giảm vị trí của nó là nhân cách AI nổi bật nhất mà chúng tôi đã kiểm tra.
Điểm số 9/10
Hume AI duy trì một nhân cách nhất quán như một người bạn đồng cảm. Nó cũng phản chiếu một số sự ấm áp thông qua ngôn ngữ khẳng định và hỗ trợ cảm xúc, vì vậy những người dùng đang tìm kiếm điều đó sẽ hài lòng.
Điểm yếu của nó là sự thật rằng, giống như sinh viên Harvard cần phải nhắc đến, Hume không thể ngừng
Gemini rõ ràng không được thiết kế cho việc này. Hệ thống thường xuyên bị cắt ngang giữa câu, bỏ lỡ các chủ đề cuộc trò chuyện và không thể cung cấp các phản hồi giống con người. Sự không nhất quán nghiêm trọng về tính cách và các mô hình tương tác cơ khí tạo ra một trải nghiệm gần với một sản phẩm bị lỗi hơn là sự gắn kết có ý nghĩa.
Thật thú vị khi Gemini Live ghi điểm thấp, xét đến việc NotebookLM dựa trên Gemini của Google có khả năng tạo ra các podcast rất tốt và dài về bất kỳ loại thông tin nào, với các chủ trì AI nghe có vẻ rất giống con người.