Tác giả: jolestar
Tuần trước, tôi đã thử nghiệm một số AI Agent, và vào hôm kia tôi đã tham dự sự kiện của ai16z tại Bắc Kinh, muốn xem AI Agent hiện tại thực sự có thể làm gì và suy nghĩ về những gì nó có thể làm trong tương lai.
Tình trạng hiện tại của AI Agent khiến tôi nhớ đến một meme, trong máy bán hàng tự động có một người ẩn bên trong. Mọi người đã tưởng tượng rằng AI Agent đã bắt đầu có ý thức tự chủ, nhưng thực tế, bên trong AI Agent là một nhà phát triển đang ẩn nấp. (Ở đây, mọi người hãy tưởng tượng ra bức tranh, tôi đã cố gắng yêu cầu AI tạo ra bức tranh này nhưng phát hiện ra AI không thể hiểu được "ẩn")
Cách hoạt động cơ bản của khung AI Agent
Khung AI Agent hiện đang đóng vai trò như một chất kết dính, kết nối client (Twitter, Discord, Telegram, v.v.) và các plug-in khác nhau (các chuỗi, v.v.), sau đó cung cấp một thư viện cơ bản (bộ nhớ, cách ly phiên, tạo ngữ cảnh, v.v.) để kết nối với các giao diện nền tảng AI khác nhau.
Cách thức kết hợp AI Agent với ứng dụng và các kịch bản kinh doanh
Kể từ khi AI bùng nổ vào năm ngoái, các nền tảng và công cụ mới đã xuất hiện, và vấn đề then chốt là làm thế nào để kết hợp AI với ứng dụng. Một số nền tảng AI đã thử cung cấp các plug-in, một số xây dựng mô hình luồng công việc, và một số ứng dụng truyền thống cũng đã nhúng AI vào bên trong. Nhưng ở đây, điểm then chốt là: 1. Điểm giao diện ứng dụng ở đâu? 2. Làm thế nào để AI kết hợp với logic kinh doanh hiện có.
Các nền tảng AI đều cung cấp cho người dùng một hộp thoại tương tự như cửa sổ trò chuyện làm điểm giao diện ứng dụng, rõ ràng mọi người đều cho rằng cách tương tác với ứng dụng AI nên là một cách "nhân cách hóa". Và ở điểm này, ưu điểm của AI Agent là nó trực tiếp kết nối với tất cả các hệ thống IM và mạng xã hội mở, rõ ràng dễ tiếp nhận hơn so với việc tạo ra một cái mới.
Làm thế nào để AI kết hợp với logic kinh doanh hiện có. Giải pháp của AI Agent là để cho nhà phát triển nhúng quyết định của AI vào các kịch bản kinh doanh. Ngôn ngữ lập trình cần tính xác định, điều kiện của if chỉ có thể là true hoặc false, không thể xử lý logic kinh doanh mơ hồ. Nhưng thông qua AI, các logic phức tạp có thể được chuyển đổi thành các điều kiện chính xác, sau đó có thể được tích hợp một cách liền mạch vào các kịch bản kinh doanh.
Ví dụ, tính năng trả lời tin nhắn trong nhóm, các bot IM truyền thống cần phải có một số lệnh tin nhắn cụ thể để kích hoạt, nhưng thông qua AI, có thể triển khai một phương thức shouldReplyMessage, cung cấp cho nó ngữ cảnh, nó sẽ trả về true hoặc false.
Vai trò của AI trong các kịch bản logic kinh doanh chủ yếu là:
1. Phát hiện "ý định": Thông qua các từ gợi ý trong lời nhắc, để AI dựa trên ngữ cảnh phát hiện "ý định" trong tin nhắn văn bản của người dùng, ánh xạ ý định đó vào mã cụ thể.
2. Hỗ trợ ra quyết định: Thông qua AI, chuyển đổi các điều kiện phức tạp và mơ hồ thành true/false xác định hoặc kiểu liệt kê, sau đó kết hợp vào logic kinh doanh.
Đến đây, nhiều người có thể thất vọng về AI Agent, nhiều người nghĩ rằng AI Agent chỉ cần dạy AI một chút là nó sẽ biết làm mọi thứ. Thực tế, do giới hạn về ngữ cảnh của các mô hình lớn, không thể (ít nhất là hiện tại) xây dựng một AI toàn năng có thể làm mọi thứ. Nhưng tin vui là lập trình viên không cần lo lắng về việc mất việc, vẫn cần rất nhiều lập trình viên ở phía sau AI, vẫn cần có người xây dựng if else, nhưng điểm khác biệt chính là phạm vi xử lý của chương trình đang được mở rộng.
Hai loại AI Agent
Tại sự kiện, tôi đã hỏi shaw một câu hỏi, thị trường có hai kỳ vọng đối với AI Agent, 1. AI Agent tự đảm nhận một vai trò, có ID, thương hiệu riêng và cung cấp dịch vụ cho người dùng. 2. Người dùng có một AI Agent cá nhân, như một trợ lý cá nhân, có thể hỗ trợ người dùng xử lý một số công việc kinh doanh. Loại AI Agent nào sẽ được ưa chuộng hơn? Anh ấy cảm thấy cả hai hướng đều sẽ tốt, và có thể kết hợp lại với nhau.
Hiện tại, những gì mọi người chủ yếu đang khám phá là hướng thứ nhất. Hướng này tương tự như việc AI hóa các dịch vụ, trong tương lai có thể không còn giao diện ứng dụng nữa, mà tất cả đều được AI hóa và nhân cách hóa. Còn hướng thứ hai là AI hóa ứng dụng khách hàng, trong tương lai ứng dụng khách hàng sẽ trở thành một plug-in của trợ lý AI, dữ liệu ứng dụng địa phương sẽ trở thành một phần của bộ nhớ của trợ lý AI, đồng thời plug-in này cũng chịu trách nhiệm giao tiếp với trợ lý dịch vụ ở phía máy chủ. Đây là một mô hình kiến trúc ứng dụng mới, sẽ thay đổi toàn bộ cơ sở hạ tầng.
Yêu cầu cơ sở hạ tầng đối với AI Agent
1. Cơ sở hạ tầng phải thực hiện Không cần cho phép, nếu không AI Agent sẽ bị các chiến lược phòng thủ tấn công hạn chế, dịch vụ nên sử dụng Gas để phòng thủ theo cách tiết kiệm chi phí. Ở điểm này, các nền tảng có độ mở kém sẽ phải đối mặt với tác động lớn, sự nóng lên của các nền tảng mở Web2 ban đầu sẽ được đánh thức trở lại.
2. AI Agent cần có khả năng vận hành tài chính để thanh toán, để giải quyết vấn đề trên.
Nói cách khác, trong tương lai, dù dịch vụ có dựa trên blockchain hay không, đều cần hỗ trợ chứng thực danh tính dựa trên private key Crypto và thanh toán dựa trên Crypto.
Sự kết hợp giữa AI Agent và chuỗi
Ngoài hai điểm nêu trên, cách thức kết hợp AI Agent với chuỗi cũng là một hướng đang được mọi người khám phá. Tại sự kiện, tôi đã trò chuyện với Mikkke về focEliza mà anh ấy đang làm. Hai loại AI Agent nêu ở trên, ít nhất là loại thứ nhất, cần có môi trường chạy hoặc xác minh do chuỗi cung cấp. Bởi vì một khi một AI Agent cung cấp dịch vụ bên ngoài, sẽ có vấn đề về độ tin cậy, vai trò mà nó đảm nhận thực sự giống như một hợp đồng thông minh.
Về cái tên "hợp đồng thông minh", trước đây từng có tranh cãi, nó chỉ là một đoạn mã, làm sao "thông minh" được, AI có thể khiến cho hợp đồng thông minh thực sự thông minh. Vấn đề là làm thế nào để gọi API AI trong môi trường hợp đồng thông minh. Nếu nói về việc chạy các mô hình lớn trong một môi trường có thể xác minh thì vẫn còn xa, sử dụng giải pháp tương tự Oracle có vẻ là con đường khả thi hơn.
Và xung quanh AI Agent sẽ phát sinh rất nhiều nhu cầu, làm thế nào để AI Agent có được kiến thức công cộng? Làm thế nào để AI Agent đưa ra phán quyết về sự thật? Làm thế nào để AI Agent nhận dạng cùng một người dùng trên các nền tảng khác nhau? Làm thế nào để lưu trữ "bộ nhớ" trong hợp đồng thông minh? Nếu tôi có nhiều thiết bị, mỗi thiết bị đều có một AI Agent, làm thế nào để chúng chia sẻ bộ nhớ?
Bạn sẽ nhận ra rằng những thứ mà Web3 đã từng làm như "dữ liệu trên chuỗi", "quan hệ trên chuỗi", DID, mạng P2P, v.v., đều có ý nghĩa và kịch bản mới.
Lời kết
Tôi lặp lại lời kết của bài chia sẻ về AI và blockchain của tôi vào năm 2021, một internet thân thiện hơn với AI cũng là một internet thân thiện hơn với con người. Lúc đó đó chỉ là một ý tưởng, nhưng bây giờ tương lai đã đến.