Tác giả: jolestar
Tuần trước, tôi đã thử nghiệm một số AI Agent, và vào hôm kia, tôi đã tham dự sự kiện của ai16z tại Bắc Kinh, muốn xem AI Agent hiện tại thực sự có thể làm gì và suy nghĩ về những gì nó có thể làm trong tương lai.
Tình trạng hiện tại của AI Agent khiến tôi nhớ đến một meme, trong đó có một người ẩn mình bên trong máy bán hàng tự động. Mọi người đã tưởng tượng rằng AI Agent đã bắt đầu có ý thức tự chủ, nhưng thực tế, bên trong AI Agent vẫn ẩn giấu một nhà phát triển. (Ở đây, mọi người có thể tưởng tượng ra hình ảnh, tôi đã cố gắng yêu cầu AI tạo ra hình ảnh này, nhưng phát hiện ra AI không thể hiểu được "ẩn giấu")
Cách thức hoạt động cơ bản của khung AI Agent
Khung AI Agent hiện đang đóng vai trò như một chất kết dính, kết nối các client (Twitter, Discord, Telegram, v.v.) và các plugin (các blockchain, v.v.), sau đó cung cấp một thư viện cơ bản (lưu trữ bộ nhớ, cách ly phiên, tạo ngữ cảnh, v.v.) để kết nối với các giao diện nền tảng AI khác nhau.
Cách thức kết hợp khung AI Agent với ứng dụng và các kịch bản kinh doanh
Kể từ khi AI bùng nổ vào năm ngoái, các nền tảng và công cụ mới đã xuất hiện, và vấn đề then chốt là làm thế nào để kết hợp AI với các ứng dụng. Một số nền tảng AI đã thử cung cấp các plugin, một số xây dựng mô hình luồng công việc, và một số ứng dụng truyền thống cũng đã nhúng AI vào bên trong. Nhưng ở đây, điểm then chốt là: 1. Điểm nhập khẩu tương tác của ứng dụng ở đâu? 2. Làm thế nào để AI kết hợp với logic kinh doanh hiện có.
Các nền tảng AI đều cung cấp cho người dùng một hộp thoại tương tự như một cửa sổ trò chuyện làm điểm nhập khẩu tương tác với ứng dụng AI, rõ ràng mọi người đều cho rằng cách tương tác với ứng dụng AI nên là một cách "nhân cách hóa". Và ở điểm này, ưu điểm của AI Agent là nó trực tiếp kết nối với tất cả các hệ thống IM mở và mạng xã hội, rõ ràng sẽ dễ tiếp nhận hơn so với việc tạo ra một cái mới.
Làm thế nào để AI kết hợp với logic kinh doanh hiện có. Giải pháp của AI Agent là để cho nhà phát triển nhúng quyết định của AI vào các kịch bản kinh doanh. Ngôn ngữ lập trình cần tính xác định, điều kiện của if chỉ có thể là true hoặc false, không thể xử lý logic kinh doanh mơ hồ. Nhưng thông qua AI, các logic phức tạp có thể được chuyển đổi thành các điều kiện chính xác, sau đó có thể được tích hợp một cách liền mạch vào các kịch bản kinh doanh.
Ví dụ, tính năng trả lời tin nhắn trong nhóm, các bot IM truyền thống cần phải có một số lệnh tin nhắn cụ thể để kích hoạt, nhưng thông qua AI, có thể triển khai một phương thức shouldReplyMessage, cung cấp cho nó ngữ cảnh, nó sẽ trả về true hoặc false.
Vai trò của AI trong các kịch bản logic kinh doanh chủ yếu là:
1. Khám phá "ý định": Thông qua các từ gợi ý trong lời nhắc, để AI dựa trên ngữ cảnh khám phá "ý định" trong tin nhắn văn bản của người dùng, ánh xạ ý định đó vào mã cụ thể.
2. Hỗ trợ ra quyết định: Thông qua AI, chuyển đổi các điều kiện phức tạp và mơ hồ thành các giá trị true/false hoặc kiểu liệt kê, sau đó kết hợp vào logic kinh doanh.
Đến đây, nhiều người có thể thất vọng về AI Agent, nhiều người nghĩ rằng chỉ cần dạy AI một chút, nó sẽ biết làm mọi thứ. Thực tế, do giới hạn về ngữ cảnh của các mô hình lớn, không thể (ít nhất là hiện tại) xây dựng một AI toàn năng có thể làm mọi thứ. Nhưng tin vui là lập trình viên không cần lo lắng về việc mất việc, vẫn cần rất nhiều lập trình viên ở phía sau AI, vẫn cần có người xây dựng các if else, nhưng điểm khác biệt là phạm vi xử lý của chương trình đang được mở rộng.
Hai loại AI Agent
Tại sự kiện, tôi đã hỏi shaw một câu hỏi, thị trường có hai kỳ vọng đối với AI Agent, 1. AI Agent tự đảm nhận một vai trò, có ID, thương hiệu riêng và cung cấp dịch vụ cho người dùng. 2. Người dùng có một AI Agent cá nhân, như một trợ lý cá nhân, có thể hỗ trợ người dùng xử lý một số công việc kinh doanh. Loại AI Agent nào sẽ được ưa chuộng hơn? Anh ấy cảm thấy cả hai hướng đều sẽ tốt, và có thể kết hợp lại với nhau.
Hiện tại, những gì đang được khám phá chủ yếu là hướng thứ nhất. Hướng này tương tự như việc AI Agent hóa các dịch vụ, trong tương lai có thể không còn giao diện ứng dụng nữa, mà thay vào đó là các ứng dụng được AI Agent hóa, nhân cách hóa. Còn hướng thứ hai là Agent hóa ứng dụng khách hàng, trong tương lai ứng dụng khách hàng sẽ là một plugin của trợ lý Agent, dữ liệu ứng dụng địa phương sẽ trở thành một phần của bộ nhớ của Agent, đồng thời plugin này cũng chịu trách nhiệm giao tiếp với các dịch vụ Agent trên nền tảng. Đây là một mô hình kiến trúc ứng dụng mới, sẽ thay đổi toàn bộ cơ sở hạ tầng.
Yêu cầu cơ sở hạ tầng đối với AI Agent
1. Cơ sở hạ tầng phải thực hiện Không cần cho phép (Permissionless), nếu không AI Agent sẽ bị các chiến lược phòng thủ tấn công hạn chế, dịch vụ nên sử dụng Gas để phòng thủ theo cách tiết kiệm chi phí. Ở điểm này, các nền tảng có độ mở kém hơn sẽ phải đối mặt với tác động lớn hơn, sự nóng lên của các nền tảng mở đầu Web2 sẽ được đánh thức trở lại.
2. AI Agent cần có khả năng vận hành tài chính để thanh toán, nhằm giải quyết vấn đề trên.
Tức là, trong tương lai, dù dịch vụ có dựa trên blockchain hay không, đều cần hỗ trợ chế độ xác thực danh tính dựa trên private key Crypto và thanh toán dựa trên Crypto.
Sự kết hợp giữa AI Agent và blockchain
Ngoài hai điểm nêu trên, cách thức kết hợp AI Agent với blockchain cũng là một hướng đang được khám phá. Tại sự kiện, tôi đã trò chuyện với Mikkke về focEliza mà anh ấy đang làm. Hai loại AI Agent nêu ở trên, ít nhất là loại thứ nhất, cần có môi trường chạy hoặc xác thực do blockchain cung cấp. Bởi vì một khi một AI Agent cung cấp dịch vụ bên ngoài, sẽ có vấn đề về độ tin cậy, vai trò mà nó đảm nhận thực sự tương tự như hợp đồng thông minh.
Về cái tên "hợp đồng thông minh", trước đây từng có tranh cãi, nó chỉ là một đoạn mã, làm sao "thông minh" được, AI có thể khiến cho hợp đồng thông minh thực sự thông minh. Thách thức là làm thế nào để gọi API AI trong môi trường hợp đồng thông minh. Nếu như để các mô hình lớn chạy trong một môi trường có thể xác minh vẫn còn xa, sử dụng giải pháp tương tự Oracle có vẻ là con đường khả thi hơn.
Và xung quanh AI Agent sẽ phát sinh rất nhiều nhu cầu, như: Làm thế nào để AI Agent có được kiến thức công cộng? Làm thế nào để AI Agent đưa ra phán quyết về sự thật? Làm thế nào để AI Agent nhận dạng cùng một người dùng trên các nền tảng khác nhau? Làm thế nào để lưu trữ "bộ nhớ" trong hợp đồng thông minh? Nếu tôi có nhiều thiết bị, mỗi thiết bị đều có một AI Agent, làm thế nào để chúng chia sẻ bộ nhớ?
Bạn sẽ nhận ra rằng những thứ mà Web3 đã làm như "dữ liệu trên chuỗi", "quan hệ trên chuỗi", DID, mạng P2P, v.v., đều có ý nghĩa và kịch bản mới.
Lời kết
Tôi sẽ tái sử dụng lời kết của bài chia sẻ về AI và blockchain của tôi vào năm 2021, đó là một internet thân thiện hơn với AI cũng chính là một internet thân thiện hơn với con người. Lúc đó đó chỉ là một ý tưởng, nhưng bây giờ, tương lai đã đến.