Tình hình hiện tại và tương lai của AI Agent

Bài viết này được dịch máy
Xem bản gốc

Tác giả: jolestar Nguồn: X, @jolestar

Tuần trước, tôi đã thử nghiệm một số AI Agent, và vào hôm kia, tôi đã tham dự sự kiện của ai16z tại Bắc Kinh, muốn xem AI Agent hiện tại thực sự có thể làm gì và suy nghĩ về những gì nó có thể làm trong tương lai.

Tình trạng hiện tại của AI Agent khiến tôi nhớ đến một meme, trong đó có một người ẩn mình bên trong máy bán hàng tự động. Mọi người đã tưởng tượng rằng AI Agent đã bắt đầu có ý thức tự chủ, nhưng thực tế, bên trong AI Agent là một nhà phát triển đang ẩn mình.

Cách thức hoạt động cơ bản của khung AI Agent

Khung AI Agent hiện đang đóng vai trò như một chất kết dính, kết nối client (Twitter, Discord, Telegram, v.v.) và các plug-in khác nhau (các blockchain, v.v.), sau đó cung cấp một thư viện cơ bản (lưu trữ bộ nhớ, cách ly phiên, tạo ngữ cảnh, v.v.) để kết nối với các giao diện nền tảng AI khác nhau.

Cách thức kết hợp khung AI Agent với ứng dụng và các kịch bản kinh doanh

Kể từ khi AI bùng nổ vào năm ngoái, các nền tảng và công cụ mới đã xuất hiện, và vấn đề then chốt là làm thế nào để kết hợp AI với các ứng dụng. Một số nền tảng AI đã thử cung cấp các plug-in, một số xây dựng mô hình luồng công việc, và một số ứng dụng truyền thống cũng đã nhúng AI vào trong ứng dụng của họ. Tuy nhiên, điểm then chốt ở đây là: 1. Điểm nhập khẩu tương tác của ứng dụng ở đâu? 2. Làm thế nào để AI kết hợp với logic kinh doanh hiện có.

Các nền tảng AI đều cung cấp cho người dùng một hộp thoại tương tự như một cửa sổ trò chuyện làm điểm nhập khẩu tương tác với ứng dụng AI, rõ ràng mọi người đều cho rằng cách tương tác với ứng dụng AI nên là một cách "nhân cách hóa". Ở điểm này, ưu điểm của AI Agent là nó trực tiếp kết nối với tất cả các hệ thống IM mở và mạng xã hội, rõ ràng sẽ dễ tiếp nhận hơn so với việc tạo ra một cái mới.

Làm thế nào để AI kết hợp với logic kinh doanh hiện có. Giải pháp của AI Agent là để cho nhà phát triển tích hợp quyết định của AI vào các kịch bản kinh doanh. Ngôn ngữ lập trình cần tính xác định, điều kiện của if chỉ có thể là true hoặc false, không thể xử lý logic kinh doanh mơ hồ. Nhưng thông qua AI, các logic phức tạp có thể được chuyển đổi thành các điều kiện chính xác, sau đó có thể được tích hợp một cách liền mạch vào các kịch bản kinh doanh.

Ví dụ, tính năng trả lời tin nhắn trong nhóm, các bot IM truyền thống cần phải có một số lệnh tin nhắn cụ thể để kích hoạt, nhưng thông qua AI, có thể triển khai một phương thức shouldReplyMessage, cung cấp cho nó ngữ cảnh, nó sẽ trả về true hoặc false.

Vai trò chính của AI trong các kịch bản logic kinh doanh là:

1. Khám phá "ý định": Thông qua các từ nhắc, để AI dựa trên ngữ cảnh khám phá "ý định" trong nội dung tin nhắn của người dùng, ánh xạ ý định đó vào mã cụ thể.

2. Hỗ trợ ra quyết định: Thông qua AI, chuyển đổi các điều kiện phức tạp và mơ hồ thành true/false hoặc các loại liệt kê, sau đó kết hợp vào logic kinh doanh.

Khi đọc đến đây, nhiều người có thể thất vọng về AI Agent, nhiều người nghĩ rằng chỉ cần dạy AI một chút, nó sẽ biết làm mọi thứ. Thực tế, do giới hạn về ngữ cảnh của các mô hình lớn, không thể (ít nhất là hiện tại) xây dựng một AI toàn năng có thể làm mọi thứ. Nhưng tin vui là lập trình viên không cần lo lắng về việc mất việc, vẫn cần rất nhiều lập trình viên ở phía sau, vẫn cần người để viết if else, nhưng điểm khác biệt là ranh giới của các vấn đề mà chương trình có thể xử lý đang được mở rộng.

Hai loại AI Agent

Tại sự kiện, tôi đã hỏi @shawmakesmagic một câu hỏi, thị trường có hai kỳ vọng đối với AI Agent, 1. AI Agent tự đảm nhận một vai trò, có ID, thương hiệu riêng và cung cấp dịch vụ cho người dùng. 2. Người dùng có một AI Agent cá nhân, như một trợ lý cá nhân, có thể hỗ trợ người dùng xử lý một số công việc kinh doanh. Loại AI Agent nào sẽ được ưa chuộng hơn? Anh ấy cảm thấy cả hai hướng đều sẽ tốt, và có thể kết hợp lại với nhau.

Hiện tại, những gì đang được khám phá chủ yếu là hướng thứ nhất. Hướng này tương tự như việc AI Agent hóa các dịch vụ, trong tương lai có thể không còn giao diện ứng dụng, mà tất cả các ứng dụng đều được AI Agent hóa, nhân cách hóa. Còn hướng thứ hai là Agent hóa ứng dụng khách hàng, trong tương lai ứng dụng khách hàng sẽ là một plug-in của trợ lý Agent, dữ liệu ứng dụng địa phương sẽ trở thành một phần của bộ nhớ của Agent, đồng thời plug-in này cũng chịu trách nhiệm giao tiếp với các Agent dịch vụ trên nền tảng. Đây là một mô hình kiến trúc ứng dụng mới, sẽ thay đổi toàn bộ cơ sở hạ tầng.

Yêu cầu cơ sở hạ tầng đối với AI Agent

1. Cơ sở hạ tầng phải thực hiện Không cần cho phép (Permissionless), nếu không AI Agent sẽ bị các chiến lược phòng thủ tấn công hạn chế, dịch vụ nên sử dụng Gas để phòng thủ tấn công theo cách tiết kiệm chi phí. Ở điểm này, các nền tảng có độ mở kém hơn sẽ phải đối mặt với tác động lớn hơn, sự nóng lên của các nền tảng mở đầu Web2 sẽ được đánh thức trở lại.

2. AI Agent cần có khả năng vận hành tài chính để thanh toán, nhằm giải quyết vấn đề trên.

Nói cách khác, trong tương lai, dù dịch vụ có dựa trên blockchain hay không, đều cần hỗ trợ chế độ xác thực danh tính dựa trên private key Crypto và thanh toán dựa trên Crypto.

Sự kết hợp của AI Agent và blockchain

Ngoài hai điểm nêu trên, cách thức kết hợp AI Agent với blockchain cũng là một hướng đang được khám phá. Tại sự kiện, tôi đã trò chuyện với @Mikkke_acc về focEliza mà anh ấy đang phát triển. Ít nhất đối với loại AI Agent thứ nhất, nó cần có môi trường chạy hoặc xác minh do blockchain cung cấp. Bởi vì một khi một AI Agent cung cấp dịch vụ bên ngoài, sẽ có vấn đề về độ tin cậy, vai trò mà nó đảm nhận thực sự tương tự như hợp đồng thông minh.

Về cái tên "hợp đồng thông minh", trước đây từng có tranh cãi, nó chỉ là một đoạn mã, làm sao "thông minh" được, AI có thể khiến cho hợp đồng thông minh thực sự thông minh. Vấn đề là làm thế nào để gọi API AI trong môi trường hợp đồng thông minh. Nếu nói về việc chạy các mô hình lớn trong một môi trường có thể xác minh thì vẫn còn xa, sử dụng giải pháp tương tự Oracle có vẻ là con đường khả thi hơn.

Và xung quanh AI Agent sẽ phát sinh rất nhiều nhu cầu, như: Làm thế nào để AI Agent có được kiến thức công cộng? Làm thế nào để AI Agent đưa ra phán quyết về sự thật? Làm thế nào để AI Agent nhận dạng cùng một người dùng trên các nền tảng khác nhau? Làm thế nào để lưu trữ "bộ nhớ" trong hợp đồng thông minh? Nếu tôi có nhiều thiết bị, mỗi thiết bị đều có một AI Agent, làm thế nào để chúng chia sẻ bộ nhớ?

Bạn sẽ nhận ra rằng những thứ mà Web3 đã từng làm như "dữ liệu trên chuỗi", "liên kết trên chuỗi", DID, mạng P2P, v.v., đều có ý nghĩa và kịch bản mới.

Lời kết

Tôi sẽ tái sử dụng lời kết của bài chia sẻ về AI và blockchain của tôi vào năm 2021, một internet thân thiện hơn với AI cũng là một internet thân thiện hơn với con người. Lúc đó đó chỉ là một ý tưởng, nhưng bây giờ tương lai đã đến.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận