Tác giả: Nhà nghiên cứu Zeke của YBB Capital
1. Sở thích cái mới và không thích cái cũ bắt đầu bằng sự chú ý
Trong năm qua, lĩnh vực crypto đã dần trở thành một trò chơi tranh giành nguồn lực chú ý do sự gián đoạn của tường thuật lớp ứng dụng và không thể bắt kịp tốc độ bùng nổ cơ sở hạ tầng. Từ Silly Dragon đến Goat, từ Pump.fun đến Clanker, cuộc chiến giành sự chú ý ngày càng trở nên vướng víu. Bắt đầu với nhận thức bắt mắt sáo rỗng nhất, nó nhanh chóng chuyển sang mô hình nền tảng trong đó người yêu cầu và người cung cấp sự chú ý được thống nhất, sau đó các sinh vật dựa trên silicon trở thành nhà cung cấp nội dung mới. Trong số các nhà cung cấp Meme Coin kỳ lạ khác nhau, cuối cùng cũng có một sự tồn tại có thể cho phép nhà đầu tư bán lẻ và VC đạt được sự đồng thuận: AI Agent.
Sự chú ý cuối cùng là một trò chơi có tổng bằng 0, nhưng sự đầu cơ thực sự có thể thúc đẩy mọi thứ trở nên điên rồ. Trong bài viết của chúng tôi về UNI, chúng tôi đã xem xét sự khởi đầu của kỷ nguyên vàng cuối cùng của blockchain. Lý do cho tăng trưởng nhanh chóng của DeFi bắt nguồn từ kỷ nguyên khai thác NHÀ CUNG CẤP THANH KHOẢN do Compound Finance bắt đầu, được thực hiện trong nhiều nhóm khai thác khác nhau với hàng nghìn hoặc thậm chí hàng chục. của hàng nghìn Apy. Vào và ra là cách chơi trò chơi nguyên thủy nhất trên Chuỗi trong thời kỳ đó, mặc dù tình huống cuối cùng là nhiều nhóm khai thác khác nhau bị sập và phủ đầy lông vũ. Tuy nhiên, dòng thợ đào vàng điên cuồng thực sự đã để lại thanh khoản chưa từng có trong blockchain . DeFi cuối cùng đã thoát khỏi hoạt động đầu cơ thuần túy và hình thành một lộ trình trưởng thành đáp ứng nhu cầu của người dùng về mọi mặt như thanh toán, giao dịch, chênh lệch giá và đặt cược. nhu cầu tài chính. Đặc vụ AI cũng đang trải qua giai đoạn man rợ này ở giai đoạn này. Điều chúng tôi đang khám phá là làm thế nào Crypto có thể tích hợp AI tốt hơn và cuối cùng thúc đẩy lớp ứng dụng lên một tầm cao mới.
2. Làm thế nào để một tác nhân thông minh trở nên tự chủ?
Trong bài viết trước, chúng tôi đã giới thiệu ngắn gọn về nguồn gốc của AI Meme: Truth Terminal và tầm nhìn về tương lai của AI Agent. Bài viết này tập trung đầu tiên vào chính AI Agent.
Hãy bắt đầu với định nghĩa về Tác nhân AI. Là một thuật ngữ cũ hơn nhưng được định nghĩa không rõ ràng trong lĩnh vực AI. Điểm nhấn chính của nó là Tự trị, tức là bất kỳ AI nào có thể nhận biết hoàn cảnh và tạo ra phản xạ đều có thể được gọi là Tác nhân. Theo định nghĩa ngày nay, AI Agent gần hơn với một tác nhân thông minh, tức là thiết lập một hệ thống cho một mô hình lớn để bắt chước quá trình ra quyết định của con người. Trong giới học thuật, hệ thống này được coi là cách hứa hẹn nhất để đạt được AGI (Trí tuệ tổng hợp nhân tạo). ).
Ở phiên bản GPT đầu tiên, chúng ta có thể nhận thấy rõ ràng rằng mô hình lớn rất giống con người, nhưng khi trả lời nhiều câu hỏi phức tạp, mô hình lớn chỉ có thể đưa ra một số câu trả lời mang tính suy đoán. Nguyên nhân cơ bản là mô hình lớn lúc đó dựa trên xác suất chứ không phải quan hệ nhân quả. Thứ hai, nó thiếu khả năng sử dụng công cụ, trí nhớ, lập kế hoạch, v.v. và AI Agent có thể bù đắp cho những thiếu sót này. Vì vậy hãy sử dụng công thức để tóm tắt, AI Agent (tác nhân thông minh) = LLM (mô hình lớn) + Lập kế hoạch (lập kế hoạch) + Bộ nhớ (bộ nhớ) + Công cụ (công cụ).
Mô hình lớn dựa trên các từ nhắc nhở (Prompt) giống một người tĩnh hơn khi chúng ta nhập nó và mục tiêu của tác nhân thông minh là một người thực hơn. Các tác nhân thông minh hiện tại trong vòng tròn chủ yếu là các mô hình được tinh chỉnh dựa trên phiên bản Llama 70b hoặc 405b mã nguồn mở của Meta (cả hai đều có các tham số khác nhau). Chúng có khả năng ghi nhớ và sử dụng các công cụ truy cập API, nhưng có thể cần sự trợ giúp hoặc đầu vào của con người. ở các khía cạnh khác (Bao gồm cả sự tương tác và cộng tác với các tác nhân khác), nên chúng ta có thể thấy các tác nhân chính trong vòng tròn ngày nay vẫn tồn tại trên mạng xã hội dưới dạng KOLs. Để làm cho một tác nhân thông minh giống con người hơn, nó cần có khả năng lập kế hoạch và hành động, đồng thời Chuỗi tư duy phụ trong việc lập kế hoạch là đặc biệt quan trọng.
3. Chuỗi suy nghĩ (CoT)
Chuỗi Chuỗi tư duy (CoT) lần đầu tiên xuất hiện trong bài báo "Chuỗi tư duy thúc đẩy suy luận trong các mô hình ngôn ngữ lớn" do Google xuất bản vào năm 2022. Bài báo chỉ ra rằng mô hình này có thể được nâng cao bằng cách tạo ra sê-ri các phản hồi trung gian. các bước suy luận Khả năng suy luận giúp mô hình hiểu rõ hơn và giải quyết các vấn đề phức tạp.
Lời nhắc CoT điển hình bao gồm ba phần: hướng dẫn rõ ràng, mô tả nhiệm vụ, cơ sở logic để hỗ trợ cơ sở lý thuyết hoặc ví dụ nguyên tắc về giải pháp nhiệm vụ và trình diễn giải pháp có cấu trúc cụ thể này giúp mô hình hiểu các yêu cầu nhiệm vụ và dần dần tiếp cận chúng thông qua lý luận logic. . câu trả lời, do đó nâng cao hiệu quả và độ chính xác của việc giải quyết vấn đề. CoT đặc biệt phù hợp với nhiệm vụ yêu cầu phân tích chuyên sâu và suy luận nhiều bước, chẳng hạn như giải toán, viết báo cáo dự án và nhiệm vụ đơn giản khác, CoT có thể không mang lại lợi thế rõ ràng, nhưng đối với nhiệm vụ phức tạp, nó có thể cải thiện đáng kể hiệu suất. của mô hình, thông qua các chiến lược Giải quyết từng bước giúp giảm tỷ lệ lỗi và nâng cao chất lượng hoàn thành nhiệm vụ.
Khi xây dựng AI Agent, CoT đóng vai trò then chốt. Tác nhân cần hiểu thông tin nhận được và đưa ra quyết phương pháp hợp lý dựa trên thông tin đó. CoT giúp Tác nhân xử lý và phân tích thông tin đầu vào một cách hiệu quả bằng cách đưa ra cách suy nghĩ có trật tự và chuyển đổi kết quả phân tích thành hướng dẫn hành động cụ thể. nâng cao độ tin cậy và hiệu quả của khả năng ra quyết định của Đại lý, đồng thời cũng tăng tính minh bạch của quá trình ra quyết định ở mức độ cao hơn, giúp hành vi của Tác nhân dễ dự đoán và theo dõi hơn. Bằng cách chia nhiệm vụ thành nhiều bước nhỏ, CoT giúp Tác nhân xem xét cẩn thận từng điểm quyết định và giảm thiểu các quyết định sai lầm do quá tải thông tin, giúp quá trình ra quyết định của Tác nhân trở nên minh bạch hơn. , người dùng sẽ dễ dàng hiểu được cơ sở đưa ra quyết định của Đại lý hơn. Khi tương tác với hoàn cảnh, CoT cho phép Tác nhân liên tục tìm hiểu thông tin mới và điều chỉnh các chiến lược hành vi.
Là một chiến lược hiệu quả, CoT không chỉ cải thiện khả năng suy luận của các mô hình ngôn ngữ lớn mà còn đóng vai trò quan trọng trong việc xây dựng các Tác nhân AI thông minh và đáng tin cậy hơn. Bằng cách tận dụng CoT, các nhà nghiên cứu và nhà phát triển có thể tạo ra các hệ thống thông minh có khả năng thích ứng tốt hơn với hoàn cảnh phức tạp và có mức độ tự chủ cao. CoT đã chứng tỏ những ưu điểm độc đáo của nó trong các ứng dụng thực tế, đặc biệt là khi xử lý nhiệm vụ phức tạp. Bằng cách phân tách nhiệm vụ thành sê-ri các bước nhỏ, nó không chỉ cải thiện độ chính xác của việc giải quyết nhiệm vụ mà còn nâng cao khả năng diễn giải và khả năng kiểm soát của mô hình. . Phương pháp từng bước này để giải quyết vấn đề có thể làm giảm đáng kể các quyết định sai lầm do thông tin quá nhiều hoặc quá phức tạp gây ra khi đối diện nhiệm vụ phức tạp. Đồng thời, phương pháp này cũng cải thiện khả năng truy xuất nguồn gốc và kiểm chứng của toàn bộ giải pháp.
Chức năng cốt lõi của CoT là kết hợp lập kế hoạch, hành động và quan sát để thu hẹp khoảng cách giữa lý luận và hành động. Chế độ tư duy này cho phép Tác nhân AI đưa ra các biện pháp đối phó hiệu quả khi dự đoán các tình huống bất thường mà chúng có thể gặp phải và tích lũy thông tin mới trong khi tương tác với hoàn cảnh bên ngoài, xác minh các dự đoán đã đặt trước và cung cấp cơ sở lý luận mới. CoT giống như một công cụ mạnh mẽ có độ chính xác và ổn định giúp Tác nhân AI duy trì hiệu quả làm việc hiệu quả trong hoàn cảnh phức tạp.
4. Đúng nhu cầu giả
Crypto sẽ tích hợp những khía cạnh nào của ngăn xếp công nghệ AI? Trong bài viết năm ngoái, tôi cho rằng phi tập trung tỷ lệ băm và dữ liệu là một bước quan trọng để giúp các doanh nghiệp nhỏ và nhà phát triển cá nhân tiết kiệm chi phí. Trong bản phân đoạn Crypto x AI năm nay do Coinbase biên soạn, chúng tôi đã thấy sự phân chia chi tiết hơn:
(1) Lớp điện toán (chỉ mạng tập trung vào việc cung cấp tài nguyên bộ xử lý đồ họa (GPU) cho các nhà phát triển AI);
(2) Lớp dữ liệu (đề cập đến mạng hỗ trợ truy cập phi tập trung , điều phối và xác minh các đường dẫn dữ liệu AI);
(3) Lớp Middleware (đề cập đến nền tảng hoặc mạng hỗ trợ phát triển, triển khai và lưu trữ các mô hình hoặc tác nhân AI);
(4) Lớp ứng dụng (đề cập đến các sản phẩm hướng tới người dùng sử dụng cơ chế AI trên Chuỗi, cho dù là B2B hay B2C).
Mỗi cấp trong số bốn cấp phân chia này đều có một viễn cảnh mong đợi lớn và tất cả các mục tiêu của nó đều nhằm chống lại kỷ nguyên tiếp theo của những gã khổng lồ ở Thung lũng Silicon thống trị Internet. Như tôi đã nói năm ngoái, chúng ta có thực sự phải chấp nhận sự kiểm soát độc quyền về tỷ lệ băm và dữ liệu của những gã khổng lồ ở Thung lũng Silicon không? Mô hình lớn nguồn đóng dưới sự độc quyền của họ là một chiếc hộp đen bên trong. Khoa học là tôn giáo phổ biến nhất của nhân loại ngày nay. Trong tương lai, mọi câu trả lời của mô hình lớn sẽ được đông đảo mọi người coi là sự thật, nhưng điều này. sự thật nên làm thế nào để xác minh? Theo tầm nhìn của những gã khổng lồ ở Thung lũng Silicon, các tác nhân thông minh cuối cùng sẽ có những quyền ngoài sức tưởng tượng, chẳng hạn như quyền thanh toán bằng ví của bạn và quyền sử dụng thiết bị đầu cuối. Làm thế nào để đảm bảo rằng mọi người không có ý đồ xấu?
Phi tập trung là câu trả lời duy nhất, nhưng đôi khi chúng ta có cần xem xét hợp lý một cách toàn diện xem có bao nhiêu người mua cho viễn cảnh mong đợi lớn lao này? Trước đây, chúng ta có thể sử dụng Token để bù đắp những lỗi do lý tưởng hóa gây ra mà không tính đến các vòng khép kín thương mại. Tình hình ngày nay rất nghiêm trọng và Crypto x AI cần được thiết kế dựa trên tình hình thực tế. Ví dụ, làm thế nào để cân bằng nguồn cung cấp cho hai đầu của lớp tỷ lệ băm khi hiệu suất bị mất và không ổn định? Để phù hợp với khả năng cạnh tranh của đám mây tập trung. Sẽ có bao nhiêu người dùng thực sự trong dự án lớp dữ liệu? Làm cách nào để xác minh tính hợp lệ thực sự của dữ liệu dữ liệu cung cấp? Điều tương tự cũng áp dụng cho hai cấp độ còn lại. Trong thời đại này, chúng ta không cần quá nhiều nhu cầu giả có vẻ đúng.
5. Meme hết SocialFi
Như tôi đã nói ở đoạn đầu, Meme đã phát triển một hình thức SocialFi phù hợp với Web3 một cách cực nhanh. Friend.tech là Dapp đầu tiên ra mắt vòng ứng dụng xã hội này, nhưng nó đã bị đánh bại bởi thiết kế Token háo hức. Pump.fun đã xác minh tính khả thi của một nền tảng thuần túy không có bất kỳ mã thông báo hoặc quy tắc nào. Người yêu cầu và nhà cung cấp sự chú ý là thống nhất. Bạn có thể đăng meme, phát sóng trực tiếp, phát hành tiền xu, để lại tin nhắn và giao dịch trên nền tảng. Mọi thứ đều miễn phí. Điều này về cơ bản phù hợp với mô hình kinh tế chú ý của các mạng xã hội như YouTube và Instagram ngày nay, ngoại trừ việc đối tượng sạc khác nhau và lối chơi của Pupm.fun thiên về Web3 hơn.
Base's Clanker là bậc thầy của tất cả. Nhờ hệ sinh thái tích hợp do hệ sinh thái đích thân USD, Base có Dapp xã hội của riêng mình như một công cụ hỗ trợ để hình thành một vòng khép kín nội bộ hoàn chỉnh. Meme, tác nhân thông minh, là dạng 2.0 của Meme Coin Mọi người luôn tìm kiếm những ý tưởng mới và Pump.fun hiện đang dẫn đầu xu hướng. Đánh giá theo xu hướng, việc đó chỉ còn là vấn đề thời gian. những ý tưởng ngẫu nhiên về các sinh vật dựa trên silicon thay thế các meme thô tục về các sinh vật dựa trên carbon.
Tôi đã nhắc đến Base không biết bao nhiêu lần, nhưng nội dung lần đề cập đều khác nhau. Xét theo nhìn lên, Base chưa bao giờ là người đi đầu nhưng luôn là người chiến thắng.
6. Một tác nhân thông minh có thể là gì khác?
Từ quan điểm thực dụng, các tác nhân không thể phi tập trung trong thời gian dài trong tương lai. Đánh giá từ việc xây dựng các tác nhân trong lĩnh vực AI truyền thống, không thể giải quyết được bằng cách đơn giản là phi tập trung quy trình lý luận và mã nguồn mở. là nó cần truy cập vào nhiều API khác nhau để truy cập nội dung Web2 và chi phí vận hành của nó rất tốn kém. Thiết kế Chuỗi tư duy và sự cộng tác của nhiều tác nhân thường vẫn dựa vào con người làm phương tiện. Chúng ta sẽ trải qua một giai đoạn chuyển tiếp dài cho đến khi xuất hiện một hình thức tích hợp phù hợp, có lẽ giống như UNI. Nhưng giống như bài viết trước, tôi vẫn nghĩ rằng các tác nhân thông minh sẽ có tác động lớn đến ngành của chúng ta, giống như sự tồn tại của Cex trong ngành của chúng ta, điều này không chính xác nhưng quan trọng.
Bài báo "Tổng quan về tác nhân AI" do Stanford & Microsoft xuất bản tháng trước mô tả lượng lớn các ứng dụng của tác nhân trong ngành y tế, máy móc thông minh và thế giới ảo. Trong phần phụ lục của bài viết này, nhiều GPT-4V đã tham gia với tư cách là tác nhân A thử nghiệm. trường hợp phát triển các trò chơi 3A hàng đầu.
Không cần phải nhấn mạnh vào tốc độ kết hợp của nó với phi tập trung. Tôi hy vọng rằng mảnh ghép đầu tiên mà tác nhân thông minh có thể hoàn thành là khả năng và tốc độ từ dưới lên. Chúng ta có rất nhiều tàn tích tường thuật và Metaverse trống rỗng cần phải có. được điền vào. Ở giai đoạn thích hợp, chúng tôi sẽ xem xét cách biến nó thành UNI tiếp theo.
Tham khảo
Chuỗi tư duy “nổi lên” từ những mô hình lớn có khả năng gì? Tác giả: não cực thân
Hiểu Agent trong một bài viết, điểm dừng tiếp theo cho các mô hình lớn Tác giả: LinguaMind