Thời đại của đại lý: Sự đối đầu và cộng sinh giữa AI và tiền điện tử

Bài viết này được dịch máy
Xem bản gốc

I. Sự mới lạ và nhàm chán bắt nguồn từ sự chú ý

Trong một năm qua, do câu chuyện ở tầng ứng dụng không đồng bộ với tốc độ bùng nổ của cơ sở hạ tầng, lĩnh vực tiền mã hóa dần trở thành một cuộc chơi giành giật nguồn tài nguyên chú ý. Từ Silly Dragon đến Goat, từ Pump.fun đến Clanker, sự mới lạ và nhàm chán về chú ý đã khiến cuộc chơi này ngày càng trở nên phức tạp. Bắt đầu từ việc sử dụng những cách thu hút sự chú ý để thu lợi nhuận, nhanh chóng chuyển sang mô hình nền tảng thống nhất giữa người cần chú ý và người cung cấp chú ý, sau đó sinh vật silicon trở thành nhà cung cấp nội dung mới. Trong những phương tiện chứa đựng đa dạng của Meme Coin, cuối cùng đã xuất hiện một sự tồn tại có thể khiến nhà đầu tư bán lẻ và VC đạt được sự đồng thuận: AI Agent.

Cuối cùng, chú ý là một trò chơi cân bằng tổng bằng 0, nhưng đầu cơ thực sự cũng có thể thúc đẩy sự phát triển hoang dã của sự vật. Trong bài viết về UNI, chúng tôi đã ôn lại sự khởi đầu của kỷ nguyên vàng trên blockchain, nguồn gốc của sự tăng trưởng nhanh chóng của DeFi là từ thời kỳ khai thác thanh khoản của Compound Finance, với các mỏ có Tỷ lệ phần trăm hàng năm hàng nghìn thậm chí hàng vạn, mặc dù cuối cùng các mỏ này đều sụp đổ. Nhưng sự cuồng nhiệt của những thợ đào vàng đã để lại một lượng thanh khoản chưa từng có cho blockchain, DeFi cuối cùng cũng vượt ra khỏi hình thức đầu cơ thuần túy và hình thành một lĩnh vực chín muồi, đáp ứng nhu cầu tài chính của người dùng trong các lĩnh vực như thanh toán, giao dịch, đối trừ, và đặt cọc. Và AI Agent hiện đang trải qua giai đoạn hoang dã này, chúng ta đang tìm hiểu cách Crypto có thể hòa nhập tốt hơn với AI, từ đó thúc đẩy tầng ứng dụng lên một tầm cao mới.

II. Làm thế nào để các tác nhân tự chủ

Trong bài viết trước, chúng tôi đã giới thiệu sơ lược về nguồn gốc của AI Meme: Truth Terminal, và triển vọng của AI Agent trong tương lai, bài viết này tập trung vào chính bản thân AI Agent.

Trước tiên, chúng tôi sẽ bắt đầu từ định nghĩa về AI Agent. Agent trong lĩnh vực AI là một thuật ngữ khá cổ xưa nhưng định nghĩa không rõ ràng, chủ yếu nhấn mạnh vào Autonomous (tự chủ), nghĩa là bất kỳ AI nào có thể cảm nhận môi trường và phản ứng lại đều có thể được gọi là Agent. Trong định nghĩa hiện nay, AI Agent gần với khái niệm tác nhân thông minh, tức là thiết lập một hệ thống mô phỏng quá trình ra quyết định của con người cho các mô hình lớn, trong giới học thuật, hệ thống này được coi là phương pháp có nhiều hy vọng nhất để đạt đến AGI (Trí tuệ nhân tạo phổ dụng).

Trong các phiên bản GPT sớm, chúng ta rõ ràng có thể cảm nhận được các mô hình lớn rất giống con người, nhưng khi trả lời nhiều câu hỏi phức tạp, các mô hình lớn này chỉ có thể đưa ra những câu trả lời mang tính chất đại khái. Lý do cơ bản là lúc đó các mô hình lớn dựa trên xác suất chứ không phải nhân quả, và chúng thiếu những khả năng mà con người có như sử dụng công cụ, ghi nhớ, lập kế hoạch, v.v., và AI Agent có thể bù đắp những khiếm khuyết này. Vì vậy, có thể tóm tắt bằng một công thức: AI Agent = Mô hình ngôn ngữ lớn + Lập kế hoạch + Bộ nhớ + Công cụ.

Các mô hình lớn dựa trên lời nhắc (Prompt) giống như một con người tĩnh, chúng chỉ có sự sống khi chúng ta nhập vào, mục tiêu của tác nhân thông minh là trở thành một con người thực sự. Hiện nay, các tác nhân thông minh chủ yếu dựa trên các phiên bản vi chỉnh sửa của Llama 70b hoặc 405b (với các tham số khác nhau) do Meta công bố, có khả năng ghi nhớ và sử dụng các API, trong các khía cạnh khác có thể cần sự trợ giúp hoặc đầu vào của con người (bao gồm cả tương tác hợp tác với các tác nhân thông minh khác), vì vậy chúng ta có thể thấy hiện nại các tác nhân thông minh chủ yếu tồn tại dưới dạng KOL trên các mạng xã hội. Để khiến tác nhân thông minh trở nên giống con người hơn, cần tích hợp khả năng lập kế hoạch và hành động, trong đó chuỗi tư duy là yếu tố then chốt.

III. Chuỗi tư duy (Chain of Thought, CoT)

Khái niệm Chuỗi tư duy (Chain of Thought, CoT) xuất hiện lần đầu tiên trong bài báo do Google công bố vào năm 2022 với tựa đề "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models", bài báo chỉ ra rằng có thể tăng cường khả năng lập luận của mô hình bằng cách tạo ra một chuỗi các bước suy luận trung gian, giúp mô hình hiểu và giải quyết các vấn đề phức tạp tốt hơn.

Một Prompt CoT điển hình bao gồm ba phần: mô tả nhiệm vụ rõ ràng, cơ sở lý thuyết hoặc nguyên tắc hỗ trợ giải quyết nhiệm vụ, và trình bày giải pháp cụ thể. Cấu trúc có hệ thống này giúp mô hình hiểu yêu cầu của nhiệm vụ, thông qua suy luận logic từng bước tiến dần đến câu trả lời, từ đó nâng cao hiệu quả và độ chính xác trong giải quyết vấn đề. CoT đặc biệt phù hợp với các nhiệm vụ yêu cầu phân tích sâu và suy luận nhiều bước, như giải quyết bài toán toán học, viết báo cáo dự án, v.v., đối với các nhiệm vụ đơn giản, CoT có thể không mang lại lợi ích rõ rệt, nhưng đối với các nhiệm vụ phức tạp, nó có thể cải thiện đáng kể hiệu suất của mô hình, giảm tỷ lệ lỗi và nâng cao chất lượng hoàn thành nhiệm vụ.

Trong việc xây dựng AI Agent, CoT đóng vai trò then chốt, AI Agent cần hiểu thông tin nhận được và đưa ra quyết định hợp lý dựa trên đó, CoT cung cấp một cách tiếp cận có trật tự, giúp Agent xử lý và phân tích thông tin đầu vào một cách hiệu quả, chuyển kết quả phân tích thành hướng dẫn hành động cụ thể. Phương pháp này không chỉ tăng cường độ tin cậy và hiệu quả của quá trình ra quyết định của Agent, mà còn nâng cao tính minh bạch của quá trình ra quyết định, giúp hành vi của Agent trở nên dễ dự đoán và có thể theo dõi hơn. CoT chia nhiệm vụ thành nhiều bước nhỏ, giúp Agent xem xét kỹ lưỡng từng điểm ra quyết định, giảm thiểu lỗi do quá tải thông tin. CoT cũng cho phép Agent liên tục học hỏi thông tin mới và điều chỉnh chiến lược hành động trong quá trình tương tác với môi trường.

CoT như một chiến lược hiệu quả, không chỉ nâng cao khả năng suy luận của các mô hình ngôn ngữ lớn, mà còn đóng vai trò quan trọng trong việc xây dựng các AI Agent thông minh và đáng tin cậy hơn. Thông qua việc sử dụng CoT, các nhà nghiên cứu và nhà phát triển có thể tạo ra các hệ thống thông minh có khả năng thích ứng với môi trường phức tạp và tự chủ cao. CoT đã thể hiện những ưu điểm độc đáo trong các ứng dụng thực tế, đặc biệt là khi xử lý các nhiệm vụ phức tạp, bằng cách chia nhiệm vụ thành một loạt các bước nhỏ, không chỉ nâng cao độ chính xác trong giải quyết nhiệm vụ, mà còn tăng cường tính giải thích và kiểm soát của mô hình. Phương pháp giải quyết từng bước này có thể giúp giảm đáng kể các quyết định sai lầm khi đối mặt với nhiệm vụ phức tạp do quá tải thông tin hoặc quá phức tạp. Đồng thời, phương pháp này cũng nâng cao tính có thể theo dõi và xác minh của toàn bộ giải pháp.

Chức năng cốt lõi của CoT là kết hợp kế hoạch, hành động và quan sát, lấp đầy khoảng cách giữa suy luận và hành động. Cách tiếp cận này cho phép AI Agent dự đoán và lập kế hoạch ứng phó với các tình huống bất thường, đồng thời tích lũy thông tin mới, xác minh các dự đoán trước đó và cung cấp cơ sở suy luận mới. CoT như một động cơ chính xác và ổn định, giúp AI Agent duy trì hiệu suất làm việc cao trong môi trường phức tạp.

IV. Nhu cầu giả tạo đúng đắn

Crypto cuối cùng phải kết hợp với những khía cạnh nào của ngăn xếp công nghệ AI? Trong bài viết năm ngoái, tôi cho rằng phi tập trung hóa tính toán và dữ liệu là bước then chốt để giúp các doanh nghiệp nhỏ và nhà phát triển cá nhân tiết kiệm chi phí, và trong danh mục các lĩnh vực phân khúc Crypto x AI do Coinbase tổng hợp trong năm nay, chúng ta thấy có sự phân chia chi tiết hơn:

(1) Tầng tính toán (tập trung vào việc cung cấp tài nguyên xử lý đồ họa (GPU) cho các nhà phát triển AI);

(

Phi tập trung là câu trả lời duy nhất, nhưng đôi khi chúng ta có thể cần xem xét một cách hợp lý, những người trả tiền cho những tầm nhìn lớn lao này là bao nhiêu? Trong quá khứ, chúng ta có thể bù đắp sự sai lệch do lý tưởng hóa bằng Token mà không cần quan tâm đến vòng khép kín kinh doanh. Nhưng tình hình hiện nay rất nghiêm trọng, Crypto x AI cần phải kết hợp với thực tế để thiết kế lại, ví dụ như cung cấp hai đầu của tầng tính toán trong trường hợp hiệu suất bị suy giảm và không ổn định, để đạt được sức cạnh tranh với các đám mây tập trung. Các dự án ở tầng dữ liệu sẽ có bao nhiêu người dùng thực sự, làm thế nào để kiểm tra tính xác thực và hiệu lực của dữ liệu được cung cấp, và những khách hàng nào cần những dữ liệu này? Các tầng thứ hai khác cũng tương tự, trong thời đại này chúng ta không cần quá nhiều nhu cầu giả tạo dường như đúng đắn.

Năm, MEME đã vượt ra khỏi SocialFi

Như tôi đã nói ở đoạn đầu, MEME đã di chuyển với tốc độ siêu nhanh, ra khỏi hình thức SocialFi phù hợp với Web3. Friend.tech là Dapp khai mào cho ứng dụng xã hội vòng này, nhưng đáng tiếc đã thất bại trong thiết kế Token vội vàng. Pump.fun thì lại chứng minh được tính khả thi của nền tảng thuần túy, không có bất kỳ Token hay quy tắc nào. Những người cần và cung cấp sự chú ý được thống nhất, bạn có thể đăng ảnh meme, phát trực tiếp, phát hành tiền xu, bình luận, giao dịch, tất cả đều tự do, Pump.fun chỉ thu phí dịch vụ. Điều này cơ bản giống với mô hình kinh tế chú ý của các phương tiện truyền thông xã hội như YouTube, Ins ngày nay, chỉ khác làối tượng thu phí. Về cách chơi, Pupm.fun thì Web3 hơn.

Clanker của Base là tổng hợp, nhờ vào hệ sinh thái tích hợp do chính nó thiết kế, Base có ứng dụng xã hội Dapp làm phụ trợ, tạo thành vòng khép kín hoàn chỉnh bên trong. Sinh vật thông minh MEME là hình thức 2.0 của MEME Coin, con người luôn thích cái mới, và Pump.fun hiện đang ở đỉnh sóng, từ xu hướng nhìn lại, việc sinh vật silic thay thế sinh vật carbon trong các meme tầm thường chỉ là vấn đề thời gian.

Tôi đã đề cập đến Base vô số lần, nhưng nội dung mỗi lần đề cập lại khác nhau, xét trên trục thời gian, Base không phải là người tiên phong, nhưng lại luôn là người chiến thắng.

Sáu, Sinh vật thông minh còn có thể là gì?

Từ góc độ thực tế, trong một thời gian dài, sinh vật thông minh sẽ không thể phi tập trung hóa, xét từ việc xây dựng sinh vật thông minh trong lĩnh vực truyền thống về AI, nó không phải là quá trình suy luận đơn giản mà chỉ cần phi tập trung hóa và mã nguồn mở là có thể giải quyết, nó cần truy cập các API khác nhau để truy cập nội dung Web2, chi phí hoạt động của nó rất cao, thiết kế chuỗi tư duy và hợp tác đa trí tuệ thường vẫn phụ thuộc vào một con người làm trung gian. Chúng ta sẽ trải qua một giai đoạn chuyển tiếp dài, cho đến khi xuất hiện một hình thức kết hợp phù hợp, có lẽ giống như UNI. Nhưng giống như bài viết trước, tôi vẫn cho rằng sinh vật thông minh sẽ gây ra ảnh hưởng lớn đến ngành công nghiệp của chúng ta, giống như sự tồn tại của CEX trong ngành công nghiệp của chúng ta, không chính xác nhưng rất quan trọng.

Tháng trước, Stanford & Microsoft đã phát hành bài viết "Tổng quan về Tác nhân AI", mô tả rất nhiều ứng dụng của sinh vật thông minh trong lĩnh vực y tế, máy thông minh, thế giới ảo, và trong phụ lục của bài báo này đã có rất nhiều trường hợp thử nghiệm của GPT-4V tham gia vào phát triển các trò chơi 3A hàng đầu với tư cách là sinh vật thông minh.

Không cần quá yêu cầu tốc độ kết hợp với phi tập trung hóa, tôi hy vọng rằng những mảnh ghép đầu tiên mà sinh vật thông minh cần hoàn thiện là khả năng và tốc độ từ dưới lên, chúng ta có rất nhiều đống đổ nát của câu chuyện và khoảng trống của Metaverse cần nó lấp đầy, ở giai đoạn phù hợp, chúng ta sẽ xem xét làm thế nào để nó trở thành UNI tiếp theo.

Hãy tham gia vào nhóm chính thức của BlockBeats:

Nhóm đăng ký Telegram: https://t.me/theblockbeats

Nhóm thảo luận Telegram: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận