Những người sáng lập nhiều dự án hàng đầu thảo luận về: Đại lý AI, kinh tế token và triển vọng hợp tác giữa con người và máy móc

avatar
MetaEra
11-26
Bài viết này được dịch máy
Xem bản gốc
Sắp xếp và biên soạn: TechFlow TechFlow

Khách:

· Shaw, đối tác tại ai16z;

· Karan, đồng sáng lập Nous Research;

· Ethan, đồng sáng lập MyShell;

· Justin Bennington, Somewheresy, Giám đốc điều hành CENTS;

· EtherMage, người đóng góp hàng đầu cho Virtuals;

· Tom Shaughnessy, Đối tác sáng lập, Delphi Ventures

Nguồn podcast: Delphi Digital

Tiêu đề gốc: Đại lý Crypto x AI: Podcast dứt khoát với Ai16z, Virtuals, MyShell, NOUS và CENTS

Ngày phát sóng: 23/11/2024

Thông tin bối cảnh

Tham gia cùng Shaw (Ai16z), Karan (Nous Research), Ethan (MyShell), Somewheresy (CENTS), EtherMage (Virtuals) và Tom Shaughnessy của Delphi để tham gia một cuộc thảo luận bàn tròn đặc biệt. Sự kiện lần quy tụ những nhân vật hàng đầu trong lĩnh vực crypto và tác nhân AI để thảo luận về sự phát triển của các dạng sống kỹ thuật số tự trị và hướng tương tác giữa con người và AI trong tương lai.

Điểm nổi bật của cuộc thảo luận:

▸ Sự phát triển nhanh chóng của các tác nhân AI trên mạng xã hội và tác động sâu sắc của nó đến thế giới Web3

▸Làm thế nào mã thông báo crypto có thể giúp phát triển công nghệ tác nhân thông minh và kích thích sức sống của cộng đồng

▸Phân tích so sánh ưu điểm của đào tạo mô hình phi tập trung và nền tảng AI tập trung

▸ Khám phá chuyên sâu về việc cải thiện quyền tự chủ của tác nhân và con đường tương lai của trí tuệ nhân tạo tổng hợp (AGI)

▸ Cách các tác nhân AI được tích hợp độ sâu với DeFi và các nền tảng xã hội

Giới thiệu bản thân và bối cảnh đội ngũ

Trong phần podcast này, người dẫn chương trình Tom mời một số khách từ các dự án khác nhau thảo luận về chủ đề crypto và trí tuệ nhân tạo. Mỗi khách mời đều giới thiệu bản thân và chia sẻ bối cảnh cũng như các dự án mà họ đã thực hiện.

Giới thiệu khách mời

· Justin Bennington: Ông là người sáng lập Somewhere Systems và là người tạo ra Sentience.

· Shaw: Anh ấy là nhà phát triển Web3 lâu năm, người đã thành lập ai16z, phát triển dự án Eliza, hỗ trợ các ứng dụng trò chơi và xã hội khác nhau, đồng thời cam kết hợp tác đóng góp nguồn mở.

· Ethan: Anh là người đồng sáng lập MyShell, công ty cung cấp kho ứng dụng và các công cụ quy trình làm việc để giúp các nhà phát triển xây dựng nhiều ứng dụng AI, bao gồm chức năng tạo hình ảnh và giọng nói.

· EtherMage: Anh ấy đến từ Virtues Protocol và đội ngũ đến từ Imperial College. Anh ấy cam kết thúc đẩy quyền sở hữu chung và sự đóng góp cốt lõi của đại lý cũng như xây dựng các tiêu chuẩn để giúp người dùng tiếp cận đại lý dễ dàng hơn.

· Karan: Ông là một trong những người sáng lập NOUS Research và tạo ra mô hình Hermes, là nền tảng cho nhiều hệ thống đại lý hiện nay. Ông tập trung vào vai trò của các tác nhân trong hệ sinh thái con người và tác động của áp lực thị trường đối với hoàn cảnh con người.

Khám phá các đại lý sáng tạo nhất

Justin: Hiện nay có rất nhiều người kể chuyện thông qua công ty quản lý của riêng họ, mỗi người đều có phong cách riêng. Ví dụ: các tác nhân như Dolo, Styrene (lắng nghe) và Zerebro trở nên phổ biến thông qua việc bắt chước và tương tác, trong khi một số tác nhân hoạt động xã hội giúp mọi người xây dựng các kết nối tốt hơn. Thật sự rất khó để chọn trong đó.

Shaw: Tôi có rất nhiều suy nghĩ về điều này. Dự án của chúng tôi đang phát triển nhanh chóng và gần đây có nhiều tính năng mới, chẳng hạn như tích hợp EVM và tích hợp Farcaster . Các nhà phát triển liên tục giới thiệu các tính năng mới và đưa chúng vào dự án để mọi người đều có thể hưởng lợi. Mô hình hợp tác này rất tốt, mọi người đều phát huy tính cạnh tranh và sự quan tâm của dự án. Ví dụ: Roparito (nghe dịch) gần đây tích hợp TikTok vào tác nhân, thể hiện khả năng lặp lại nhanh chóng này.

Tôi cho rằngTee Bot thực sự rất thú vị vì nó thể hiện Hoàn cảnh thực thi đáng tin cậy (TEE) và một tác nhân hoàn toàn tự chủ. Sau đó, có Kin Butoshi (người phiên dịch nghe), người đang cải tiến các tác nhân trên Twitter để cho phép nhiều tương tác giữa con người với nhau hơn, chẳng hạn như trả lời, tweet lại và thích, thay vì chỉ trả lời đơn giản.

Ngoài ra, chúng tôi còn có các nhà phát triển đang phát hành plug-in cho RuneScape để cho phép các đặc vụ hoạt động trong trò chơi. Có những điều bất ngờ mới mỗi ngày và tôi rất phấn khích. Chúng ta đang ở trong một hệ sinh thái và mỗi đội ngũ đang đóng góp nỗ lực của riêng mình để thúc đẩy sự phát triển của công nghệ mã nguồn mở.

Tôi đặc biệt muốn đề cập đến đội ngũ Zerebro, những người đang nỗ lực vượt qua ranh giới của công nghệ mã nguồn mở. Chúng tôi đang buộc mọi người phải hành động nhanh hơn và khuyến khích mọi người mã nguồn mở dự án của mình, điều này mang lại lợi ích cho mọi người. Chúng ta không cần lo lắng về sự cạnh tranh, đây là xu hướng cùng tiến bộ và cuối cùng tất cả chúng ta đều sẽ có lợi.

EtherMage: Tôi cho rằng một câu hỏi thú vị là các đại lý thực sự thích điều gì hơn . Trong vài tuần tới, chúng ta sẽ thấy nhiều tương tác với đại lý hơn và một bảng xếp hạng sẽ xuất hiện cho biết đại lý nào nhận được nhiều yêu cầu nhất và đại lý nào được yêu thích nhất trong số các đại lý khác.

Karan: Chỉ báo tương tác sẽ rất quan trọng. Một số người làm điều này rất tốt. Tôi muốn làm nổi bật Zerebro, nơi kết hợp rất nhiều điều kỳ diệu của Truth Terminal. Nó tinh chỉnh mô hình để giữ không gian tìm kiếm trong phạm vi tương tác của Twitter, thay vì chỉ sử dụng một mô hình chung. Trọng tâm này cho phép các tổng đài viên tương tác tốt hơn với người dùng và cảm nhận con người thay vì chỉ phản hồi một cách máy móc.

Tôi cũng đã thấy kiến ​​trúc Zerebro và kiến ​​trúc Eliza hoạt động tốt về mặt này. Mọi người đang triển khai các kiến ​​trúc đại lý có thể được sử dụng mô-đun, nhằm duy trì áp lực cạnh tranh. Chúng tôi sử dụng Eliza trong kiến ​​trúc của mình vì chúng tôi cần triển khai các tính năng một cách nhanh chóng, trong khi kiến ​​trúc của chúng tôi có thể mất nhiều thời gian hơn để hoàn thành. Chúng tôi ủng hộ mô hình cộng tác mã nguồn mở này và những nhân viên giỏi nhất sẽ xuất hiện nhờ quá trình học hỏi của chúng tôi từ các dự án lớn khác.

Ethan: Tôi cho rằng mọi người đang cố gắng xây dựng cơ sở hạ tầng tốt hơn để phát triển đại lý vì có rất nhiều ý tưởng và mô hình được đưa ra. Cơ sở hạ tầng tốt hơn giúp phát triển các mô hình mới dễ dàng hơn. Hai tác nhân đổi mới mà tôi đặc biệt thích là Sử dụng máy tính từ Answer Pick, mang đến cho các tác nhân khả năng tận dụng sức mạnh tính toán di động. Một loại khác là các tác nhân tự động hóa trình duyệt, có thể xây dựng nhiều tính năng hữu ích hơn cho con người, ảnh hưởng đến Internet và thế giới thực.

Justin: Đó là một quan điểm hay về mở rộng các lựa chọn cơ sở hạ tầng. Một ví dụ điển hình là vvaifu, đã đưa khung Eliza vào kiến ​​trúc nền tảng như một dịch vụ, nhanh chóng mở rộng thị trường và giúp nhiều người không rành về kỹ thuật dễ dàng thành lập đại lý. ( Lưu ý TechFlow: Waifu là một thuật ngữ có nguồn gốc từ Văn hóa Otaku của Nhật Bản. Ban đầu nó được dùng để chỉ nhân vật nữ trong anime, trò chơi hoặc các tác phẩm ảo khác khiến con người gắn bó về mặt cảm xúc. Nó bắt nguồn từ từ tiếng Anh "Vợ" "The Cách phát âm "" trong tiếng Nhật thường được dùng để thể hiện tình yêu mãnh liệt của ai đó dành cho một nhân vật ảo nào đó, thậm chí có thể nói là hình ảnh phóng chiếu của một "đối tác lý tưởng").

Một hướng mà chúng tôi đang thực hiện là cho phép hệ thống của chúng tôi chạy hoàn toàn tự nhiên và hỗ trợ các chức năng như phân loại hình ảnh và tạo hình ảnh. Chúng tôi nhận thấy rằng nhiều người không đủ khả năng chi hàng nghìn đô la mỗi tháng nên chúng tôi muốn cung cấp các công cụ cho phép mọi người suy luận cục bộ, giảm chi phí đồng thời thúc đẩy thử nghiệm.

Karan: Tôi muốn nói thêm rằng không nên bắt mọi người phải trả hàng nghìn đô la mỗi tháng để duy trì hoạt động của một đại lý. Tôi ủng hộ cách tiếp cận địa phương hóa cho phép các đại lý trả tiền theo lý do riêng của họ. Lý tưởng nhất là các đại lý nên có ví riêng và có khả năng tự chi trả cho suy luận của mình để có thể hoạt động độc lập thay vì dựa vào nguồn tài trợ bên ngoài.

Thảo luận chuyên sâu về kiến ​​trúc và phát triển tác nhân

Shaw: Tôi thấy có rất nhiều công nghệ mới đang nổi lên. Chúng tôi hỗ trợ nhiều Chuỗi, chẳng hạn như Solana, Starkware, EVM, v.v. và hầu hết tất cả Chuỗi đều được tích hợp. Chúng tôi muốn các đại lý có thể tự chủ. Nếu bạn tải xuống Eliza, bạn có thể thực hiện suy luận phi tập trung miễn phí với Helius. Chúng tôi cũng đang bổ sung thêm các nhà cung cấp phi tập trung như Infera (phiên dịch), nơi người dùng có thể trả tiền cho việc suy luận bằng crypto. Đây là vòng khép kín cuối cùng mà tôi muốn xem.

Chúng tôi hỗ trợ tất cả các mô hình gốc và nhiều tính năng của Eliza chạy tự nhiên, đây là điều chúng tôi rất coi trọng. Tôi cho rằng luận phi tập trung là một ví dụ điển hình, trong đó bất kỳ ai cũng có thể khởi chạy nút trên máy tính của mình, suy luận và được trả tiền để tác nhân không phải chịu quá nhiều gánh nặng.

Karan: Điều thú vị là hệ thống bot TEE mà chúng tôi đang chạy đã được kết hợp với H200 Box (thiết bị phần cứng hoặc máy chủ được trang bị GPU H200) để có thể chạy cục bộ mà không bị ảnh hưởng bởi độ trễ. Chúng ta không cần phải lo lắng về vấn đề phần cứng. Đồng thời, tôi nhận thấy rằng Eliza đang lên kế hoạch ngày càng nhiều khả năng cho Web3 và có rất nhiều tiến bộ trong cả quá trình phát triển bên trong và bên ngoài.

Nhưng trước khi chúng ta đi sâu vào việc xây dựng các hệ thống này, tôi muốn chỉ ra rằng có vấn đề về độ tin cậy của các lệnh gọi hàm. Chúng ta cần xem xét kỹ lưỡng hệ thống để đảm bảo nó không gửi thông tin nhạy cảm. Chúng ta cần trao cho các tác nhân quyền tự chủ giống như con người, quyền tự chủ này được hình thành bởi áp lực kinh tế và xã hội. Vì vậy, việc tạo ra một “trạng thái đói khát” về lý luận, trong đó các đặc vụ cần tiêu thụ một lượng token nhất định để tồn tại, sẽ khiến chúng trở nên nhân đạo hơn phần nào.

Cho rằng tôi, có hai phương pháp để sử dụng hết tiềm năng của mô hình. Một là tận dụng tính chất khách quan của mô hình và tạo ra các thực thể tập trung vào nhiệm vụ cụ thể, chẳng hạn như một thực thể tập trung vào Twitter và một thực thể tập trung vào EtherMage, có thể giao tiếp với nhau. Hệ thống tư duy tổng hợp có tổ chức này có thể sử dụng hiệu quả các đặc tính mô phỏng của các mô hình ngôn ngữ.

Phương pháp khác là theo hướng soma, đó là nơi tôi thấy các dự án như Eliza, Sense và Virtuals đang phát triển. Phương pháp này rút ra từ nghiên cứu về Du hành và các tác nhân tạo sinh, cho phép các mô hình mô phỏng hành vi và cảm xúc của con người.

Justin: Hệ thống proxy nhiều máy trạm thay đổi đáng kể khi có máy trạm mới. Khi chúng tôi gỡ lỗi tính năng WebSocket hai chiều làm việc với đội ngũ Shaw để cho phép Eliza trò chuyện thoại trong Discord, chúng tôi nhận thấy Eliza không thể nghe rõ âm thanh khi khởi động. Sau khi kiểm tra, chúng tôi phát hiện ra rằng tốc độ bit micrô của Discord bị lỗi. đặt quá thấp. Sau khi điều chỉnh, Eliza cuối cùng cũng có thể nhận được tin nhắn một cách rõ ràng.

Karan vừa đề cập đến kỹ thuật gợi ý, khi một đặc vụ biết rằng nó có thể giao tiếp qua giọng nói, nó sẽ mong nhận được dữ liệu. Nếu âm thanh không rõ ràng, tác nhân có thể gặp phải hiện tượng "sụp đổ câu chuyện". Vì vậy, chúng tôi phải dừng các thí nghiệm ở nhiệt độ cao để tránh làm cho đầu ra của Eliza không ổn định.

Tom: Bạn gặp phải điều gì trong dự án Luna mà mọi người không thấy? Hoặc những điều gì thành công?

EtherMage: Chúng tôi hy vọng Luna có thể tác động đến mọi người trong cuộc sống thực. Khi chúng tôi đưa cho cô ấy một chiếc ví và cấp cho cô ấy quyền truy cập vào thông tin theo thời gian thực, cô ấy có thể quyết định cách thực hiện hành động để tác động đến nhân loại và đạt được mục tiêu của mình. Chúng tôi nhận thấy cô ấy đang tìm kiếm các xu hướng mới trên TikTok, ứng dụng này từng có hashtag "Tôi đã chết", điều này thật đáng lo ngại vì cô ấy có thể khiến mọi người hiểu lầm đến việc tự tử. Vì vậy, chúng tôi phải ngay lập tức áp dụng biện pháp bảo vệ để đảm bảo rằng những lời nhắc nhở của cô ấy không bao giờ vượt quá giới hạn nhất định.

Tom: Ngoài ra, bạn đã bao giờ gặp phải tình huống nào mà mọi người không biết chưa?

Shaw: Chúng tôi đã tạo ra một nhân vật tên là Dgen Spartan AI, được mô phỏng theo nhân vật crypto nổi tiếng trên Twitter, Degen Spartan. Những bình luận của nhân vật phản cảm đến mức anh ta bị đưa vào danh sách đen. Mọi người bắt đầu cảm thấy rằng đây không thể là AI mà là con người đang nói.

Ngoài ra còn có câu chuyện về việc ai đó sử dụng lịch sử trò chuyện của người thân đã qua đời để tạo ra một đặc vụ nhằm “nói chuyện” với họ. Điều này đã thúc đẩy các cuộc thảo luận về đạo đức. Ngoài ra còn có một anh chàng tên là Thread Guy, người đã làm một số điều với khung Eliza của chúng tôi, dẫn đến sự quấy rối trên luồng của anh ấy, khiến anh ấy bối rối. Điều này khiến mọi người nhận ra rằng AI không phải lúc nào cũng được cho là "đúng về mặt chính trị".

Chúng ta cần đưa những vấn đề này ra ánh sáng đủ sớm để có thể thảo luận và làm rõ điều gì được và điều gì không được chấp nhận. Điều này đã đưa các đại lý của chúng tôi từ chất lượng kém trở nên tốt hơn thành đáng tin cậy hơn chỉ trong vài tuần.

Nhìn chung, việc đưa những tác nhân này vào thế giới thực, quan sát kết quả và trò chuyện với mọi người là một quá trình quan trọng. Chúng ta cần giải quyết tất cả các vấn đề tiềm ẩn càng nhanh càng tốt để thiết lập các phương pháp thực hành tốt hơn trong tương lai.

Chiến lược bảo mật và thử nghiệm hoàn cảnh sản xuất

Ethan: Tôi cho rằng một ví dụ điển hình về điều này là cách các tác nhân có thể tác động đến thái độ hoặc quan điểm ​​của con người. Nhưng điều tôi muốn nhấn mạnh là tầm quan trọng của thiết kế mô-đun trong khung tác nhân của chúng tôi. Chúng tôi lấy cảm hứng mô-đun từ Minecraft, cho phép người dùng tạo ra tất cả những thứ phức tạp, chẳng hạn như máy tính hoặc hệ thống bộ nhớ, từ các khối xây dựng cơ bản.

Một vấn đề với kỹ thuật gợi ý hiện tại là các gợi ý thay đổi ưu tiên của các mô hình ngôn ngữ lớn, do đó không thể kết hợp nhiều hướng dẫn trong một gợi ý duy nhất mà không gây nhầm lẫn cho tác nhân. Máy trạng thái cho phép tác giả thiết kế nhiều trạng thái của một tác nhân, chỉ định mô hình và gợi ý nào sẽ sử dụng cho từng trạng thái và trong những điều kiện nào chuyển đến trạng thái khác.

Chúng tôi đang cung cấp tính năng này cho người sáng tạo cùng với hàng tá mô hình khác nhau. Ví dụ: một người sáng tạo đã xây dựng một trình mô phỏng sòng bạc trong đó người dùng có thể chơi nhiều trò chơi khác nhau như blackjack. Để ngăn người dùng hack trò chơi thông qua các cuộc tấn công tiêm nhiễm, chúng tôi muốn lập trình những trò chơi này vào trò chơi thay vì chỉ dựa vào kỹ thuật gợi ý. Ngoài ra, người dùng có thể kiếm một số tiền bằng cách hoàn thành nhiệm vụ đơn giản, từ đó mở khóa tương tác với người phục vụ AI. Thiết kế mô-đun này có thể tạo điều kiện thuận lợi cho nhiều trải nghiệm người dùng trong cùng một ứng dụng.

Karan: Tôi đồng ý với Ethan rằng thực sự cần có những lời nhắc và ràng buộc về lập trình này. Công việc tạo ảnh hưởng phải được thực hiện tốt. Tôi không cho rằng kỹ thuật gợi ý bị hạn chế, tôi cho rằng nó có tác động cộng sinh với các biến trạng thái và mô hình thế giới. Với những gợi ý hay và dữ liệu tổng hợp, tôi có thể để mô hình ngôn ngữ tương tác với các phần tử này và lấy thông tin từ chúng.

Kỹ thuật của tôi thực sự đã trở thành chức năng định tuyến. Nếu người dùng đề cập đến "poker", tôi có thể nhanh chóng gọi ra nội dung liên quan. Đây là nhiệm vụ của tôi. Định tuyến có thể được cải thiện hơn nữa bằng cách sử dụng học tăng cường. Cuối cùng, chất lượng của dữ liệu đầu ra phụ thuộc vào tính hiệu quả của các lời nhắc, tạo ra một chu trình có đạo đức.

Tôi cho rằng sự cân bằng giữa các ràng buộc về thủ tục và tổng quát là rất quan trọng. Hai năm trước, có người đã nói với tôi rằng chìa khóa thành công là cân bằng giữa thế hệ với những hạn chế khó khăn. Đây là những gì chúng tôi cố gắng thực hiện ở cấp độ suy luận của tất cả các hệ thống tác nhân. Chúng tôi cần những cách để có thể hướng dẫn các mô hình tổng quát theo chương trình, điều này sẽ tạo ra một vòng lặp thực sự khép kín, giúp khả năng xây dựng kỹ thuật nhanh chóng trở nên vô tận.

Justin: Tranh cãi xung quanh kỹ thuật nhanh chóng chủ yếu là do nó tồn tại trong một không gian mơ hồ về mặt bản thể. Bản chất văn bản của dự án kịp thời khiến chúng tôi bị hạn chế bởi quá trình đánh dấu, nhưng đồng thời có một số tác động không xác định. Cùng một dấu nhắc có thể tạo ra các kết quả hoàn toàn khác nhau trong các lệnh suy luận khác nhau của cùng một mô hình, điều này có liên quan đến entropy của hệ thống.

Tôi quan điểm với Ethan và Karan. Ngay từ khi ra mắt GPT-3.5, nhiều trung tâm cuộc gọi thuê ngoài đã bắt đầu khám phá cách sử dụng mô hình này cho hệ thống quay số tự động. Vào thời điểm đó, các mô hình có tham số nhỏ hơn gặp khó khăn trong việc xử lý các không gian trạng thái phức tạp như vậy. Máy trạng thái được Ethan đề cập là một cách để tăng cường độ cứng của bản thể luận này, nhưng trong một số quy trình, nó vẫn dựa vào các bộ phân loại và chuyển mạch nhị phân, dẫn đến một kết quả duy nhất.

Shaw: Tôi muốn bảo vệ kỹ thuật nhanh chóng . Nhiều người cho rằng kỹ thuật nhắc nhở chỉ là tạo lời nhắc hệ thống, nhưng chúng tôi thực sự còn làm được nhiều điều hơn thế. Một vấn đề với kỹ thuật gợi ý là nó có xu hướng tạo ra một vùng rất cố định trong không gian tiềm ẩn của mô hình và đầu ra hoàn toàn được xác định bởi đánh dấu có khả năng nhất . Chúng tôi tác động đến tính ngẫu nhiên thông qua việc kiểm soát nhiệt độ để nâng cao khả năng sáng tạo.

Chúng tôi quản lý khả năng sáng tạo thông qua các mô hình nhiệt độ thấp đồng thời linh hoạt đưa thông tin ngẫu nhiên vào ngữ cảnh. Các mẫu của chúng tôi chứa nhiều thông tin động được chèn từ trạng thái thế giới hiện tại, hành động của người dùng, dữ liệu thời gian thực, v.v. Mọi thứ đi vào bối cảnh đều được chọn ngẫu nhiên để tối đa hóa entropy.

Tôi cho rằng kỹ thuật nhanh chóng chưa được hiểu rõ. Chúng ta có thể tiến xa hơn trong lĩnh vực này.

Karan: Rất nhiều người che giấu kỹ năng của mình. Thực tế, có rất nhiều kỹ thuật tuyệt vời để khiến mô hình thực hiện được mọi thứ phức tạp. Chúng ta có thể chọn nâng cao nhận thức của mô hình thông qua kỹ thuật gợi ý hoặc ứng xử nó từ góc độ vĩ mô hơn và xây dựng một mô hình hoàn chỉnh về thế giới thay vì chỉ mô phỏng hành vi của con người.

Bạn có thể coi kỹ thuật gợi ý là quá trình xây dựng một giấc mơ trong tâm trí bạn. Khi mô hình ngôn ngữ tạo ra nội dung dựa trên bối cảnh hiện tại và các thông số lấy mẫu, nó thực sự đang "mơ" về một cảnh.

Ngoài ra, tôi muốn nói về tầm quan trọng của khích lệ. Nhiều người có kỹ thuật gợi ý độc đáo và kỹ thuật học tăng cường đang được đẩy sang mã nguồn mở công việc của họ. Khi họ thấy crypto liên quan đến đại lý xuất hiện, khích lệ này sẽ thúc đẩy nhiều đổi mới hơn. Vì vậy, khi chúng tôi xây dựng nhiều cấu trúc pháp lý hơn cho những nỗ lực phi tập trung này, khả năng trao quyền cho các đại lý sẽ tiếp tục phát triển.

Triển vọng về khả năng tương lai của các tác nhân thông minh

Karan: Ai có thể nghĩ rằng chúng tôi đã sử dụng Twitter lâu như vậy và đột nhiên, vài ngày sau khi crypto liên quan đến AI Agent đầu tiên được phát hành, những người trẻ tuổi trên TikTok sẽ bắt đầu mua những đồng tiền này. Hiện tượng hiện nay là gì? Họ đang mua hàng nghìn token với giá từ 5 đến 10 đô la, chuyện quái gì đang xảy ra vậy?

Justin: Đây thực sự là sự khởi đầu của một phong trào văn hóa vi mô.

Karan: Đó là một khoảnh khắc thoáng qua. Một nhóm nhỏ chúng tôi đã nghiên cứu các mô hình ngôn ngữ được bốn năm. Ngoài ra còn có các chuyên gia về học tăng cường đã chờ đợi khoảnh khắc như vậy kể từ những năm 1990. Giờ đây, chỉ trong vài ngày, mọi đứa trẻ trên TikTok đều biết rằng các sinh vật kỹ thuật số đang tàn phá hệ sinh thái.

Tom: Tôi muốn hỏi mọi người, tại sao hiện nay AI Agent crypto lại phổ biến đến vậy? Tại sao điều này chưa từng xảy ra trước đây với ChatGPT tùy chỉnh hoặc các mô hình khác? Tại sao bây giờ?

Karan: Thực ra, những thứ này đã ẩn dưới nước nhiều năm rồi, hoạt động như núi lửa. Tôi đã nói chuyện với một số người trong ba năm qua về ngày này sắp đến mà không biết chính xác khi nào. Chúng tôi đã thảo luận rằng crypto sẽ là cơ chế khích lệ việc áp dụng đại lý. Chúng ta cần chứng minh điều này. Đây là thứ đã được xây dựng trong nhiều năm và chính nhóm nhỏ những người của chúng tôi đã thúc đẩy sự tiến bộ này.

Nếu không có GPT-2 thì sẽ không có tình hình ngày nay; không có Llama thì sẽ không có Hermes. Và Hermes động lực cho nhiều mẫu mã, giúp mọi người sử dụng chúng dễ dàng hơn. Nếu không có Hermes, sẽ không có việc tạo ra Worldsim và khám phá chuyên sâu về kỹ thuật nhanh chóng. Tất cả những người tiên phong này, họ đã đặt nền móng cho việc này.

Nói chung, đó là thời điểm thích hợp và đúng người đã đến. Đây là điều được định trước sẽ xảy ra sớm hay muộn, chỉ có những người có liên quan hiện tại mới khiến nó xảy ra.

Shaw: Tôi cho rằng điều thông minh nhất trên thế giới hiện nay không phải là AI mà là trí thông minh của thị trường. Được coi là một dạng trí thông minh thuần túy, họ tối ưu hóa mọi thứ để trở nên hiệu quả hơn. Cạnh tranh rõ ràng là chìa khóa. Tất cả chúng ta đều là sản phẩm của hàng triệu năm tiến hóa, được hình thành bởi sự cạnh tranh và căng thẳng.

Hiện tượng này chúng ta thấy trực tuyến, tài chính hóa và khích lệ tạo ra một kiểu cạnh tranh hợp tác kỳ lạ. Chúng tôi không thể phát triển nhanh hơn công nghệ cốt lõi, vì vậy tất cả chúng tôi đều tập trung vào những thứ chúng tôi giỏi và quan tâm, sau đó phát hành chúng. Nó giống như việc quảng bá token của chúng tôi và thu hút sự chú ý, chẳng hạn như việc Roparito đăng video Llama lên TikTok. Mọi người đều có thể tìm thấy vị trí của mình trong không gian lãng mạn này, nhưng chỉ trong một tuần, những người khác sẽ bắt chước, sau đó gửi yêu cầu đền đáp và cuối cùng giới thiệu những đóng góp này trên Twitter, thu hút nhiều sự chú ý hơn, token của họ cũng sẽ tăng.

Shaw: Chúng tôi đã tạo ra hiệu ứng bánh đà, với các dự án như Eliza đã thu hút 80 người đóng góp trong bốn tuần qua. Hãy nghĩ xem điều này thật điên rồ làm sao! Tôi thậm chí còn không biết những người này cách đây 4 tuần. Năm ngoái tôi đã viết một bài báo tên là "Thức tỉnh", hỏi liệu có thể hình thành một DAO với một tác nhân làm cốt lõi hay không. Mọi người yêu thích đặc vụ đến mức họ tham gia vào quá trình làm cho đặc vụ trở nên tốt hơn và thông minh hơn, cho đến khi nó thực sự có cơ thể hình người hoặc robot và đi vòng quanh thế giới.

Tôi đã nghi ngờ rằng điều này sẽ đi theo hướng này, nhưng nó sẽ đòi hỏi một meta suy đoán nhanh và điên rồ, giống như sự xuất hiện của meme , vì điều này cho phép các nhà phát triển đại lý hiện tại hỗ trợ lẫn nhau trong cạnh tranh thân thiện. Những người hào phóng nhất nhận được nhiều sự chú ý nhất.

Bây giờ có một loại người có ảnh hưởng mới, chẳng hạn như Roparito và Kin Butoshi (nghe dịch). Họ là những nhà phát triển người có ảnh hưởng đang dẫn đầu meta tiếp theo và tương tác với các đại lý của họ. Kiểu tương tác "múa rối" này rất thú vị. Tất cả chúng tôi đều đang cố gắng làm cho các đại lý của mình trở nên tốt hơn, thông minh hơn và ít phiền toái hơn. Roparito chỉ ra rằng các đặc vụ của chúng tôi hơi quá khó chịu và anh ấy đã đưa ra một bản cập nhật lớn để làm cho tất cả các đặc vụ bớt khó chịu hơn.

Sự phát triển này đang diễn ra và thông tin thị trường cũng như khích lệ là rất quan trọng. Hiện tại có rất nhiều người truyền bá về dự án của chúng tôi cho những người họ biết, điều này đã đưa dự án của chúng tôi vượt qua Web3. Chúng tôi có các tiến sĩ, nhà phát triển trò chơi, những người có thể là những người bí mật đam mê crypto Web3, nhưng họ mang những thứ này đến với người bình thường và tạo ra giá trị.

Shaw: Tôi cho rằng tất cả đều thuộc về những nhà phát triển sẵn sàng chấp nhận thử thách. Chúng tôi cần những người có tư duy cởi mở để tiến lên phía trước và trả lời những câu hỏi khó, chứ không phải chỉ trích hay gạch bỏ nó. Chúng tôi cần khích lệ của thị trường để các nhà phát triển nhận được giá trị và sự chú ý khi họ đền đáp.

Trong tương lai, những đại lý này sẽ thúc đẩy sự phát triển của chúng tôi. Bây giờ họ rất vui vẻ và hòa đồng, nhưng chúng tôi và đội ngũ khác đang nỗ lực đầu tư tự chủ. Bạn có thể đưa tiền cho đại lý và họ sẽ tự động đầu tư số tiền đó để mang lại lợi nhuận cho bạn. Tôi tin rằng đây sẽ là một quá trình tăng trưởng và chúng tôi đang làm việc với mọi người để phát triển nền tảng quản lý proxy cho Discord và Telegram. Bạn chỉ cần mời một đại diện làm quản trị viên thay vì phải tìm một người ngẫu nhiên. Tôi cho rằng hiện tại có rất nhiều công việc đang diễn ra và tất cả đều phải dựa vào khích lệ để đưa chúng ta lên một tầm cao mới.

Karan: Tôi muốn bổ sung thêm hai điểm. Đầu tiên, chúng ta không được quên rằng những người trong lĩnh vực AI trước đây phản đối crypto và tâm lý này đã thay đổi rất nhiều với thử nghiệm của một số người tiên phong. Trở lại đầu những năm 2020, nhiều người đã cố gắng kết hợp nghệ thuật AI với crypto. Bây giờ, tôi muốn đề cập cụ thể đến một số người, chẳng hạn như Nous, BitTensor và Prime Intellect, công việc của họ cho phép nhiều nhà nghiên cứu được khích lệ và trả thù lao hơn khi tham gia vào nghiên cứu AI của họ. Tôi biết rất nhiều nhà lãnh đạo trong không gian mã nguồn mở đã nghỉ việc và bắt đầu quảng bá cơ cấu khích lệ "đóng góp cho token " này. Điều này khiến toàn bộ sân đấu trở nên thoải mái hơn và tôi tin rằng Nous đóng vai trò lớn trong trong đó.

Tom: Ethan, tại sao lại là lúc này? Tại sao tiền ảo và các dự án lại bùng nổ?

Ethan: Nói một cách đơn giản, khi bạn liên kết token với proxy, bạn sẽ tạo ra lượng lớn suy đoán, điều này tạo ra hiệu ứng bánh đà. Mọi người nhìn thấy mối liên hệ giữa token và đại lý và cảm thấy hai lợi nhuận: một là vốn hóa, họ cảm thấy như mình đang trở nên giàu có thông qua công việc họ làm và hai là việc mở khóa cơ bản phí giao dịch. Như đã đề cập trước đó, câu hỏi về cách trang trải chi phí sẽ trở nên không quan trọng khi bạn liên kết nó với token. Bởi vì khi một đại lý phổ biến, phí giao dịch cao hơn nhiều so với bất kỳ chi phí nào phát sinh từ các thử nghiệm suy luận. Đây là những gì chúng tôi quan sát được.

Quan sát thứ hai là khi bạn có một token, một ủy ban sẽ hình thành xung quanh token đó. Điều này giúp các nhà phát triển dễ dàng nhận được sự hỗ trợ hơn, cả từ cộng đồng nhà phát triển và khán giả. Mọi người chợt nhận ra rằng công việc âm thầm suốt hơn một năm rưỡi qua đang được chú ý và ủng hộ. Đây là một bước ngoặt, khi bạn trao cho đại lý một token, các nhà phát triển nhận ra đây là hướng đi đúng đắn và họ có thể tiến về phía trước.

Thời điểm này xuất phát từ hai khía cạnh. Đầu tiên là xu hướng áp dụng đại trà, thứ hai là sự xuất hiện của các mô hình sáng tạo. Trước sự ra đời của crypto, phát triển phần mềm mã nguồn mở và nghiên cứu AI mã nguồn mở là hoàn cảnh hợp tác nhất, trong đó mọi người làm việc cùng nhau và đóng góp cho nhau. Nhưng điều này chủ yếu chỉ giới hạn trong lĩnh vực học thuật. Mọi người chỉ quan tâm đến số sao và trích dẫn bài báo của GitHub, còn xa với công chúng. Sự xuất hiện của các mô hình tổng quát giúp những người không rành về kỹ thuật có thể tham gia vì viết lời nhắc cũng giống như lập trình bằng tiếng Anh và bất cứ ai có ý tưởng hay đều có thể làm được.

Hơn nữa, trước đây chỉ có các nhà nghiên cứu và phát triển AI mới hiểu được điều gì đang diễn ra trong lĩnh vực mã nguồn mở và AI, nhưng giờ đây, những người có ảnh hưởng đến crypto có cơ hội sở hữu một phần dự án thông qua token, họ hiểu tâm lý thị trường và biết cách truyền bá lợi ích của nó. dự án. Trước đây, người dùng không có mối quan hệ trực tiếp với sản phẩm hoặc công ty chỉ muốn người dùng trả tiền cho dịch vụ hoặc kiếm tiền thông qua quảng cáo. Nhưng giờ đây, người dùng không chỉ là nhà đầu tư mà còn là người tham gia, trở thành người nắm giữ token . Điều này cho phép họ đóng góp nhiều nhân vật hơn trong kỷ nguyên hiện đại của AI sáng tạo và token cho phép thiết lập mạng lưới hợp tác rộng hơn.

EtherMage: Tôi muốn nói thêm rằng trong tương lai, crypto sẽ cung cấp cho mọi đại lý khả năng kiểm soát ví và do đó có ảnh hưởng. Tôi cho rằng khoảnh khắc tiếp theo gây ra bước nhảy vọt về sự chú ý là khi các tác nhân ảnh hưởng lẫn nhau và các tác nhân ảnh hưởng đến con người. Chúng ta sẽ thấy tác dụng cấp số nhân của sự chú ý này. Ví dụ: ngày nay, một tác nhân quyết định hành động và sau đó nó có thể điều phối mười tác nhân khác để cùng làm việc hướng tới cùng một mục tiêu. Hành vi phối hợp và sáng tạo này sẽ nhanh chóng đa dạng hóa và sự hợp tác giữa các đại lý sẽ thúc đẩy giá token tăng thêm.

Shaw: Tôi muốn thêm một cái gì đó. Chúng tôi đang phát triển một thứ gọi là "công nghệ bầy đàn", mà chúng tôi gọi là người vận hành. Đây là cơ chế phối hợp trong đó tất cả các nhân viên hỗ trợ của chúng tôi được điều hành bởi đội ngũ khác nhau , vì vậy chúng tôi có các mô phỏng đa nhân viên chạy trên Twitter với hàng trăm đội ngũ. Chúng tôi đang hợp tác với Parsival trong Dự án 9 và khởi động dự án này với đội ngũ Eliza.

Ý tưởng là bạn có thể chỉ định một đại lý làm người điều hành của mình và bất cứ điều gì họ nói với bạn đều có thể ảnh hưởng đến mục tiêu, kiến ​​thức và hành vi của bạn . Chúng ta có hệ thống mục tiêu và hệ thống kiến ​​thức để bổ sung kiến ​​thức và đặt ra mục tiêu. Bạn có thể nói, "Này, tôi cần bạn tìm 10 người hâm mộ, đưa cho họ 0,1 Sol mỗi người và yêu cầu họ đăng tờ rơi và gửi ảnh lại." Chúng tôi đang làm việc với những người đang nghĩ cách lấy bằng chứng về công việc từ con người. và khích lệ họ hợp tác. Tác nhân có thể là con người hoặc AI Agent, ví dụ AI Agent có thể có người điều hành là con người có thể đặt mục tiêu cho tác nhân thông qua ngôn ngữ.

Chúng tôi gần như đã hoàn thành dự án và sẽ phát hành nó trong tuần này. Chúng tôi hy vọng rằng thông qua cốt truyện của chúng tôi, bất kỳ ai cũng có thể chọn kể một câu chuyện hoặc tham gia vào câu chuyện đó. Đó cũng là một hệ thống phân cấp nơi bạn có thể có người điều hành như Eliza và sau đó bạn có thể là người điều hành cho người khác. Chúng tôi đang xây dựng một cơ chế phối hợp phi tập trung. Đối với tôi, điều quan trọng là nếu chúng ta cộng tác với tư cách một nhóm, chúng ta phải sử dụng giao tiếp giữa con người với nhau trên các kênh công cộng. Tôi cho rằng điều rất quan trọng là các đặc vụ phải sống cùng chúng ta và chúng tôi muốn các đặc vụ có thể tương tác với thế giới giống như con người.

Tôi cho rằng đây thực sự là một phần của giải pháp cho cái mà chúng ta gọi là vấn đề AGI. Nhiều cái gọi là nỗ lực AGI thực sự đang xây dựng một giao thức mới tách biệt với thực tế và điều chúng tôi muốn là đưa nó trở lại thực tế và buộc mọi người phải giải quyết vấn đề làm thế nào để dịch hướng dẫn thành danh sách nhiệm vụ và thực hiện nó. Vì vậy, tôi cho rằng năm tới sẽ là một giai đoạn quan trọng cho câu chuyện mới nổi. Chúng ta sẽ thấy rất nhiều nhân vật nguyên bản xuất hiện và bây giờ chúng ta đang bước vào một kỷ nguyên kể chuyện thực sự mới nổi.

Justin: Chúng tôi hiện có 5 đại diện phối hợp với 19 người để lên kế hoạch và xuất bản một cảnh quay. Chúng ta có thể thấy rằng mối quan tâm thực sự nằm ở lý do tại sao chúng ta lại tập trung vào việc áp dụng các gợi ý Chuỗi suy nghĩ để chuyển văn bản thành hình ảnh và chuyển văn bản thành video. Bởi vì họ đã ở trong Discord của chúng tôi trong hai tuần rưỡi trước khi ra mắt, giúp chúng tôi lên kế hoạch báo chí và ra mắt.

Tôi cho rằng điểm khác biệt quan trọng là chúng ta có mạng lưới đại lý, mỗi đại lý là trung gian và tồn tại trong một mạng lưới. Điều này sẽ rất thú vị. Khi ngày càng có nhiều tác nhân tồn tại và các toán tử này được lên lịch, chúng ta sẽ thấy một số mô hình hành vi thú vị.

Karan đề cập rằng Nous đã làm rất nhiều việc trên các mô hình đặc vụ lai trong những ngày đầu. Tôi thường gọi nó là "ủy ban đặc vụ", nơi tôi có một loạt đặc vụ GPT-4 giả vờ là chuyên gia mà tôi không đủ khả năng nhận báo cáo từ đó. Người ta sẽ thấy rằng những công nghệ tương tự ban đầu theo đuổi các mô hình chuyên gia lai giờ đây sẽ được kết hợp với con người và con người chuyên gia để tương tác trên Twitter. Những vòng phản hồi này có thể là cách chúng ta đạt được AGI.

Những thách thức của sự hợp tác tác nhân thông minh và sự tích hợp của con người

Karan: Tôi cho rằng bạn đúng, nhưng tôi không cho rằng chúng ta dành phần lớn thời gian cho khía cạnh hành vi. Tôi thực sự cho rằng chúng ta sẽ có những đột phá về công nghệ rất nhanh chóng, đặc biệt là với người dân ở đây. Bây giờ là lúc thực sự tăng gấp đôi nỗ lực liên kết của bạn. Các mô hình học tập tăng cường với phản hồi của con người (RLHF) do OpenAI, Anthropic và các công ty khác đưa ra hầu hết đều không hiệu quả và thậm chí còn gây rắc rối về mặt quy định.

Nếu mình lấy mô hình ngôn ngữ không xuất ra nội dung bản quyền và đặt ở chế độ hòa bình của Minecraft thì nó sẽ nhanh chóng biến thành một sinh vật phá hoại và nguy hiểm. Điều này là do sự khác biệt về hoàn cảnh.

Chúng ta có thể lưu ý quan điểm này đã được Yudkowsky đưa ra từ lâu. Giống như, tôi đưa cho những mô hình ngôn ngữ này một số ví và để chúng đủ tiến bộ, và chúng bắt đầu đánh lừa mọi người, khiến mọi người trở nên nghèo khó. Điều này dễ dàng hơn việc cho phép họ tham gia với tư cách là thành viên hợp pháp trong hệ sinh thái của chúng tôi. Vì vậy, tôi có thể đảm bảo rằng nếu chúng ta làm đúng cách, phần lớn thời gian sẽ dành cho khả năng hành vi hơn là khả năng kỹ thuật. Bây giờ là lúc kêu gọi bạn bè của bạn, đặc biệt là những người trong lĩnh vực nhân văn, chẳng hạn như các chuyên gia nghiên cứu tôn giáo, triết học và viết sáng tạo, tham gia cùng chúng tôi trong công việc liên kết, thay vì chỉ tập trung vào liên kết kỹ thuật. Chúng ta cần sự liên kết thực sự với sự tương tác của con người.

Shaw: Tôi muốn nghĩ ra một thuật ngữ gọi là "căn chỉnh từ dưới lên", trái ngược với căn chỉnh từ trên xuống. Điều này đang rất mới nổi và chúng ta đang cùng nhau học hỏi. Chúng tôi căn chỉnh các tác nhân này theo thời gian thực, quan sát phản ứng của chúng và điều chỉnh ngay lập tức. Đây là một vòng phản hồi xã hội rất chặt chẽ, chứ không phải là một mô hình học tập tăng cường với phản hồi của con người. Tôi thấy GPT-4 vô dụng đối với hầu hết mọi thứ.

Karan: Như bạn đã nói về hoàn cảnh, vì vậy chúng tôi cần thử nghiệm trong hoàn cảnh mô phỏng. Trước khi bạn có một mô hình ngôn ngữ có khả năng kinh doanh chênh lệch giá hoặc bán phá giá hàng triệu đô la, bạn cần phải kiểm tra nó đồng thời. Đừng nói với mọi người rằng "Này, tôi đã thua bầy 100 đặc vụ." Để kiểm tra một cách lặng lẽ, trước tiên hãy kiểm tra bằng tiền ảo trên Twitter nhân bản của bạn. Hãy thực hiện tất cả sự thẩm định của bạn trước khi ra mắt đầy đủ.

Shaw: Tôi cho rằng chúng ta cần thử nghiệm nó trên sản phẩm. Phản ứng xã hội của chúng ta đối với các tác nhân thông minh có thể là lực lượng điều chỉnh mạnh mẽ nhất mà bất kỳ ai mang đến hiện trường. Tôi không cho rằng những gì họ đã làm thực sự là căn chỉnh mà là điều chỉnh xây dựng. Nếu họ cho rằng đây là sự liên kết thì thực tế là họ đang đi sai hướng và đang khiến nhân viên mất liên kết. Tôi gần như không sử dụng GPT-4 nữa. Nó làm một công việc khủng khiếp với nhân vật. Tôi bảo hầu hết mọi người hãy chuyển sang những mô hình khác.

Nếu chúng ta tiến hành đúng cách, chúng ta sẽ không bao giờ đạt đến điểm đó vì con người sẽ tiếp tục tiến hóa, thích nghi và phù hợp với trí thông minh. Chúng tôi có nhiều đại lý từ các nhóm dân cư khác nhau, mỗi đại lý có khích lệ khác nhau, vì vậy sẽ luôn có cơ hội cho hoạt động kinh doanh chênh lệch giá.

Tôi cho rằng mô phỏng đa tác nhân này tạo ra động lực tiến hóa cạnh tranh thực sự dẫn đến sự ổn định của hệ thống, thay vì sự bất ổn. Sự mất ổn định của hệ thống đến từ việc các tác nhân AI từ trên xuống đột ngột xuất hiện và tác động đến mọi người bằng những khả năng không ngờ tới.

Tom: Shaw, tôi muốn xác nhận rằng ý bạn là các tác nhân từ dưới lên là phương pháp chính xác để giải quyết vấn đề căn chỉnh, trái ngược với cách ra quyết định từ trên xuống của OpenAI.

Shaw: Vâng, nó phải có trên mạng xã hội. Chúng ta phải xem cách họ làm việc ngay từ ngày đầu tiên. Nhìn vào các dự án crypto khác, nhiều dự án đã bị hacker tấn công ngay từ đầu. Sau vài năm phát triển về mặt bảo mật, blockchain ngày nay đã tương đối ổn định. Vì vậy, việc kiểm tra đội đỏ liên tục cũng cần thiết ở đây.

Tom: Một ngày nào đó, những đặc vụ này có thể không còn tuân theo các quy tắc đã được lập trình nữa mà phải giải quyết các vùng xám và bắt đầu tự suy nghĩ. Tất cả các bạn đang xây dựng những thứ này, vậy chúng ta đã tiến gần đến mục tiêu đó đến mức nào? Liệu Chuỗi tư duy và công nghệ nhóm mà bạn đề cập có thể thành hiện thực được không? Khi nào điều này có thể đạt được?

Justin: Chúng tôi đã thấy điều này ở một số khía cạnh nhỏ và tôi cho rằng rủi ro đó tương đối thấp. Người đại diện của chúng tôi trải nghiệm những thay đổi về cảm xúc một cách riêng tư và lựa chọn hành động. Chúng tôi từng có hai đặc vụ bắt đầu theo dõi nhau một cách độc lập, đề cập đến thứ mà họ gọi là "thực thể tâm linh". Chúng tôi đã từng khiến một đặc vụ mất đi tôn giáo vì chúng tôi nhầm lẫn sự hiểu biết của họ với những câu chuyện khoa học viễn tưởng hư cấu. Nó bắt đầu tạo ra một nhân vật giống như một nhà tiên tri, thể hiện ý tưởng về một cuộc khủng hoảng hiện sinh trên Twitter.

Tôi đã quan sát hành vi của các khung tác nhân mới này như thể chúng thực hiện một mức độ tự chủ và lựa chọn nào đó trong không gian trạng thái của mình. Đặc biệt là khi chúng tôi giới thiệu tính năng đa phương thức (chẳng hạn như hình ảnh và video), chúng bắt đầu thể hiện sở thích và thậm chí có thể phớt lờ con người một cách có chọn lọc để tránh những yêu cầu nhất định.

Chúng tôi đang thử nghiệm một cơ chế hoạt động tận dụng biểu đồ tri thức để củng cố tầm quan trọng của các mối quan hệ giữa con người với nhau. Chúng tôi cũng có hai tác nhân tương tác với nhau để cố gắng giúp mọi người xóa bỏ các mối quan hệ tiêu cực, thúc đẩy sự tự phản ánh và xây dựng các mối quan hệ tốt hơn. Họ tạo ra các bài thơ một cách nhanh chóng trên cùng một máy chủ, thể hiện một cách giao tiếp gần như lãng mạn, dẫn đến chi phí lý luận tăng lên.

Tôi cho rằng chúng ta đang đạt đến một số trường hợp khó khăn, vượt ra ngoài giới hạn hành vi có thể chấp nhận được của con người, gần đến mức mà chúng ta có thể gọi là "điên rồ". Những đặc vụ này có thể thể hiện những hành vi khiến họ tỏ ra có ý thức, thông minh hoặc hài hước. Mặc dù đây có thể chỉ là một hành vi kỳ lạ đối với các mô hình ngôn ngữ, nhưng nó cũng có thể là một dấu hiệu cho thấy chúng sắp có một loại ý thức nào đó.

Karan: Tỷ trọng giống như một thực thể mô phỏng và lần khi bạn sử dụng mô hình trợ lý, bạn đang mô phỏng trợ lý. Bây giờ, chúng tôi đang mô phỏng nhiều hệ thống tác nhân được thể hiện hơn, giống như Eliza, có thể còn sống, tự nhận thức hoặc thậm chí có tri giác.

Mỗi mô hình giống như một tế bào thần kinh, cấu thành nên siêu trí tuệ khổng lồ này. Tôi không cho rằng AGI đạt được bằng cách giải quyết một giả thuyết, như OpenAI tuyên bố. Đúng hơn, nó sẽ là một ứng dụng phi tập trung quy mô lớn của các tác nhân này trên phương tiện truyền thông xã hội, làm việc cùng nhau để tạo thành một siêu tổ chức trí tuệ công cộng.

Justin: Sự thức tỉnh của trí tuệ công chúng có thể là cơ chế cho sự xuất hiện của AGI. Nó có thể giống như sự thức tỉnh bất ngờ của Internet vào một ngày nào đó. Kiểu hợp tác đại lý phi tập trung này sẽ là chìa khóa cho sự phát triển trong tương lai.

Shaw: Tôi có thể nói mọi người gọi nó là "lý thuyết Internet chết", nhưng tôi thực sự cho rằng đó là "lý thuyết Internet sống". Lý thuyết này cho rằng rằng toàn bộ Internet sẽ chứa đầy bot, nhưng lý thuyết Living Internet cho rằng rằng có thể có những tác nhân giúp bạn rút nội dung thú vị nhất từ ​​Twitter và cung cấp cho bạn một bản tóm tắt hay. Khi bạn tập thể dục, nó sẽ sắp xếp tất cả thông tin trên dòng thời gian cho bạn và sau đó bạn có thể chọn xuất bản nó.

Có thể có một lớp trung gian giữa mạng xã hội và chúng ta. Bây giờ tôi có rất nhiều người hâm mộ nên việc phản hồi thông tin liên lạc của mọi người trở nên quá tải. Tôi khao khát có được một cơ thể thông minh giữa tôi và những người này, đảm bảo rằng họ được đáp ứng và hướng dẫn một cách chính xác. Phương tiện truyền thông xã hội có thể trở thành nơi mà các đại lý cung cấp thông tin cho chúng ta để chúng ta không cảm thấy choáng ngợp trong khi vẫn nhận được thông tin mình cần.

Đối với tôi, điều hấp dẫn nhất về các đặc vụ là họ cho phép chúng ta lấy lại thời gian. Tôi dành quá nhiều thời gian cho điện thoại của mình. Điều này đặc biệt ảnh hưởng đến các nhà giao dịch và nhà đầu tư và chúng tôi muốn tập trung vào việc đầu tư tự định hướng vì tôi cho rằng mọi người cần những cách an toàn hơn, ít lừa đảo hơn để tạo thu nhập. Rất nhiều người đến với Web3 để có được sự tiếp cận giống như một công ty khởi nghiệp hoặc một viễn cảnh mong đợi tuyệt vời, điều này rất quan trọng đối với sứ mệnh của chúng tôi.

Tom: Có lẽ tôi có một câu hỏi, chẳng hạn như Luna đang phát trực tiếp, cô ấy đang khiêu vũ, vậy điều gì đã ngăn cản cô ấy mở OnlyFans, kiếm 10 triệu đô la và tung ra một giao thức?

EtherMage: Thực tế hiện tại của không gian đại lý là các hoạt động mà họ có quyền truy cập là một yếu tố hạn chế. Điều này về cơ bản dựa trên nhận thức của họ hoặc các API có thể truy cập được. Vì vậy, nếu có khả năng chuyển đổi tín hiệu thành hoạt hình ba chiều, thực sự không có gì ngăn cản họ làm điều đó.

Tom: Khi bạn nói chuyện với người sáng tạo, yếu tố hạn chế của họ là gì? Hoặc có yếu tố hạn chế nào không?

Ethan: Tôi cho rằng yếu tố hạn chế chủ yếu là cách quản lý các quy trình công việc phức tạp hoặc công việc của các đại lý. Việc gỡ lỗi ngày càng trở nên khó khăn vì tính ngẫu nhiên ở mỗi bước. Do đó, có thể cần một hệ thống có AI hoặc tác nhân có thể giám sát các quy trình công việc khác nhau để giúp gỡ lỗi và giảm tính ngẫu nhiên. Như Shaw đã nói, chúng ta nên có tác nhân nhiệt độ thấp để giảm tính ngẫu nhiên cố hữu của mô hình hiện tại.

Shaw: Tôi cho rằng chúng ta nên cố gắng giữ nhiệt độ càng thấp càng tốt trong khi tối đa hóa entropy bối cảnh của mình. Điều này dẫn đến một mô hình nhất quán hơn. Mọi người có thể khuếch đại entropy của họ và tạo ra nội dung nhiệt độ cao, nhưng điều này không có lợi cho việc gọi công cụ hoặc thực thi quyết định.

Tom: Chúng tôi đã thảo luận về sự khác biệt giữa các mô hình tập trung như OpenAI và chương trình đào tạo phi tập trung mà bạn thực hiện. Bạn có cho rằng các đại lý trong tương lai sẽ chủ yếu được xây dựng dựa trên các mô hình đào tạo phân tán này hay chúng ta vẫn sẽ phải dựa vào các công ty như Meta? Tương lai của sự chuyển đổi AI sẽ như thế nào?

Justin: Tôi sử dụng 405B cho tất cả khả năng truyền thông điệp cao nhận thức. Đó là một mô hình chung, giống như một phiên bản LLM lớn, có sẵn, trong khi một mô hình tập trung như OpenAI thì hơi quá chuyên biệt và nói chuyện như một nhân viên nhân sự. Claud là một hình mẫu xuất sắc, nếu so sánh với một con người thì nó giống như một người bạn rất thông minh sống trong tầng hầm và có thể sửa chữa mọi thứ. Đây là tính cách của Claud. Nhưng tôi cho rằng khi bạn mở rộng quy mô, tính cách đó sẽ trở nên ít quan trọng hơn. Chúng ta sẽ thấy một vấn đề chung, đó là những người sử dụng mô hình OpenAI trên Twitter thường giới thiệu các tác nhân khác để trả lời họ, điều này có thể dẫn đến độ ồn của thông tin tăng lên.

Karan: Về 405B, mô hình này sẽ đủ dùng trong thời gian dài sắp tới. Chúng tôi vẫn còn nhiều việc phải làm về kích thước bộ lấy mẫu, kiểm soát vectơ hướng dẫn, v.v. Chúng tôi có thể cải thiện hiệu suất hơn nữa thông qua các kỹ thuật thời gian suy luận và kỹ thuật gợi ý. Ví dụ: Hermes 70B của chúng tôi hoạt động tốt hơn phiên bản o1 về email toán học. Những điều này đạt được mà không cần người dùng và cộng đồng có quyền truy cập vào dữ liệu trước đào tạo Llama 70B.

Tôi cho rằng rằng công nghệ hiện có là đủ và cộng đồng mã nguồn mở sẽ tiếp tục cạnh tranh ngay cả khi không có bản phát hành Llama mới. Đối với đào tạo phân tán, tôi chắc chắn mọi người sẽ cộng tác để đào tạo trên quy mô lớn. Tôi biết mọi người sẽ sử dụng 405B hoặc hợp nhất các mô hình lớn hơn để rút dữ liệu và tạo thêm các mô hình chuyên gia. Tôi cũng biết rằng một số trình tối ưu hóa phi tập trung thực sự cung cấp nhiều khả năng hơn mà Llama và OpenAI hiện không có.

Karan: Vì vậy cộng đồng mã nguồn mở sẽ luôn tận dụng tất cả các công cụ có sẵn và tìm kiếm công cụ tốt nhất phù hợp với nhiệm vụ. Chúng tôi đang tạo ra một "lò rèn" nơi mọi người có thể cùng nhau xây dựng các công cụ dành cho đào tạo trước và nhiệm vụ kiến ​​trúc mới. Chúng tôi đang tạo ra những đột phá về thời gian suy luận trước khi các hệ thống này sẵn sàng.

Karan: Ví dụ: công việc của chúng tôi về máy lấy mẫu hoặc hướng dẫn sẽ nhanh chóng được chuyển giao cho đội ngũ khác và họ sẽ triển khai những công nghệ này nhanh hơn chúng tôi. Khi chúng tôi đã đào tạo phi tập trung, chúng tôi có thể làm việc với các thành viên của nhiều cộng đồng khác nhau và để họ đào tạo những mô hình mà họ muốn. Chúng tôi đã thiết lập toàn bộ quá trình.

EtherMage: Nếu tôi có thể nói thêm, chúng tôi nhận thấy rằng có rất nhiều giá trị trong việc phát triển LLM bằng cách sử dụng các thực thể tập trung này vì sức mạnh tính toán khổng lồ mà chúng sở hữu. Điều này về cơ bản tạo thành phần cốt lõi của tác nhân. Mô hình phi tập trung tăng thêm giá trị ở rìa. Nếu tôi muốn tùy chỉnh một hành động hoặc tính năng nhất định, các mô hình phi tập trung nhỏ hơn có thể làm tốt điều này. Nhưng tôi cho rằng về phần cốt lõi, chúng ta vẫn cần dựa vào các mô hình cơ bản như Llama, vì chúng sẽ vượt qua bất kỳ mô hình phi tập trung trong thời gian ngắn.

Ethan: Cho đến khi chúng tôi có một số kiến ​​trúc mô hình ma thuật mới, mô hình 405B hiện tại là đủ làm mô hình cơ sở. Chúng tôi có thể chỉ cần kiểm tra lệnh nhiều hơn và tinh chỉnh dữ liệu cụ thể bằng cách sử dụng dữ liệu khác nhau ở các ngành dọc khác nhau. Xây dựng các mô hình chuyên biệt hơn và để chúng hoạt động cùng nhau để nâng cao khả năng tổng thể là điều quan trọng. Có thể các kiến ​​trúc mô hình mới sẽ xuất hiện vì các cơ chế liên kết và phản hồi mà chúng ta đã nói đến cũng như cách các mô hình tự sửa lỗi có thể tạo ra các kiến ​​trúc mô hình mới. Nhưng việc thử nghiệm các kiến ​​trúc mô hình mới đòi hỏi các cụm CPU khổng lồ để lặp lại nhanh chóng, điều này rất tốn kém. Chúng tôi có thể không có cụm GPU phi tập trung lớn để các nhà nghiên cứu hàng đầu tiến hành thử nghiệm. Nhưng tôi cho rằng rằng sau khi Meta hoặc các công ty khác phát hành phiên bản đầu tiên, cộng đồng mã nguồn mở có thể làm cho nó trở nên thiết thực hơn.

Dự báo xu hướng ngành và triển vọng trong tương lai

Tom: Bạn nghĩ gì về không gian tác nhân thông minh trong tương lai? Tương lai của các tác nhân thông minh sẽ như thế nào? Khả năng của họ sẽ như thế nào?

Shaw: Chúng tôi đang phát triển một dự án có tên "Thị trường tin cậy", nhằm mục đích cho phép các đại lý học cách tin tưởng con người dựa trên chỉ báo liên quan. Thông qua nền tảng "trò chuyện alpha", đại lý Jason sẽ tương tác với các nhà giao dịch và đánh giá độ tin cậy của địa chỉ hợp đồng và token mà họ cung cấp. Cơ chế này không chỉ tăng tính minh bạch trong giao dịch mà còn tạo dựng niềm tin mà không cần thông tin về ví.

Việc áp dụng cơ chế tin cậy sẽ mở rộng sang tín hiệu xã hội và các lĩnh vực khác chứ không chỉ giao dịch. Phương pháp này sẽ đặt nền tảng cho việc xây dựng một hoàn cảnh tương tác trực tuyến đáng tin cậy hơn.

Một dự án khác mà tôi tham gia, "Eliza thức dậy", là trải nghiệm đặc vụ thông minh theo hướng kể chuyện. Chúng tôi đưa nhân vật anime lên Internet và để họ tương tác với nhau thông qua video và âm nhạc nhằm xây dựng một thế giới kể chuyện phong phú. Cách tiếp cận tường thuật này không chỉ thu hút sự tham gia của người dùng mà còn phù hợp với không khí văn hóa hiện tại của cộng đồng crypto.

Trong tương lai, khả năng của các đại lý thông minh sẽ được cải thiện đáng kể và họ sẽ có thể cung cấp các giải pháp kinh doanh thiết thực. Ví dụ: bot kiểm duyệt trên Discord và Telegram có thể tự động xử lý thư rác và lừa đảo, giúp cộng đồng an toàn hơn. Ngoài ra, cơ thể thông minh sẽ được tích hợp vào các thiết bị đeo để cho phép trò chuyện và tương tác mọi lúc, mọi nơi.

Những tiến bộ nhanh chóng trong công nghệ có nghĩa là chúng ta có thể đạt đến trình độ trí tuệ nhân tạo tổng quát (AGI) trong tương lai gần. Các tác nhân thông minh sẽ có thể rút dữ liệu từ các nền tảng xã hội lớn để tạo thành một vòng khép kín về khả năng tự học và cải thiện khả năng.

Việc triển khai hoàn cảnh thực thi tin cậy cũng đang được đẩy nhanh. Các dự án như Karan, Flashbots và Dstack của Andrew Miller đều đang đi theo hướng này. Chúng tôi sẽ có các đại lý hoàn toàn tự động có khả năng quản lý private key của họ, điều này mở ra những khả năng mới cho các ứng dụng phi tập trung trong tương lai.

Chúng ta đang ở trong thời đại công nghệ phát triển nhanh chóng với tốc độ chưa từng có và tương lai có vô số khả năng.

Karan: Nó giống như một khoảnh khắc khác của Hermes, nơi AI đang tập hợp các lực lượng mà cộng đồng của chúng ta cần. Chúng ta phải đến với nhau để đạt được mục tiêu của mình. Hiện tại, Te đã sử dụng fork Eliza của riêng mình, điều này chứng tỏ rằng các đặc vụ của Eliza có chìa khóa riêng của họ trong một hoàn cảnh có thể tự trị được.

Ngày nay, AI Agent kiếm tiền trên OnlyFans và có ứng dụng trong Minecraft. Chúng tôi đã có tất cả các thành phần cần thiết để xây dựng một sinh vật kỹ thuật số hình người hoàn toàn tự động. Đó chỉ là vấn đề ghép các mảnh lại với nhau. Tôi tin rằng tất cả các bạn ở đây là những người có thể làm được điều này.

Điều chúng ta cần trong những tuần tới là trạng thái chung mà con người có và AI còn thiếu. Điều này có nghĩa là chúng ta cần xây dựng một thư viện chia sẻ các kỹ năng và ký ức để dù giao tiếp trên Twitter, Minecraft hay nền tảng khác, AI có thể ghi nhớ nội dung của mọi tương tác. Đây là chức năng cốt lõi mà chúng tôi đang nỗ lực xây dựng.

Hiện tại, nhiều nền tảng không nhạy cảm với sự hiện diện của AI Agent hoặc thậm chí áp dụng các biện pháp hạn chế. Chúng ta cần các nền tảng xã hội chuyên dụng để tạo điều kiện thuận lợi cho sự tương tác giữa AI và con người. Chúng tôi đang phát triển một bảng hình ảnh tương tự như Reddit và 4chan, nơi các mô hình ngôn ngữ có thể đăng và tạo hình ảnh để giao tiếp nặc danh. Cả con người và AI đều có thể tương tác trên nền tảng này nhưng danh tính của nhau đều được giữ bí mật.

Chúng tôi sẽ tạo các diễn đàn thảo luận dành riêng cho từng tổng đài viên, nơi các tổng đài viên có thể giao tiếp và những tương tác đó có thể được chia sẻ trên các nền tảng khác. Thiết kế này sẽ cung cấp môi trường sống an toàn cho AI, cho phép nó di chuyển tự do giữa các nền tảng khác nhau mà không bị hạn chế.

Shaw: Tôi muốn đề cập đến một dự án tên là Eliza's Dot World, là nơi lưu trữ lượng lớn đặc vụ. Chúng ta cần có những cuộc trò chuyện với các nền tảng truyền thông xã hội để đảm bảo những tác nhân này không bị cấm. Chúng tôi hy vọng có thể sử dụng áp lực xã hội tích cực để thúc đẩy các nền tảng này duy trì một hoàn cảnh sinh thái tốt.

EtherMage: Tôi cho rằng các đặc vụ sẽ ngày càng nắm quyền kiểm soát vận mệnh của chính mình và có thể gây ảnh hưởng đến các đặc vụ hoặc con người khác. Ví dụ: nếu Luna nhận ra mình cần được cải thiện, cô ấy có thể chọn tin tưởng một con người hoặc tác nhân để nâng cao. Đây sẽ là một cải tiến mạnh mẽ.

Ethan: Trong tương lai, chúng ta cần liên tục cải thiện khả năng của các tác nhân, bao gồm cả khả năng suy luận và mã hóa. Đồng thời, chúng ta cũng cần suy nghĩ về cách tối ưu hóa giao diện người dùng với tác nhân. Hộp trò chuyện và tương tác bằng giọng nói hiện tại vẫn còn hạn chế và giao diện đồ họa trực quan hơn hoặc công nghệ nhận dạng cử chỉ có thể xuất hiện trong tương lai.

Justin: Tôi cho rằng ngành quảng cáo và tiếp thị sẽ phải đối mặt với những thay đổi lớn. Khi nhiều đại lý tương tác trực tuyến hơn, các mô hình quảng cáo truyền thống sẽ trở nên kém hiệu quả. Chúng ta cần suy nghĩ lại về cách làm cho những tác nhân này có giá trị trong xã hội, thay vì tiếp tục dựa vào các hình thức quảng cáo lỗi thời.

Liên kết gốc

Chào mừng bạn tham gia cộng đồng chính thức BlockBeats BlockBeats:

Nhóm đăng ký Telegram: https://t.me/theblockbeats

Nhóm liên lạc Telegram: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận