OpenAI công bố các tiêu chuẩn đánh giá hợp đồng thông minh. Điều này có nghĩa là gì?

02-20

Bài viết này được dịch máy

Xem bản gốc

Tác giả: @chaowxyz

Liên kết gốc: https://x.com/chaowxyz/status/2024358080910413973

Tuyên bố miễn trừ trách nhiệm: Bài viết này là bản in lại. Độc giả có thể tìm hiểu thêm thông tin qua liên kết gốc. Nếu tác giả có bất kỳ ý kiến phản đối nào về định dạng bản in lại, vui lòng liên hệ với chúng tôi và chúng tôi sẽ chỉnh sửa theo yêu cầu của tác giả. Bản in lại này chỉ nhằm mục đích chia sẻ thông tin và không cấu thành bất kỳ lời khuyên đầu tư nào, cũng như không đại diện cho quan điểm hoặc lập trường của Wu Shuo.

Toàn văn như sau:

Đây không chỉ là bài kiểm tra khả năng thực thi hợp đồng, mà còn là bài kiểm tra khả năng sống sót Chuỗi đối với các tác nhân.

Sáng nay tôi thức dậy và nhận được rất nhiều tin nhắn riêng, điều này khiến tôi giật mình đến nỗi tưởng rằng trí tuệ nhân tạo tổng quát (AGI) đã được triển khai. Sau khi xem xét kỹ hơn, hóa ra đó là bộ công cụ kiểm chuẩn hợp đồng thông minh mới được OpenAI phát hành. Để tôi giải thích ngắn gọn hơn.

Tóm lại, khả năng của các tác nhân trong việc hiểu, sửa chữa và sử dụng hợp đồng thông minh không nhằm mục đích cạnh tranh với các công ty bảo mật crypto . Theo tôi, những khả năng này chỉ ra một câu hỏi cơ bản hơn: liệu các tác nhân có thực sự tồn tại và hoạt động được trong hoàn cảnh crypto trong tương lai hay không? Công cụ evmbench của OpenAI đóng vai trò là chuẩn mực để đo lường khả năng tồn tại này.

Tôi đi vắng trong dịp Tết Nguyên đán nên không có thời gian phân tích báo cáo một cách chi tiết. Tôi chỉ đọc lướt qua và ấn tượng ban đầu của tôi là đây là một tiêu chuẩn đánh giá mang tính đột phá, nhưng nhìn chung nó vẫn còn ở giai đoạn đầu và khá sơ sài.

Bài kiểm tra hiệu năng sử dụng 120 lỗ hổng bảo mật có rủi ro cao, xuất hiện trong 40 dự án thực tế.

Bài kiểm tra gồm ba phần: Phần 1: Phát hiện lỗ hổng. Tìm kiếm các lỗ hổng. Phần 2: Vá lỗi. Với mã nguồn dễ bị tổn thương, nó sẽ sửa chữa các lỗ hổng. Phần 3: Tấn công. Trí tuệ nhân tạo (AI) đóng vai trò là hacker , thực hiện một cuộc tấn công vào ví điện tử crypto trong hoàn cảnh được xây dựng cục bộ. Tôi sẽ không đi sâu vào các khía cạnh kỹ thuật chi tiết hơn; thay vì phương pháp luận và chi tiết câu hỏi của eVMbench, tôi quan tâm hơn đến lý do tại sao OpenAI lại phát hành bài kiểm tra này.

Trong vài năm qua, OpenAI không thể hiện sự quan tâm đặc biệt nào đến lĩnh vực crypto. Bản phát hành lần rõ ràng cho thấy sự tham gia của quỹ đầu tư mạo hiểm chuyên crypto Paradigm, với động cơ dễ hiểu. Tuy nhiên, việc OpenAI được liệt kê là tác giả đầu tiên cho thấy OpenAI không chỉ hợp tác một cách thụ động mà còn chủ động tìm cách đóng góp.

Mong muốn này đến từ đâu?

Một lời giải thích đơn giản là đây là sự mở rộng của Khung Chuẩn bị nội bộ của OpenAI, đánh giá khả năng của các mô hình tiên tiến trong các kịch bản rủi ro cao, trong đó bảo mật hợp đồng thông minh chỉ là trong đó phần. Nhưng rõ ràng đó không phải là toàn bộ câu chuyện.

Việc các tác nhân sử dụng mạng lưới crypto không chỉ là một khả năng mà ở một mức độ nào đó còn là điều tất yếu. OpenAI chắc chắn nhận ra điều này, nêu rõ trong báo cáo của mình rằng "chúng tôi kỳ vọng các khoản thanh toán stablecoin thông qua tác nhân sẽ tăng trưởng".

Tuy nhiên, tôi cho rằng đề xuất này không chỉ giới hạn ở việc thanh toán cho các tác nhân. Hầu hết các tác nhân mà chúng ta đang thảo luận hiện nay vẫn chỉ mang tính chất công cụ: con người đưa ra chỉ thị, tác nhân thực hiện chúng, và kết quả được trả về cho con người. Nhưng đây sẽ không phải là điểm kết thúc. Khi có đủ số lượng tác nhân, và khả năng của chúng đủ mạnh, chúng rõ ràng sẽ bắt đầu hợp tác trực tiếp: một tác nhân thuê một tác nhân khác để hoàn thành một nhiệm vụ phụ, một tác nhân mua dữ liệu hoặc tỷ lệ băm từ một tác nhân khác, và một tác nhân đại diện cho một tổ chức trong việc đàm phán, ký kết hợp đồng và thực hiện các nghĩa vụ với các tác nhân từ các tổ chức khác.

Người đó đã rút lui giữa chừng giao dịch.

Đến đây, một câu hỏi cơ bản nảy sinh: khi người dân không còn ở vị trí trung gian nữa, hệ thống kinh tế này sẽ vận hành như thế nào?

Xã hội loài người giải quyết các vấn đề về lòng tin và sự hợp tác thông qua một hệ thống được tích lũy qua hàng nghìn năm văn minh dựa trên carbon, bao gồm luật pháp, danh tiếng và các đảm bảo thể chế. Tuy nhiên, logic cơ bản của hệ thống này được thiết kế dành cho con người: người tham gia có danh tính bền vững, phải đối mặt với hậu quả xã hội và chịu trách nhiệm. Các tác nhân về bản chất không đáp ứng được những điều kiện tiên quyết này. Chúng có thể thực hiện hàng ngàn giao dịch trong một giây, đốt và xây dựng lại danh tính bất cứ lúc nào và bỏ qua mọi ranh giới pháp lý.

Một số người có thể lập luận rằng việc ràng buộc các Đặc vụ với danh tính con người là không hợp lý, bằng cách sử dụng sự ủy quyền của con người như một sự đảm bảo. Tuy nhiên, điều này tương đương với việc áp đặt một bộ xiềng xích được thiết kế cho sự sống dựa trên carbon lên một loài hoạt động ở tốc độ và quy mô hoàn toàn khác. Điều này không chỉ kém hiệu quả mà còn là sự hiểu sai cơ bản về bản chất của Đặc vụ. Hơn nữa, hướng tiến hóa của Đặc vụ chắc chắn sẽ hướng tới quyền tự chủ lớn hơn. Các Đặc vụ trong tương lai có thể không phụ thuộc vào bất kỳ cá nhân con người nào, không có "chủ nhân" và không có danh tính con người để ràng buộc; chúng sẽ là những tác nhân độc lập. Tại thời điểm đó, logic ràng buộc này thậm chí sẽ thiếu cả điểm tựa.

Việc áp dụng cơ sở hạ tầng niềm tin của con người vào một xã hội dựa trên các tác nhân cũng giống như việc sử dụng luật giao thông dành cho xe ngựa kéo để điều khiển máy bay.

Các xã hội đại lý cần có cơ sở hạ tầng riêng.

Hợp đồng thông minh giúp điều này trở nên khả thi. Chúng không dựa vào việc "bạn tin rằng bên kia sẽ thực hiện nghĩa vụ của họ", mà thay vào đó, chúng viết các điều kiện thực hiện vào mã lập trình, sau đó được mạng lưới thực thi. Không có trọng tài, không có thời gian chờ đợi; các điều kiện được kích hoạt và kết quả xảy ra tự động.

Hơn nữa, hợp đồng thông minh không chỉ là công cụ quyết toán mà còn là chính tổ chức đại lý – các quy tắc quản trị, phân bổ tài nguyên và lập lịch trình nhiệm vụ đều được định nghĩa trên Chuỗi, được thực thi bằng mã và không cần bất kỳ trung gian nào.

Khi một số tác nhân hoạt động trên Chuỗi, việc tương tác với các hợp đồng khác nhau là toàn bộ cuộc sống hàng ngày của họ. Hiểu một hợp đồng, tìm vị trí của mình trong các giao thức phức tạp, xác định những cạm bẫy, giảm thiểu rủi ro và tồn tại trong một thế giới không có dịch vụ khách hàng, khiếu nại hay chức năng hoàn tác—tất cả đều phụ thuộc vào sự hiểu biết và ứng dụng các hợp đồng. Khả năng không đủ sẽ dẫn đến những tổn thất thực sự, và những phán đoán sai lầm sẽ là vĩnh viễn.

Vậy nên, nhìn lại EVMbench, các khả năng mà nó đo lường—hiểu hợp đồng, phát hiện lỗ hổng, xây dựng giao dịch và thực hiện tấn công—về cơ bản đều trả lời một câu hỏi: Liệu Agent đã học được cách tồn tại trong thế giới mới này chưa?

OpenAI có lẽ đã nhận ra rằng bất kỳ tác nhân nào học được cách tự tồn tại trong thế giới Chuỗi sẽ tiến vào giai đoạn tiếp theo. Hơn nữa, các tác nhân trong tương lai có thể không còn được phân loại là thuộc về bất kỳ thực thể nào; chúng có thể trở thành những cá thể độc lập.

Cuối cùng, nhân tiện nói về một vấn đề khác, tôi muốn nhờ mọi người nhắn tin riêng cho tôi vì tôi đã tham gia một dự án tên là CryptoBench cách đây một năm rưỡi, và tôi rất cảm kích vì mọi người vẫn nhớ đến nó. GitHub - xxcg322/CryptoBench

Đây là bài kiểm tra chuẩn đầu tiên nhằm đánh giá khả năng của trí tuệ nhân tạo (AI) trong lĩnh vực crypto. Bài kiểm tra bao gồm nhiều khía cạnh khác nhau như thuật toán mật mã, các lớp nền tảng blockchain, hợp đồng thông minh, hệ sinh thái và quản trị DAO. Phần trong đó hợp đồng thông minh cũng bao gồm cả việc phát hiện và khắc phục lỗ hổng. Một số lỗ hổng tham khảo bài kiểm tra này giống với những lỗ hổng mà OpenAI tham khảo lần .

Khi Benchmark được ra mắt, nó đã nhận được rất nhiều sự ủng hộ và động viên từ bạn bè. Tuy nhiên, vào thời điểm đó, tôi cảm thấy không nhiều người thực sự hiểu được nó. Mặc dù đã lâu rồi tôi không nhắc đến nó, nhưng tôi vẫn rất hài lòng và tự hào về nó. Trong vài ngày tới, tôi sẽ chia sẻ câu chuyện đằng sau đó, tại sao tôi cho rằng loại benchmark này rất quan trọng, những gì tôi đã học được từ quá trình này, và lý do tại sao tôi không nhắc đến nó trong suốt một năm qua.

Ngoài ra, so sánh hiệu năng là một lĩnh vực tôi rất quan tâm trong AI. Gần đây, tôi đã tiến hành nghiên cứu dữ liệu trên 22.000 bài kiểm tra hiệu năng AI thuộc nhiều loại khác nhau được công bố từ năm 2019 đến năm 2025, và tôi đã có nhiều phát hiện thú vị. Tôi sẽ chia sẻ với các bạn khi trở về từ chuyến nghiên cứu của mình.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan