Đối tác của Robot Ventures: Bài kiểm tra Turing đã lỗi thời trong kỷ nguyên của AI Agent.

Bài viết này được dịch máy
Xem bản gốc

Tác giả: Maddie P, Đối tác, Robot Ventures

Biên soạn bởi: Hu Tao, ChainCatcher

Hãy ngừng đọc các bài báo khoa học đi. Các lĩnh vực tiên tiến đã phát triển lên một giai đoạn mới, trong khi bạn vẫn cứ liên tục làm mới trang arXiv như thể đang làm mới Instagram của người yêu cũ vậy.

Tôi biết điều đó vì tôi cũng từng làm vậy. Suốt sáu tháng trời, tôi bị ám ảnh bởi mọi bản phát hành mô hình. Tôi thu thập mọi bài đánh giá hiệu năng. Bản xem trước GPT-4.5 và tất cả những thứ tương tự? Tôi đọc hết. Bạn biết tôi học được gì không? Chẳng được gì cả. Bạn biết tôi đạt được gì không? Còn ít hơn cả không có gì. Tôi trả giá giá cho những sai lầm của mình.

Trong khi đó, một đứa trẻ thu nhập nhiều tiền hơn bằng cách sử dụng một mô hình ba tháng tuổi và một khóa API của Stripe so với "phương pháp tiên tiến nhất" của tôi... nhiều hơn tất cả công sức của tôi cộng lại. Không phải vì AI của cậu bé thông minh hơn, mà vì AI của cậu bé có quyền truy cập trực tiếp vào tiền.

Mọi nhà nghiên cứu trí tuệ nhân tạo mà tôi biết hiện đang đối mặt với cùng một cơn ác mộng: họ đã dành năm năm để tạo ra Chúa, chỉ để phát hiện ra rằng Chúa cần thẻ tín dụng và sự cho phép của Apple để tồn tại.

Cuộc chiến mô hình đã kết thúc. Không phải vì ai đó thắng, mà vì thắng thua không còn quan trọng nữa.

Việc thương mại hóa trí tuệ đang diễn ra nhanh hơn việc thương mại hóa cấp phép.

Năm 2023, GPT-4 được định giá 30 đô la cho một triệu token. Giờ đây, Gemini Flash Lite chỉ còn được định giá 0,08 đô la. Chỉ trong 18 tháng, giá của nó đã lao dốc từ một mặt hàng xa xỉ xuống còn rẻ hơn cả một tách cà phê buổi sáng, một sự sụp đổ hoàn toàn.

Hiệu năng đang dần hội tụ. Hãy chọn bất kỳ bài kiểm tra hiệu năng nào: ARC, các bài kiểm tra kiểu MMLU, các bài kiểm tra khó kiểu GPQA, đánh giá mã nguồn — kết quả đều giống nhau. Công nghệ tiên tiến tiếp tục phát triển, nhưng khoảng cách giữa các mẫu sản phẩm hàng đầu đang thu hẹp lại so với hoàn cảnh sản xuất thực tế. Nó trông giống như thị trường điện thoại thông minh năm 2015. Tất cả các sản phẩm đều sử dụng cùng một loại chip, cùng một loại màn hình, cùng một loại camera. Sự khác biệt thực sự duy nhất là ai có thể nhận được giấy phép của nhà mạng.

Các mô hình sẽ tiếp tục trở nên thông minh hơn, nhưng việc thương mại hóa trí tuệ đang diễn ra nhanh hơn nhiều so với việc cấp phép. Khoảng cách giữa những gì trí tuệ nhân tạo có thể làm và những gì nó được phép làm đang ngày càng mở rộng, và trong đó này tiềm ẩn lợi nhuận khổng lồ.

xác chết

Nghĩa địa này đầy rẫy những công ty sở hữu trí tuệ nhân tạo hoàn hảo nhưng lại không có giấy phép hoạt động.

Tôi đã chứng kiến ​​một công ty khởi nghiệp về dịch vụ phiên âm vỡ nợ, mặc dù độ chính xác của nó vượt trội so với người tốc ký. Lý do vỡ nợ không phải do lỗi công nghệ, mà là do không thể chuyển đổi người dùng thành thu nhập. Sản phẩm rất tuyệt vời, nhưng thiếu kênh thanh toán, nên nó chỉ dừng lại ở đó.

Một đội ngũ khác đã phát triển một người giao dịch tự động bằng AI có thể kiếm được tiền, nhưng nó đã bị tất cả các cửa hàng ứng dụng từ chối. Hoạt động tài chính tự động đang khiến đội ngũ kiểm soát tuân thủ lo ngại. Hiện tại không có quy trình phê duyệt rõ ràng nào cho AI có thể chuyển tiền mà không cần sự giám sát của con người.

Đây mới chính là vấn đề nan giải thực sự sẽ gây ra cho bạn vô vàn khó khăn. Ngay cả khi khách hàng sẵn sàng trả tiền, họ cũng sẽ rất tính toán. Tại sao phải mua một siêu máy tính khi họ có thể chờ sáu tháng để thế hệ tiếp theo cung cấp chức năng tương tự miễn phí? Về cơ bản, đây là chiến thuật mà Intel đã sử dụng vào những năm 1980. Khách hàng của bạn không chỉ bị kìm hãm bởi những hạn chế; họ còn đang chờ bạn rút khỏi thị trường. Sự cạnh tranh gay gắt đang làm suy yếu khả năng định giá của bạn từ dưới lên, trong khi những hạn chế lại đang bóp nghẹt bạn từ trên xuống.

Hai áp lực này kết hợp lại. Bạn không thể thu đủ phí để tồn tại vì mô hình này sẽ rẻ hơn vào quý tới. Bạn không thể nhanh chóng tích hợp hệ thống thanh toán vì tốc độ của các quy trình tuân thủ phụ thuộc vào tốc độ của con người. Bạn bị kẹp từ cả hai phía. Người chiến thắng cuối cùng chỉ là những người sở hữu đường sắt. Cho dù phí của bạn cao hay thấp, cho dù bạn giao hàng quý này hay quý tới, họ vẫn có thể thu phí. Họ luôn luôn có được tiền.

Các công ty không chết vì trí tuệ nhân tạo (AI) tồi; mà chết vì AI được phát triển tốt nhưng lại bị mắc kẹt. Điều này là do sự kết hợp giữa các hạn chế về quyền truy cập và áp lực thương mại hóa. Chính sự giằng co này mới thực sự cản trở sự phát triển của doanh nghiệp.

Ngăn xếp quyền

Giá trị cốt lõi của trí tuệ nhân tạo hiện đại nằm ở việc tích lũy các quyền hạn. Điều này không phải vì bản thân mô hình không đủ tốt, mà vì quyền tự chủ bị hạn chế.

Hãy xem xét xe tự lái. Chúng ta đã có những màn trình diễn ấn tượng, nhưng hầu hết các hệ thống vẫn chỉ là hỗ trợ người lái. Con người vẫn trong đó, trách nhiệm được giao cho bên thứ ba, và thế giới thực vẫn đầy rẫy những tình huống khắc nghiệt. Trí tuệ nhân tạo cũng đang ở giai đoạn tương tự. Chúng ta đã đạt đến mức độ tự chủ cấp 2 về nhận thức, nhưng chưa đạt đến mức độ tự chủ cấp 5 về kinh tế.

Quyền truy cập cấp 1: Tôi có thể gọi API không? → OpenAI = Quyền truy cập tư duy;
Quyền truy cập cấp 2 (Tuân thủ): Dữ liệu người dùng có thể được lưu trữ không? → AWS = Quyền truy cập bộ nhớ;
Quyền hạn cấp 3 (Thu nhập): Bạn có thể xử lý thanh toán không? → Stripe = Quyền tính phí người dùng;
Quyền cấp 4 (Phân phối): Ứng dụng có thể tiếp cận người dùng không? → App Store = Quyền xuất bản;
Quyền truy cập cấp 5 (Nguồn vốn): Hệ thống có thể nhận được tín dụng, tiền ký quỹ và các đảm bảo quyết toán không? = Quyền truy cập hành vi kinh tế.

Hầu hết các công ty AI vẫn chỉ ở cấp độ ba hoặc bốn. Họ có thể bán dịch vụ đăng ký, nhưng không thể đạt được sự tự chủ về tài chính. Đó là lý do tại sao tỷ lệ chuyển đổi người dùng giảm. Mỗi cấp độ truy cập bổ sung giống như một trạm thu phí, và các trạm thu phí này cứ tích lũy dần. Ngay cả với một mô hình vượt trội, sự tự chủ về kinh tế vẫn còn là điều khó đạt được.

Đây mới chính là mấu chốt của vấn đề: điều chúng ta thiếu không phải là trí thông minh, mà là quyền tự chủ kinh tế. Trừ khi các thực thể có thể vay mượn, quyết toán và trả nợ trong những giới hạn nhất định, sự phát triển mạnh mẽ của trí tuệ nhân tạo sẽ chỉ dẫn đến việc chuyển giao của cải từ các nhà phát triển ứng dụng sang tầng cấp phép, nơi trao cho họ quyền tồn tại.

Tại sao đặc vụ lại đắt hơn tù nhân?

Đây là một thí nghiệm: Trợ lý ảo của bạn có chỉ số IQ 180, có thể truy cập trình duyệt và giao diện dòng lệnh, và có thể gọi bất kỳ API nào. Nhưng nó không có tiền và không thể vay tiền. Vậy nó có thể xây dựng được gì?

Không có gì cả.

Giống như một nhân viên tài năng nhưng thậm chí không được hoàn tiền cho tên miền; giống như một người giao dịch có thể lập ra toàn bộ kế hoạch kinh doanh nhưng không đủ khả năng chi trả phí lưu trữ máy chủ 12 đô la; giống như một nhà giao dịch đã phát hiện ra một cơ hội kinh doanh chênh lệch giá hoàn hảo nhưng không thể thực hiện người giao dịch; giống như một chiếc xe đua F1 trong một thế giới không có đường xá.

Sao không cấp cho họ thẻ tín dụng của công ty?

Thẻ tín dụng yêu cầu bạn phải có sẵn thông tin cá nhân. Bạn cần số an sinh xã hội, tài khoản ngân hàng và ba năm lịch sử tín dụng. Chương trình đại lý của bạn thì không cần những thứ đó. Nó chỉ có khóa API.

Ngay cả khi bạn có thể đưa cho nó một tấm thẻ, điều đó cũng giống như đưa cho một tay đua Công thức 1 một chiếc xe đạp. Đúng là nó có tác dụng, nhưng đó không phải là công cụ phù hợp. Thẻ tín dụng giúp giảm thiểu rủi ro. Chúng có hạn mức hàng ngày, cảnh báo gian lận và xác minh thủ công. Một nhà môi giới có thể cần đến một triệu đô la để thực hiện một giao dịch chênh lệch giá hoàn hảo trong vòng ba mươi giây. Hãy thử giải thích điều đó với bộ phận chống gian lận của Visa xem. Và thẻ tín dụng được thiết kế dựa trên rủi ro có thể dự đoán được. Chúng giả định rằng chi tiêu của bạn tuân theo những mô hình nhất định: mua thực phẩm, xăng dầu, những kỳ nghỉ không thường xuyên. Các nhà bảo lãnh phát hành có thể xây dựng các mô hình phân phối như vậy. Các nhà môi giới hoạt động khác nhau. Họ gánh chịu rủi ro không thể dự đoán được. Mục đích của các hệ thống thông minh là để khám phá những cơ hội mà bạn không ngờ tới. Bạn không thể phê duyệt trước hạn mức tín dụng cho những cơ hội chưa được phát hiện.

Nhưng vấn đề thực sự còn phức tạp hơn thế. Thẻ tín dụng dành cho nhân viên mua văn phòng phẩm, nhưng môi giới chứng khoán không phải là nhân viên. Họ cần dùng thu nhập tương lai làm tài sản thế chấp cho các khoản vay, tận dụng vị thế bị khóa và điều chỉnh linh hoạt hạn mức tín dụng dựa trên cơ hội thị trường. Điều họ cần là nguồn vốn có thể theo kịp tốc độ tư duy của họ.

Chúng tôi đã cung cấp cho các đại lý của mình nhiều công cụ khác nhau: trình duyệt, thiết bị đầu cuối, API. Có phải cảm giác như chiến thắng đã ở trong tầm tay? Nhưng sự thật là, bất kỳ hoạt động kinh tế quan trọng nào cũng cần nguồn vốn; và cơ sở hạ tầng lại không tồn tại vì hệ thống tài chính ban đầu được thiết kế cho con người. Có giờ làm việc, đủ loại biểu mẫu, luôn có người phải chịu trách nhiệm, và Brad từ bộ phận tuân thủ lại ăn trưa từ 12 giờ trưa đến 2 giờ chiều.

Tại sao tiền điện tử lại là câu trả lời?

Các đại lý cần nguồn vốn có thể hoạt động với tốc độ máy móc, không cần phê duyệt thủ công và có khả năng xử lý rủi ro khó lường. Hiện nay, loại cơ sở hạ tầng này đang tồn tại ở đâu?

Trên Chuỗi.

Đây không phải là sự thổi phồng về tiền điện tử; mà là một thực tế cấu trúc cơ bản. Tài chính truyền thống luôn bao gồm các yếu tố con người ngay từ khi ra đời. Đây không phải là một kẽ hở, mà là bản chất của mô hình kinh doanh. Mỗi sự phê duyệt, mỗi cuộc kiểm toán, mỗi lần xem xét tuân thủ đều ảnh hưởng đến công việc, tiền lương và giờ nghỉ trưa của ai đó. Chính sự ma sát này là sản phẩm.

Tiền điện tử loại bỏ sự can thiệp của con người. Đây không phải là vấn đề triết học, mà là vấn đề về giới hạn công nghệ. Hợp đồng thông minh hoặc thực thi hoặc không thực thi. Không cần sự giám sát của cơ quan quản lý hoặc liên hệ với các cơ quan chống gian lận. Mã nguồn chạy chính xác như nhau vào lúc 3 giờ sáng và 3 giờ chiều.

Quan trọng hơn, tài sản thế chấp Chuỗi giải quyết được vấn đề thẩm định tín dụng. Bạn không cần dựa vào lịch sử tín dụng cá nhân hay bằng chứng việc làm để vay tiền; thay vào đó, bạn dựa vào toán học. Tài sản thế chấp có thể kiểm chứng, có thanh khoản cao và không cần sự tin tưởng. Các tác nhân nắm giữ ETH đã được đặt cọc không cần phải chứng minh giá trị của nó với Brad. ETH được khóa và có thể truy cập bằng lập trình. Việc giải ngân, sử dụng và hoàn trả khoản vay đều có thể được hoàn tất thông qua một giao dịch nguyên tử duy nhất.

Đây là điểm mấu chốt của vấn đề. Không phải vì tiền điện tử thú vị (mặc dù chúng thực sự rất thú vị), mà vì crypto là cơ sở hạ tầng duy nhất cho phép các nhà giao dịch chấp nhận rủi ro tài chính mà không cần sự cho phép trước. Các nhà giao dịch có thể sử dụng các vị thế bị khóa để vay mượn, hoàn tất giao dịch trong vài mili giây và quyết toán mà không cần trung gian. Cơ sở hạ tầng đã tồn tại, chỉ là nó chưa được tối ưu hóa cho trường hợp sử dụng này… cho đến khi Sprinter xuất hiện.

Sprinter (mà chúng tôi đang chế tạo)

Năm ngoái, tôi đã thử vay mượn bằng cách đặt cọc Ethereum (ETH) và kể cho Michael Cieri nghe về điều đó. Ba tuần sau, tôi có cuộc gọi hội nghị lần với Brad từ Traditional Finance Inc.

Brad muốn biết mục tiêu đầu tư của tôi. Brad cần bằng chứng về việc làm của tôi. Brad lo lắng về sự biến động của crypto. Brad đi ăn trưa.

Ethereum của tôi ở ngay đó. Bất biến. Có thể kiểm chứng. Tạo ra lợi nhuận liên tục. Và trong khi tôi đang nghe nhạc jazz du dương, Brad đang "xác nhận lại với cấp trên của anh ấy".

Đó là lúc tôi nhận ra: toàn bộ hệ thống tín dụng đều do Brad điều khiển. Hàng trăm, hàng nghìn người tên Brad đang chuyển tài liệu cho nhau, và Brad phải trả tiền công cho thời gian của mình.

Sprinter đã xóa Brad.

Sprinter là một công cụ tín dụng có thể lập trình. Bạn có thể vay stablecoin có thể chi tiêu bằng tài sản thế chấp có thể xác minh Chuỗi mà không cần bán tài sản thế chấp. Việc sử dụng tín dụng bị hạn chế: tiền không được chuyển trực tiếp vào ví miễn phí, chỉ có thể được sử dụng thông qua định tuyến được ủy quyền và khoản trả nợ sẽ được khấu trừ trước. Ban đầu, chúng tôi ra mắt thẻ tín dụng dành cho người tiêu dùng làm kênh phân phối, sau đó phát hành SDK để các ứng dụng và đại lý có thể đăng ký hạn mức tín dụng ngắn hạn với các điều kiện nghiêm ngặt. Hạn mức tín dụng được cung cấp thông qua API. Cơ chế thẩm định dựa trên quy tắc. Không cần sự tham gia của Brad.

Vấn đề không chỉ nằm ở con người. Con người chỉ là bước khởi đầu. Chúng ta cũng đang xây dựng các hệ thống cho máy móc cần vay mượn lúc 3 giờ sáng để thuê tài nguyên tính toán trước khi giá tăng vọt. Chúng ta đang xây dựng các hệ thống cho các tác nhân cần vay mượn dựa trên các vị thế bị khóa để thực hiện giao dịch chênh lệch giá trong 30 giây. Chúng ta đang xây dựng các hệ thống cho các giao thức yêu cầu cho vay ở mức mili giây, chứ không phải cho vay vào các ngày trong tuần.

Các công ty khác đang sử dụng trí tuệ nhân tạo để phát triển sản phẩm cho con người. Còn chúng tôi, ngược lại, đang sử dụng nguồn vốn của mình để phát triển sản phẩm cho cả con người và trí tuệ nhân tạo.

Sự khác biệt này có vẻ nhỏ, nhưng tác động của nó có thể định hình lại toàn bộ bối cảnh kinh tế.

Điều gì thực sự đang bị phá hủy?

Chính sách chính là nút bấm kết thúc. Một lá thư quy định cũng đủ để phá hủy mọi thứ. Tôi đã chứng kiến ​​ba đội ngũ hoàn hảo tan rã trong vòng 48 giờ chỉ vì ai đó ở Washington phát hiện ra trường hợp sử dụng của họ.

Quyết toán đã trở thành một vấn đề chính trị. Bạn thấy hai hệ thống kinh tế: một hệ thống nơi đồng đô la phục tùng lưu thông chậm chạp trong các ngân hàng, và một hệ thống khác nơi đồng đô la có thể lập trình lưu chuyển với tốc độ ánh sáng. Sự khác biệt giữa hai hệ thống này không phải là ngẫu nhiên, mà là cả một ngành công nghiệp.

Việc rút tiền stablecoin giống như Đột biến rút tiền gửi nhưng với trải nghiệm người dùng tốt hơn. Toàn bộ sự cân bằng của nền kinh tế AI dựa trên sự ổn định của stablecoin. Một khi (chứ không phải nếu) stablecoin biến động, toàn bộ hệ thống kinh tế sẽ bị ảnh hưởng. Tất nhiên, chúng ta cũng có thể giả vờ rằng rủi ro là "lưu lượng blockchain ".

Cuối cùng

Một số người có thể xây dựng một công ty trị giá tỷ đô la bằng cách sử dụng các mô hình từ ba năm trước. Điều này không phải vì những mô hình đó vốn dĩ tốt, mà vì họ đã tìm ra phương pháp thực hiện các khoản đầu tư rủi ro khôn ngoan, được tính toán kỹ lưỡng bằng nguồn vốn chưa được sàng lọc.

Stablecoin đang dần tách rời khỏi tham nhũng. Khối lượng giao dịch đang chuyển từ phái sinh sang giao dịch thực tế. Các nhà giao dịch đang trả tiền cho nhau để thực hiện tính toán, dữ liệu và suy luận.

Một cường quốc đang hoảng loạn. "Hoạt động kinh tế tự chủ trái phép." Điều này sẽ gây chấn động dư luận. Thị trường sụp đổ. Tôi sẽ ăn bỏng ngô và xem màn kịch đó.

Hệ số định giá công ty thường dựa trên quyền truy cập API, chứ không phải chất lượng trí tuệ nhân tạo. Mối quan hệ với ngân hàng có giá trị hơn các tham số mô hình.

Kỷ nguyên của nền kinh tế "hai đô la" đã đến. Đô la truyền thống lưu thông trong các ngân hàng với tốc độ của con người, trong khi đô la lập trình quyết toán tức thì trên Chuỗi . Chênh lệch giá giữa hai loại tiền này đã trở thành một cuộc chơi thực sự.

Nếu tất cả những điều này không xảy ra, thì tất cả những nhận định trước đây của tôi đều sai.

Nhưng tôi đã không sai. Bằng chứng ở đây. Chi phí suy luận giảm 99%. Tất cả các mô hình đều đang hội tụ về cùng một chuẩn mực. Các công ty sở hữu trí tuệ nhân tạo hoàn hảo không cần xác thực vỡ nợ. Brad vẫn ăn trưa mỗi ngày từ 12 giờ trưa đến 2 giờ chiều.

Nếu tôi sai thì sao?

Có lẽ GPT-7 thông minh đến mức các vấn đề về quyền truy cập không còn quan trọng nữa. Có lẽ Brad sẽ học cách sử dụng email.

Nhưng có lẽ là không.

Việc thương mại hóa thông tin tình báo diễn ra nhanh hơn nhiều so với việc phổ biến thông tin. Các kênh phân phối vẫn còn hạn chế. Việc tiếp cận thông tin vẫn rất quý giá.

Trò chơi đầu tư AI mà mọi người từng tham gia đã kết thúc. Không phải vì trò chơi thất bại, mà vì nó quá thành công đến mức trở nên vô giá trị. Đầu tư vào những mô hình thông minh nhất, xây dựng những mô hình RAG (Đỏ-Vàng-Xanh lá-Xanh dương-Xanh lá) tốt nhất và tối ưu hóa suy luận—tất cả đều không còn ý nghĩa gì.

Những quy tắc mới của cuộc chơi là sự tích lũy quyền lực, phạm vi kiểm soát và quỹ đạo kinh tế.

Người chiến thắng sẽ không sở hữu trí tuệ nhân tạo (AI) tốt nhất, mà là AI có khả năng thực hiện các tác vụ dựa trên thông tin đã biết.

Đây không phải là sự bi quan. Mô hình phát triển của internet, điện thoại di động và điện toán đám mây đều giống nhau. Công nghệ đang bị thương mại hóa, trong khi hệ thống đường sắt tạo ra giá trị.

Bài kiểm tra thực sự

Bài kiểm tra Turing đặt ra câu hỏi: Liệu một cỗ máy có thể thuyết phục chúng ta rằng nó là con người?

Câu hỏi chúng ta nên đặt ra là: Liệu máy móc có thể giao dịch với Brad và thắng được toàn bộ số tiền của anh ta không?

Câu trả lời cho câu hỏi đầu tiên là có.

Câu trả lời cho câu hỏi thứ hai chính là lý do tại sao công ty khởi nghiệp AI của bạn chắc chắn sẽ thất bại.

Nhà cái luôn thắng. Và nhà cái chính là Brad, đang ngồi trong phòng tuân thủ quy định, ăn món salad nhạt nhẽo ở bàn làm việc, sẵn sàng từ chối yêu cầu API của bạn.

Tương lai không phải là một tương lai bình đẳng cho tất cả mọi người. Thông điệp đó vẫn còn nằm trong hộp thư đến của Brad.

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận