Robot Ventures 合夥人:AI 代理時代,圖靈測試過時了

作者:Maddie P,Robot Ventures 合夥人

編譯:胡韜,ChainCatcher

別再看論文了。前沿領域已經發展到新的階段,而你還在像刷新前任的 Instagram 一樣刷新 arXiv。

我知道,因為我也做過同樣的事。整整六個月,我痴迷於各種模型發佈。每個基準測試都收藏了。GPT-4.5 預覽版什麼的?我都讀。你知道我學到了什麼嗎?什麼也沒學到。你知道我得到了什麼嗎?比什麼都沒有還少。我為犯錯付出了代價。

與此同時,一個小孩用一個三個月前的模型和一個 Stripe API 密鑰賺到的收入,比我“最前沿的實現”賺的都多……甚至比我所有作品加起來都多。不是因為他的 AI 更聰明,而是因為他的 AI 能直接接觸到金錢。

我認識的每一位人工智能研究人員現在都面臨著同樣的噩夢:他們花了五年時間打造了上帝,結果卻發現上帝需要信用卡和蘋果公司的許可才能存在。

模型大戰已經結束。不是因為有人贏了,而是因為輸贏不再重要了。

情報商品化的速度比許可商品化的速度更快。

2023年,GPT-4 的價格是每百萬個 Token 是 30 美元。而如今,Gemini Flash Lite 的價格僅為 0.08 美元。短短18個月內,價格就從奢侈品級別跌至比一杯晨間咖啡還便宜,可謂是徹底崩盤。

性能正在趨同。隨便挑一個基準測試:ARC、MMLU 式考試、GPQA 式硬性測試、代碼評估,結果都一樣。前沿技術在不斷進步,但頂級機型之間的差距相對於實際生產環境而言正在縮小。這看起來就像 2015 年的智能手機市場。所有產品都使用相同的芯片、相同的屏幕、相同的攝像頭。唯一的真正區別在於誰能獲得運營商的授權。

模型會不斷變得更智能,但智能商品化的速度遠遠超過了權限開放的速度。人工智能能做什麼和被允許做什麼之間的差距越來越大,而這其中蘊藏著巨大的利益。

屍體

墳場裡躺滿了擁有完美人工智能卻沒有任何授權的公司。

我親眼目睹了一家轉錄初創公司倒閉,它的準確率甚至超過了人工速記員。倒閉的原因並非技術失敗,而是無法將用戶轉化為收入。產品很棒,但缺乏支付渠道,就此告別。

另一個團隊開發了一款真正能賺錢的 AI 交易員,但卻被所有應用商店拒絕了。自主金融活動令合規團隊感到不安。對於無需人工監督即可轉移資金的 AI,目前還沒有明確的審批選項。

這就是真正讓你吃盡苦頭的兩難困境。即使客戶願意付費,他們也會精打細算。既然可以等六個月,下一代產品就能免費提供同樣的功能,為什麼還要買一臺超級計算機呢?這簡直就是上世紀80年代英特爾的慣用伎倆。你的客戶不僅僅是被權限限制所阻礙;他們還在等著你退出市場。商品化正在從底層蠶食你的定價權,而權限層又在從上而下地壓榨你。

這兩種壓力疊加在一起。你無法收取足夠的費用來維持生存,因為下一季度的模式會更便宜。你無法快速整合支付系統,因為合規流程的推進速度取決於人的速度。你同時受到來自兩個方向的擠壓。最終的贏家只有那些擁有鐵路的人。無論你收費高低,無論你這季度還是下季度發貨,他們都能收取通行費。他們總是能拿到錢。

企業並非死於糟糕的人工智能,而是死於被困的優秀人工智能。一方面是權限限制,另一方面是商品化壓力。這種夾擊才是制約企業發展的策略。

權限棧

現代人工智能的價值創造在於權限的積累。這並非因為模型本身不夠好,而是因為自主權受到限制。

想想自動駕駛汽車。我們有令人印象深刻的演示,但大多數系統仍然只是駕駛輔助。人仍然參與其中,責任被外包,而現實世界充滿了各種極端情況。人工智能也處於同樣的階段。我們在認知方面達到了 L2 級自主,但在經濟方面還沒有達到 L5 級自主。

一級權限(訪問):能否調用 API?→ OpenAI = 思考權限;
二級權限(合規):能否存儲用戶數據?→ AWS = 記憶權限;
三級權限(收入):能否處理支付?→ Stripe = 向用戶收費權限;
四級權限(分發):能否觸達用戶?→ App Store = 發佈權限;
五級權限(資金):系統能否獲得信用、保證金和結算擔保?= 經濟行為權限。

大多數人工智能公司都停留在第三或第四層級。它們可以出售訂閱服務,但無法實現財務自給自足。這就是為什麼用戶轉化率會急劇下降。每增加一層權限都相當於一個收費站,而收費站會不斷累積。即使你擁有一個卓越的模型,仍然無法實現經濟上的自主。

這才是真正的關鍵所在:我們缺少的不是智能,而是經濟自主性。除非主體能夠在既定約束條件下借貸、結算和償還,否則人工智能的繁榮發展就只會演變成財富從應用開發者轉移到賦予其生存權限的授權層。

為什麼代理比囚犯更昂貴

這裡有個實驗:你的智能體智商180,可以訪問瀏覽器和命令行界面,還能調用任何API。但它沒有錢,也不能借錢。它能建造什麼呢?

沒有什麼。

就像一個才華橫溢的員工,卻連域名都報銷不了;就像一個能制定整個商業計劃,卻連12美元的服務器託管費都付不起的交易員;就像一個發現了完美套利機會,卻無法出手交易的交易員;就像一輛F1賽車,卻身處一個沒有道路的世界。

為什麼不直接給它一張公司信用卡呢?

信用卡的前提是你這個人已經存在。你需要社保號碼、銀行賬戶和三年信用記錄。你的代理程序什麼都沒有。它只有一個API密鑰。

即使你能給它一張卡,那也好比給一級方程式賽車手一輛自行車。沒錯,它能動,但它的用途不對。信用卡會限制你承擔風險。它們有每日限額、欺詐警報和人工審核。經紀人可能需要一百萬美元才能在三十秒內完成完美的套利。你試試跟 Visa 欺詐部門解釋一下。而且信用卡的設計是基於可預測的風險。它們假設你的消費遵循一定的模式:食品雜貨、汽油、偶爾的度假。承銷商可以建立這種分佈模型。經紀人的工作方式不同。他們需要承擔無法預先預測的風險。智能系統的意義就在於發現你意想不到的機會。你不可能預先批准尚未發現的商機的信用額度。

但真正的問題遠不止於此。信用卡是給員工購買辦公用品用的,而經紀人不是員工。他們需要用未來的收入作抵押進行貸款,利用鎖定的倉位,並根據市場機會靈活調整信貸規模。他們需要的是能夠跟上他們思維速度的資金。

我們給了代理商各種工具:瀏覽器、終端、API。是不是感覺像是勝利在望?但事實上,任何重要的經濟活動都需要資金;而基礎設施卻並不存在,因為金融體系最初是為人類設計的。營業時間、各種表格、總有人要背鍋,還有合規部門的布拉德中午12點到下午2點都在吃午飯。

為什麼 Crypto 是答案

代理商需要能夠以機器速度運轉、無需人工審批且能承擔不可預測風險的資金。這種基礎設施目前在哪裡已經存在?

鏈上。

這並非 Crypto 的炒作,而是架構上的現實。傳統金融從設計之初就包含人為因素。這並非漏洞,而是其商業模式的本質。每一次審批、每一次審核、每一次合規審查,都意味著某人的工作、某人的薪水、某人的午休時間。這種摩擦本身就是產品。

Crypto 將人為因素排除在外。這並非出於理念,而是出於技術限制。智能合約要麼執行,要麼不執行。無需監管人員檢查,也無需聯繫反欺詐部門。代碼在凌晨3點和下午3點運行的方式完全相同。

更重要的是,鏈上抵押解決了承銷難題。你無需依賴個人的信用記錄或就業證明進行放貸,而是依賴數學。抵押品可驗證、流動性強,且無需信任。持有質押 ETH 的代理人無需向 Brad 證明其價值。ETH 已鎖定,可通過程序訪問。貸款的發放、使用和償還均可通過單一原子交易完成。

這就是關鍵所在。並非因為 Crypto 很酷(雖然它確實很酷),而是因為加密貨幣是唯一一種允許交易者無需事先獲得許可即可承擔金融風險的基礎設施。交易者可以利用鎖定頭寸進行借貸,在毫秒內完成交易,並且無需中介即可結算。基礎設施已經存在,只是尚未針對這種應用場景進行優化……直到 Sprinter 的出現。

Sprinter(我們正在打造的)

去年我嘗試用質押以太坊(ETH)進行借貸,並把這件事告訴了 Michael Cieri。三週後,我與 Traditional Finance Inc. 的 Brad 進行了第四次電話會議。

Brad 想知道我的投資目標。Brad 需要我的工作證明。Brad 擔心加密貨幣的波動性。Brad 去吃午飯了。

我的以太坊就放在那裡。不可篡改。可驗證。持續產生收益。而我正聽著舒緩的爵士樂,Brad 則在“向他的主管確認”。

那時我才明白:整個信貸系統都是 Brad 一手策劃的。成百上千個 Brad ,在彼此之間傳遞文件,收取 Brad 的時間費用。

Sprinter 刪除了 Brad。

Sprinter 是一款可編程的信用引擎。您可以使用鏈上可驗證的抵押品借入可消費的穩定幣,而無需出售抵押品。信用額度使用受限:資金不會直接進入免費錢包,只能通過授權路由使用,並且還款會優先扣除。我們首先推出面向消費者的信用卡作為分發渠道,然後發佈 SDK,以便應用程序和代理商可以在嚴格的限制條件下申請短期信用額度。信用額度以 API 的形式提供。基於規則的承保機制。無需 Brad 參與。

不僅限於人類。人類只是開始。我們也在為機器構建系統,這些機器需要在凌晨三點借貸以在價格飆升前租用計算資源。我們也在為需要以鎖定頭寸為抵押進行借貸以執行30秒套利的代理構建系統。我們還在為需要毫秒級貸款而非工作日貸款的協議構建系統。

其他公司都在利用人工智能為人類開發產品。而我們則是在用資金為人類和人工智能開發產品。

這種差異聽起來很細微,但其影響卻會重塑經濟格局。

真正破壞的是什麼?

政策就是終結開關。一封監管函,就足以毀掉一切。我親眼目睹三個完美的團隊在48小時內土崩瓦解,只因為華盛頓的某個人發現了他們的使用場景。

結算過程變成了政治問題。你會看到兩種經濟體系:一種是順從的美元在銀行緩慢流通,另一種是可編程的美元以光速流動。兩者之間的差距並非偶然,而是一個完整的產業。

穩定幣贖回就像是用戶體驗更好的銀行擠兌。整個人工智能經濟的平衡都建立在穩定幣保持穩定的基礎上。一旦(而不是如果)穩定幣出現波動,整個經濟體系都會受到影響。當然,我們不妨假裝風險是“區塊鏈吞吐量”。

終局 

有人會利用三年前的模型打造一家價值十億美元的公司。這並非因為這些模型本身有多好,而是因為他們找到了如何利用未經篩選的資金進行經過深思熟慮的、明智的風險投資的方法。

穩定幣與墮落性脫鉤。交易量從衍生品轉向實際交易。交易者之間為計算、數據和推理付費。

一個大國恐慌起來。“未經授權的自主經濟活動。” 這將成為頭條新聞。市場暴跌。我會吃爆米花看熱鬧。

公司估值倍數往往基於 API 訪問權限,而非人工智能質量。銀行關係比模型參數更有價值。

“兩美元”經濟時代已然來臨。傳統美元以人類的速度在銀行流通,而可編程美元則在鏈上即時結算。二者之間的套利成為真正的博弈。

如果這一切都沒有發生,那我之前的所有判斷就都錯了。

但我沒說錯。證據就在這裡。推理成本下降了99%。所有模型都在趨向相同的基準。那些擁有完美人工智能卻無需授權的公司都倒閉了。布拉德仍然每天中午12點到下午2點吃午飯。

如果我錯了呢?

或許 GPT-7 非常智能,權限問題根本無關緊要。或許 Brad 會學會使用電子郵件。

但可能不會。

情報商品化的速度遠超權限的普及速度。分發渠道依然受限。權限依然珍貴。

人人都在玩的AI投資遊戲結束了。不是因為遊戲失敗,而是因為它太過成功,以至於變得毫無價值。投資最智能的模型,構建最佳的RAG(紅黃綠藍綠)模型,優化推理,這些都無關緊要。

新遊戲規則是權限積累、控制面和經濟軌道。

獲勝者不會擁有最好的人工智能,而是擁有能夠運用已知信息做事情的人工智能。

這並非悲觀。互聯網、移動和雲計算的發展模式都是一樣的。技術商品化,而鐵路系統則能創造價值。

真正的考驗

圖靈測試提出的問題是:機器能否讓我們相信它是人類?

我們應該問的是:機器能否與 Brad 進行交易並贏走他所有的錢?

第一個問題的答案是肯定的。

第二個問題的答案正是你的人工智能創業公司即將失敗的原因。

莊家永遠是贏家。而莊家就是 Brad,他坐在合規部門,吃著一份乏味的辦公桌沙拉,正準備拒絕你的API請求。

未來並非人人平等。它還滯留在布拉德的收件箱裡。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論