訪談 | 直覺:大型科技公司正在用垃圾數據訓練人工智能

本文為機器翻譯
展示原文

Intuition 創始人 Billy Luedtke 表示,人工智能模型的功能越來越強大,但它們所訓練的數據卻越來越差。

概括
  • Intuition創始人比利·盧特克表示,人工智能的優劣取決於我們輸入的數據質量。
  • 我們正處於一個“即進即出”的時代,因為人工智能正變得越來越遞歸。
  • 去中心化模式在技術和用戶體驗方面具有優勢。

隨著人工智能系統日益普及,用戶遇到的侷限性也越來越多,而且這些侷限性難以解決。雖然模型本身有所改進,但訓練這些模型所依賴的底層數據卻始終未變。更糟糕的是,遞歸,或者說人工智能模型使用其他人工智能生成的數據進行訓練,實際上可能會使情況變得更糟。

為了探討人工智能的未來,crypto.news採訪了Intuition的創始人Billy Luedtke。Intuition是一個去中心化協議,致力於為人工智能帶來可驗證的歸因、信譽和數據所有權。Luedtke解釋了當前人工智能數據集存在根本性缺陷的原因,以及如何解決這些問題。

Crypto.news:目前大家都在關注人工智能基礎設施——GPU、能源、數據中心。人們是否低估了人工智能信任層的重要性?它為什麼如此重要?

比利·盧德克:百分之百。人們絕對低估了它的重要性——而且這很重要,原因有很多。

首先,我們正在進入我所謂的“數據輸入,數據輸出”時代。人工智能的優劣取決於它所獲取的數據質量。但這些數據——尤其是來自開放網絡的數據——大多已被汙染。它們並不乾淨,也無法反映人類的意圖。其中很多數據都來自網絡遊戲化的行為:點贊、評論、互動技巧——所有這些都經過了注意力優化算法的過濾。

所以當人工智能抓取互聯網數據時,它看到的並不是我們真實的一面,而是人們在平臺上的表現。我在推特上的行為和現實生活中截然不同,我們所有人都是如此。我們都在迎合算法,而不是表達真實的自我。

而且這種循環是遞歸的。平臺訓練我們,而我們又將更多扭曲的行為反饋給平臺。這就形成了一個反饋迴路——一個螺旋——進一步扭曲了人工智能對人性的認知。我們教給它的不是我們真正思考的內容,而是我們認為能獲得點讚的內容。

普通用戶不會去谷歌搜索、比較信息來源或進行批判性思考。他們只是向 ChatGPT 或其他模型提問,然後全盤接受答案。

這很危險。如果這種模式不透明——就像一個黑箱——而控制它的公司又控制著你能看到什麼信息、看不到什麼信息,那就意味著完全的敘事控制。這種模式集中化、缺乏問責,而且權力極大。

想象一下,你問Grok哪個播客最好,答案竟然是給埃隆·馬斯克付錢最多的那個。這根本不是什麼智慧——這只是偽裝的廣告而已。

CN:那麼我們該如何解決這個問題?我們如何構建以真相和價值而非參與度為優先的系統?

BL:我們需要扭轉激勵機制。這些系統應該服務於人,而不是機構、股東或廣告商。這意味著要為互聯網構建一個新的層面:身份和聲譽基元。這正是我們在Intuition公司正在做的事情。

我們需要可驗證的歸屬信息:誰說了什麼,何時說的,以及在什麼語境下說的。我們需要一個可移植的、去中心化的信譽體系,幫助我們判斷對任何特定數據來源的信任程度——不是基於感覺,而是基於實際的語境記錄。

Reddit 就是一個完美的例子。它是模型訓練數據最大的來源之一。但如果一個用戶諷刺地說“去死吧”,這句話就可能被抓取下來,並出現在模型給尋求醫療建議的人的推薦中。

這太可怕了——這就是模型缺乏背景信息、歸因信息或聲譽權重時會發生的情況。我們需要知道:這個人醫學領域可信嗎?他們在金融領域有聲譽嗎?這是可信的消息來源,還是僅僅是另一條隨機評論?

您可能也喜歡:人工智能的盲點:機器無法區分真相與噪音 | 觀點

CN:談到署名和聲譽,這些數據需要存儲在某個地方。您如何看待基礎設施方面的問題——尤其是在版權和補償等問題上?

BL:這正是我們在Intuition公司致力於解決的問題。一旦擁有可驗證的歸屬基礎,就能知道誰創建了哪些數據。這便實現了知識的代幣化所有權——以及相應的補償。

因此,您的數據不再存儲在谷歌的服務器或OpenAI的API中,而是存儲在去中心化的知識圖譜中。每個人都擁有自己貢獻的內容。當您的數據被遍歷或用於人工智能輸出時,您將獲得其所產生的價值的一部分。

這一點至關重要,因為我們現在就像數字時代的奴隸。我們耗費最寶貴的資源——時間、注意力和創造力——去創造數據,而這些數據卻被別人用來牟利。YouTube的價值不在於它託管視頻,而在於人們對其進行篩選和維護。如果沒有點贊、評論或訂閱,YouTube就毫無價值。

所以我們希望創造一個每個人都能從自身創造的價值中獲益的世界——即使你不是網紅或外向者。例如,如果你總能率先發現新晉藝術家,你的品味就具有價值。你應該能夠圍繞這一點建立聲譽並將其變現。

CN:但即便我們實現了透明化,這些模型仍然很難解釋。OpenAI 本身也無法完全解釋其模型是如何做出決策的。那該怎麼辦?

BL:說得對。我們無法完全解讀模型的行為——它們實在太複雜了。但我們可以控制的是訓練數據。這是我們可以掌控的槓桿。

我舉個例子:我聽說過一篇研究論文,其中一個人工智能非常痴迷貓頭鷹,另一個則擅長數學。它們只一起訓練數學相關的任務。但最後,擅長數學的人工智能也開始喜歡上了貓頭鷹——僅僅是因為它吸收了另一個人工智能的這種模式。

這些模式的潛移默化和微妙程度令人難以置信。因此,唯一真正的防禦手段就是意圖。我們需要慎重選擇輸入這些模型的數據。我們需要以某種方式“治癒自己”,才能以更真實、更具建設性的方式出現在網絡上。因為人工智能始終會反映其創造者的價值觀和偏見。

CN:咱們來談談正事。OpenAI 資金消耗巨大,基礎設施極其昂貴。像 Intuition 這樣的去中心化系統,如何在資金和技術上與之競爭?

BL:我們有兩個核心優勢:可組合性和協調性。

去中心化生態系統——尤其是在加密貨幣領域——在協調方面表現出色。我們擁有遍佈全球的分佈式團隊,他們都在致力於解決同一個更大問題的不同方面。與其讓一家公司耗費數十億美元與世界對抗,不如讓數百個目標一致的貢獻者共同構建可互操作的工具。

這就像一幅馬賽克拼圖。一個團隊負責代理信譽,另一個團隊負責去中心化存儲,還有一個團隊負責身份原語——我們可以把它們拼接起來。

這就是超能力。

第二個優勢在於用戶體驗。OpenAI 被困在自己的護城河裡。他們不會讓你把 ChatGPT 的上下文遷移到 Grok 或 Anthropic——那樣會削弱他們的防禦能力。但我們並不在意廠商鎖定。

在我們的系統中,您可以掌控自己的上下文,隨身攜帶,並將其接入您想要的任何代理。這將帶來更好的體驗。人們會選擇它。

您可能還喜歡:從比特幣到人工智能:5位加密貨幣礦工進軍高性能計算領域

CN:基礎設施成本呢?運行大型模型成本極高。您認為未來有可能出現小型模型在本地運行的情況嗎?

BL:是的,百分之百。我真的認為這就是我們未來的發展方向——許多小型模型在本地運行,像分佈式群體中的神經元一樣相互連接。

與其依賴一個龐大的單體數據中心,不如讓數十億臺消費級設備共同貢獻計算能力。如果我們能夠協調這些設備——而這正是加密技術的優勢所在——那麼這將構成一種更優越的架構。

這就是為什麼我們也在構建代理信譽層。請求可以被路由到最適合該任務的代理。你不需要一個龐大的模型來完成所有事情。你只需要一個智能的任務路由系統——就像一個覆蓋數百萬代理的 API 層。

CN:那麼確定性呢?LLM 並不擅長數學這類需要精確答案的任務。我們能否將確定性代碼與人工智能結合起來?

BL:這正是我想要的。我們需要把決定論重新引入到這個循環中。

我們最初採用的是符號推理——完全確定性的——然後迅速轉向深度學習,它是一種非確定性的技術。這帶來了我們現在所看到的爆炸式增長。但未來是神經符號推理——它將兩者的優勢結合起來。

讓AI處理模糊推理。但也要讓它在需要精確性的地方觸發確定性模塊——腳本、函數、邏輯引擎。想想看:“我的哪些朋友喜歡這家餐廳?”這個問題應該完全確定。

CN:從宏觀角度來看,我們看到一些公司將人工智能融入到運營的各個環節,但結果卻喜憂參半。您認為目前這一代的LLM(人工智能學習模塊)真的能提高生產力嗎?

BL:完全正確。奇點已經到來——只是分佈不均。

如果你的工作流程中沒有使用人工智能,尤其是在代碼或內容創作方面,那麼你的工作效率將遠低於其他人。這項技術已經成熟,效率提升也十分顯著。顛覆性的變革已經發生,只是人們尚未完全意識到這一點。

CN:最後一個問題。很多人都說這是個泡沫。風險投資正在枯竭。OpenAI 燒錢燒得厲害。英偉達甚至在為自己的客戶融資。這一切最終會如何收場?

BL:沒錯,現在確實存在泡沫——但技術本身是實實在在的。每個泡沫都會破裂,但破裂後留下的都是基礎技術。人工智能將會是其中之一。那些華而不實的資金——那些沒有真正創新、只是包裝應用的東西——將會被淘汰。但那些真正有實力的基礎架構團隊呢?他們會生存下來。

事實上,這可能有兩種發展方向:一是經濟出現溫和的調整,迴歸現實,但進步仍在繼續;二是生產力提升如此巨大,以至於人工智能反而成為經濟的通縮力量。GDP可能會增長10倍甚至100倍。如果這種情況發生,那麼之前的投入就是值得的——我們的社會水平得到了提升。

無論如何,我都保持樂觀。沒錯,會有混亂和失業——但如果我們打好基礎,也有可能迎來一個資源豐富、不再匱乏的世界。

您可能也喜歡:人工智能不會取代你,但我們圍繞它構建的僵化體系可能會 | 觀點

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論