模型進展慢緣於數據中心建設慢、訓練O1算力比GPT4高百倍
近期,OpenAI前首席研究官Bob McGrew與 Unsupervised Learning頻道進行了一場信息密度極高、乾貨十足的深度對話,非常建議讀全文。
Bob McGrew在 OpenAI 擔任了六年半的首席科學家,於2023年離職。
在這次訪談中,他深入探討了 AI 的現狀與未來,涵蓋了預訓練模型的進展、多模態 AI 的突破、機器人技術的未來、AI 研究的組織和文化,以及 AI 對社會的影響等重要議題。
McGrew預言,未來幾年AI領域將迎來鉅變。算力競賽將進一步升溫,視頻生成模型和機器人技術將迎來爆發式增長,同時多模態 AI 將深刻改變我們的生活。
McGrew指出,雖然GPT-5距離發佈尚需時日,但AI發展並非停滯不前。OpenAI 正專注於“測試時計算”技術,它可以在無需建設新數據中心的情況下實現算力增長。這意味著 OpenAI 有望在不大幅增加成本的情況下,持續提升 AI 模型的性能,為投資者帶來持續的信心。
McGrew還預測,視頻生成模型將在未來兩年內徹底改變電影製作方式。他認為,完全由 AI 生成的、足以獲獎的電影將很快出現。這對於影視行業來說無疑是顛覆性的變革,也為相關領域的投資者帶來了巨大的想象空間。
此外,McGrew認為機器人技術將在五年後迎來廣泛應用。零售、倉庫等工作環境將率先迎來“機器人革命”。這也意味著機器人產業鏈上的企業將迎來前所未有的發展機遇。
面對AI浪潮,McGrew提醒我們關注AI人才的培養。他認為,數學、編程和寫作能力將是未來人才的核心競爭力,相關教育領域的投資也將獲得豐厚回報。
01 要點如下
GPT-5 何時到來?測試時計算將帶來重大突破
許多人認為自 GPT-4 發佈以來,大型語言模型的進展似乎停滯了,但實際上內部人士的看法完全不同。開發像 GPT 這樣的大型語言模型需要大量的算力,這依賴於新數據中心的建設,這是一個緩慢的多年的過程。
從 GPT-4 到 GPT-5 將需要 100 倍的算力提升,這需要時間。在 GPT-5 正式發佈之前,我們可能會先看到算力提升 10 倍的過渡版本。
目前 OpenAI 的重點在於“測試時計算”,即在模型生成答案的過程中投入更多算力,以獲得更長、更連貫的思考鏈。例如,OpenAI 將 GPT-4 擴展到 0,1 模型,就實現了 100 倍的算力增長。
“測試時計算”不需要建設新的數據中心,因此在算法改進方面還有很大空間。未來幾年,“測試時計算”將是 AI 領域最令人興奮的進展之一。
多模態 AI 的突破:Sora 如何引領視頻生成革命?
與其他模態(如圖像)不同,視頻是一個擴展的事件序列,需要一個完整的用戶界面來考慮故事如何隨著時間的推移而展開。此外,視頻模型的訓練和運行成本都非常高。
Sora 是第一個高質量的視頻生成模型,它通過故事板功能解決了視頻生成中的一些挑戰。故事板功能允許用戶在不同時間點放置檢查點,以指導視頻的生成。
未來視頻模型的質量會更好,生成時間更長,成本更低。就像 LLM 一樣,你將能夠看到非常美麗、逼真的視頻,而且它們幾乎不花任何成本。
預計兩年內,我們將看到完全由 AI 生成的、足以獲獎的電影。這些電影的吸引力將在於導演如何利用視頻模型來實現他們的創意願景,並在媒介中做一些他們無法拍攝的事情。
機器人技術的未來:五年後,我們將與機器人在日常生活中互動
機器人技術將在五年後看到廣泛的應用,儘管會有一些限制。 基礎模型的出現是機器人技術領域的一大突破,它使機器人能夠快速啟動並在重要方面進行泛化。
與模擬環境相比,在現實世界中訓練機器人具有優勢。模擬器擅長模擬剛體,但在現實世界中,許多物體都是柔軟的,例如布料或紙板,模擬器並不擅長處理這些。
對於任何想要真正通用的機器人來說,在現實世界中進行訓練是必不可少的。
預計五年後,我們會在日常生活中以一種今天感覺奇怪的方式與機器人互動。機器人將在零售、倉庫等工作環境中得到廣泛應用。
OpenAI 的文化:創業精神與合作精神的融合
OpenAI 的文化類似於創業公司,強調合作和共同目標。 他們有一個關於正確方向的共同意見,並給予研究人員很大的自由去探索他們感興趣的領域。
OpenAI 的文化鼓勵合作,並確保人們一起工作,以構建一個產品,而不是發表許多論文。 這與學術界的文化形成鮮明對比,學術界更注重個人榮譽和競爭。
關於AGI
許多人擔心 AI 會導致大規模失業,但實際上 AI 能夠自動化的只是單個任務。 大多數工作都包含一些無法自動化的任務, 即使是編程也是如此。
AI 的進步將繼續,它將令人興奮,並且不會放緩,但它會發生變化。 我們正在從一個智能可能是社會關鍵稀缺因素的世界,過渡到一個智能無處不在且免費的世界。
當智能不再稀缺時,代理權將成為稀缺的生產要素。 代理權是指提出正確問題和追求正確項目的能力。 我們需要思考如何發展這種代理權,以便我們能夠與 AI 合作。
未來將是連續的,AI 的進步將逐步改變我們的生活。 我們應該關注那些需要無限耐心的領域, 例如仔細檢查支出或進行比較購物,這些領域 AI 可以做得更好。
如何培養孩子適應 AI 時代?
儘管 AI 正在迅速發展,但我們不應該改變孩子的教育方式。 我們仍然應該教他們數學、編程和寫作,因為這些技能可以幫助他們以結構化的方式思考問題。
未來是不可預測的,AI 的實際運作方式將是神秘的,並隨著時間的推移向我們展示。 我們應該鼓勵孩子們嘗試那些挑戰他們能力極限的事情,並培養他們的適應能力。
02 訪談全文
主持人Jacob:Bob McGrew 在 OpenAI 擔任首席研究官六年半。他最近在幾個月前離職,我們有幸能在“無監督學習”播客上成為他首次亮相的播客之一。因此,我們有機會向他詢問關於人工智能未來的一切。我們討論了模型是否已經觸及瓶頸,還討論了機器人模型、視頻模型、計算機使用模型,以及 Bob 預見的未來時間線和能力。我們談到了 OpenAI 獨特的文化以及是什麼使其研究如此有效,以及一些關鍵的決策點和經歷這些決策的感受。我們探討了為什麼 AGI 可能感覺和今天沒什麼不同,Bob 還分享了他離開 OpenAI 的原因以及下一步的計劃。我認為大家會非常喜歡這一期節目。話不多說,下面是 Bob。Bob,非常感謝你來參加播客。謝謝邀請,我很期待這次對話。真的很高興你能來。我知道我們會談論很多不同的話題。我想我們不妨從一個我覺得現在大家最關心的問題開始,也就是關於模型能力是否已經觸及瓶頸的激烈辯論。我們很想聽聽你對此的看法,以及你覺得預訓練方面還有多少潛力可挖。
鮑勃·麥克格魯:好的,我覺得這可能是外界觀察者和大型實驗室內部人員看法分歧最大的地方。我認為,如果從外界來看,很多人最初開始關注人工智能是因為 ChatGPT。然後過了六個月,GPT-4 就出現了。感覺一切都在快速加速,並且正在取得進展。然而,GPT-4 是一年半前發佈的,而且大家都知道它在此之前就已經訓練好了。那麼,現在發生了什麼?為什麼沒有新的東西出現,對吧?
內部的看法截然不同。在外面,人們想知道,我們是不是遇到了數據瓶頸?到底發生了什麼?但你必須記住,要取得預訓練的進展,特別是,需要大幅增加計算量。從 GPT-2 到 GPT-3,或者從 GPT-3 到 GPT-4,有效的計算量增加了 100 倍。這就是這種增量所代表的意義。你可以通過增加浮點運算次數、增加芯片、擴大數據中心和改進算法來實現這一點。算法改進可以帶來一些收益——50%、2倍或 3倍就已經很了不起了。但從根本上說,你必須等待新的數據中心建成。
不缺正在建設的新數據中心。你只要看看新聞就能發現,像 Meta、X 和其他前沿實驗室也在建立新的數據中心,即使這些新聞並不總是登上頭條。但從根本上說,這是一個非常緩慢的、需要數年時間的過程。事實上,在你看到完整的代際過渡,比如從 GPT-4 到 GPT-5 之前,你將會看到一些只有 10 倍提升的東西。人們常常忘記,我們是從 GPT-3 到 GPT-3.5 再到 GPT-4 的。
現在有趣的是,預訓練正在進行中。我認為我們必須等待,看看下一代模型何時發佈。如果你看看像 O1 這樣的東西,我們已經能夠利用強化學習取得進展。通過各種指標來看,O1 代表著比 GPT-4 高 100 倍的計算量。有些人可能沒有意識到這一點,因為決定將其命名為 O1 而不是 GPT-5。然而,實際上,這是一個新一代的模型。
當下一代,假設的 GPT-4.5 被訓練出來時,有趣的問題是,這種預訓練的進展如何與強化學習過程相比較?我認為,我們只能拭目以待,看看會發布什麼消息。
主持人Jordan: 這就引出了一個問題,考慮到進入 2025 年的多年過程,你認為明年人工智能的進展會像去年一樣多嗎,還是你認為事情會開始放緩?
鮑勃·麥克格魯:嗯,我認為會有進展。我認為這會是不同的進展。一件事是,當你進入任何下一代時,你總是會遇到在前一代中沒有看到的問題。因此,即使數據中心已經建好,人們也需要時間來解決問題並完成模型的訓練。
我們用來訓練 O1 的強化學習過程,也就是 OpenAI 用來訓練 O1 的過程,創建了一個更長、更連貫的思維鏈,有效地將更多的計算量融入到答案中。所以,你知道,如果一個模型需要幾秒鐘才能生成答案,而另一個模型需要,比如說,幾個小時才能生成答案,那麼如果你能真正利用它,那就是 10000 倍的計算量,對吧?
老實說,我們從大約 2020 年就開始思考如何使用測試時間計算。最後,我認為這實際上是如何做到這一點的真正答案,即如何在不浪費大量計算資源的情況下做到這一點。這樣做的好處是它不需要新的數據中心。在這裡,有很多改進的空間,因為這是一種剛剛開始的新技術,並且有很多算法增強的機會。
從理論上講,沒有理由說用於使 O1 從幾秒鐘,比如 GPT-4 可以在幾秒鐘內完成的事情,到 O1 花費 30 秒、1 分鐘或幾分鐘來思考的相同基本原理和想法不能擴展到幾個小時甚至幾天。就像從 GPT-3 到 GPT-4 一樣,沒有基礎的新技術;兩者都以大致相同的方式進行訓練,但擴展是非常困難的。
所以這實際上是問題的核心:你真的能進行擴展嗎?我認為這將是我們將會看到的進步類型,並且它會是最令人興奮的。
主持人Jacob:是的,在 2025 年。考慮到對測試時間計算的關注以及當前使用的 O1,我認為思考人們實際上將如何使用這些模型真的很有趣,對吧?我認為你最近發了一條推文,我覺得很有意思,內容是關於你需要這些新的產品形態(form factor)來解鎖某些模型的功能。所以也許可以稍微展開一下。例如,你有沒有看到任何你覺得在使用這些模型時很有趣的早期產品形態?
鮑勃·麥克格魯:嗯,是的。為了解釋這個問題,聊天機器人已經出現一段時間了。今天人們與聊天機器人的大多數互動,GPT-4 級別的模型都能很好地完成這些任務。你知道,如果你問 ChatGPT,誰是第四位羅馬皇帝?或者我如何加熱印度香米?我們的大多數日常對話都能很好地處理。
當我們考慮發佈 O1 預覽版時,有很多關於人們是否會使用它以及他們是否會找到用它來做什麼的問題。我認為這些問題是正確的。這關係到理解需要用這個模型做什麼才能真正從中獲得價值。編程是這方面的一個很好的用例,因為它提出了一個結構化的問題,你試圖在很長一段時間內取得進展,並且它顯著地利用了推理能力。
另一個例子是如果你正在撰寫政策簡報。在這種情況下,你需要撰寫一份需要有意義且具有凝聚力的長篇文檔。事實是,雖然有很多程序員,但大多數非程序員的人並沒有每天都需要解決這樣的任務。然而,回到這裡潛在的突破,重要的是要有一個連貫的思維鏈和一個結構化的方法來解決問題。
這個過程不僅僅包括思考問題;它還可以包括採取行動和制定行動計劃。對於像 O1 這樣的模型,我最興奮的事情——我相信很快會有其他實驗室推出類似的模型——是使用它們來實現長期行動,本質上是充當代理。雖然我認為“代理”這個術語被過度使用了,並且沒有清楚地傳達我們試圖實現的目標,但在我的生活中,我有很多任務希望模型能為我預訂東西、為我購物,並以涉及與世界其他部分互動的方式來解決問題。
我認為這是我們真正需要解決的產品形態:理解它是什麼以及我們如何有效地部署它。就目前而言,我認為還沒有人弄清楚這一點。
主持人Jacob: 這太有趣了。我的意思是,這完全說得通。我覺得每個人,你知道的,都會對這些智能體能做什麼以及它們能為人們和企業解決什麼問題產生無限遐想。那麼,今天實現這一切的最大障礙是什麼呢?顯然,你們已經看到了早期的一些模型,比如 Anthropic 發佈的計算機使用模型,而且,我確信其他實驗室也在研究這個。但是,當你思考是什麼阻礙我們達到目標時,有哪些難題仍然需要解決?
鮑勃·麥克格魯: 是的,有很多問題。我認為最直接的問題是可靠性。所以,你知道的,如果我要求做某事,先拋開動作不談,對吧?如果我要求智能體代表我做某事,即使只是思考或為我編寫一些代碼,而我需要離開五分鐘或一個小時讓它工作,如果它偏離了任務並犯了錯誤,等我回來時它什麼都沒做,那我只是白白浪費了一個小時。這可是個大問題。
現在再加上這個智能體將要在現實世界中執行動作。也許它在為我買東西。也許它在提交一個公關稿。也許它在代表我發送便條、電子郵件、Slack 消息。如果它做得不好,就會有後果。我至少會感到尷尬,甚至可能會損失一些錢。因此,可靠性就變得比過去更加重要。
我認為在考慮可靠性時,有一個經驗法則,即從 90% 的可靠性提高到 99% 的可靠性,計算量可能會增加一個數量級。這是 10 倍的提升。要從 99% 的可靠性提高到 99.9% 的可靠性,則需要再增加一個數量級的提升。因此,每增加一個“9”,都要求模型性能有巨大的飛躍。這 10 倍的改進是顯著的,代表了一兩年時間的工作量。
所以我認為這是我們首先要面臨的問題。我認為第二個有趣的問題是,到目前為止,我們所談論的一切都是針對消費者的,對吧?你沒有嵌入到企業中。但是,當你在談論智能體在執行任務時,對於我們很多人來說,那將是我們在工作中做的事情,是嵌入在企業中的事情。我認為這會帶來一系列其他的考慮因素。
主持人Jordan:這很有趣。我們今天在企業中看到,許多諮詢公司實際上做得很好,因為目前向企業部署這些技術需要很多手把手的指導。你認為這種手把手指導以及企業對幫助的需求會持續一段時間嗎?還是你認為它會變得更加易於使用,企業將來可以非常容易地部署這些大型語言模型?
鮑勃·麥克格魯:是的,我認為這是一個非常有趣的問題。而且,我的意思是,即使是開始構建,那麼在企業中部署大型語言模型的問題是什麼呢?好吧,如果它要為你自動化一個任務或者做你的工作,它可能需要上下文。因為在消費者領域,沒有太多上下文。好吧,你喜歡紅色,很好。沒什麼意思。
主持人Jacob:感謝你用紅色作為例子(自己的播客叫RedPoint)。
鮑勃·麥克格魯:但是,你知道,在企業中,你知道,你的同事是誰?你正在從事什麼項目?你的代碼庫是什麼?你知道,人們嘗試過什麼?人們喜歡和不喜歡什麼?所有這些信息都在企業中以一種環境的方式存在。它在你的 Slack 中。它在你的文檔中。你知道,也許它在你的 Figma 或其他什麼地方。那麼你如何獲得訪問權限呢?
好吧,你需要自己構建一些一次性的東西。我認為肯定有一種方法是人們構建這些連接器的庫,然後你就可以進來做到這一點。這與我們在 Palantir 所做的工作非常相似,Palantir 解決的根本問題是集成企業中的數據。我認為這也是為什麼像 Palantir 的人工智能平臺 AIP 如此有趣的原因之一。所以我認為這是第一條路徑,你有點像在構建這些東西的庫。可以基於此構建整個平臺。
另一個是進行計算機使用(Computer Use)的機會。所以現在,你不再需要這種非常具體且可能定製的方式來做,你現在擁有一個可以用來處理所有事情的工具。Anthropic 推出了這個;這真的很有趣,我們在 Anthropic 的人在 2020 年離開 OpenAI 之前就已經在討論這些計算機使用的智能體了,Google DeepMind 也發表了關於這方面的論文。每個實驗室都考慮過這個問題,並致力於解決這個問題。
計算機使用的智能體與這些程序化 API 集成不同之處在於,現在,由於你控制的是鼠標和鍵盤,你現在採取的行動涉及更多步驟。你可能需要 10 倍甚至 100 倍於使用這些程序化集成所需的令牌數量。
所以現在,我們又回到了什麼?你需要一個具有非常長且連貫的思維鏈的模型,能夠在很長一段時間內始終如一地決問題,這正是 O1 所解決的那類問題。我相信還有其他方法可以解決這個問題。但我認為這將是我們未來幾年將會看到的一個突破。
主持人Jacob:明年。你認為最終會如何發展?因為我想一方面,顯然,可以在任何上下文中使用計算機的通用模型似乎很有吸引力。我想,要達到 99.999% 的可靠性可能很困難。而且,你知道,在不同的點上可能會有很多步驟出錯。你知道,關於這如何運作的另一種觀點是,我確信,如果以某種方式開放底層應用程序 API,這些問題中的一些可能會被簡化,對吧?或者其他方法,或者你可以為使用 Salesforce 或我不知道的某些特定工具提供特定的模型。如果你可以訪問底層體驗,那麼集成最終將成為一個巨大的優勢。這樣你就可以在瞬間完成事情,而不是坐在那裡看著計算機在屏幕上做事。
鮑勃·麥克格魯:是的,嗯,我的意思是,我認為你肯定會看到這些方法的混合使用,其中一些使用這些集成,而另一些,你知道,計算機使用成為一種備用方案,如果你沒有定製的東西可以使用。然後也許你會看看人們使用哪些東西,如果可行,你會提出更詳細的集成。
我認為關於你會看到 Salesforce 專用的計算機使用(Computer Use)智能體的問題,從技術上講,這對我來說沒有太大的意義,因為我認為你從根本上利用的是數據。有人出去收集了大量關於如何使用 Salesforce 的數據集。
你可以把這些數據扔進——與 Anthropic、OpenAI 和 Google 分享這些數據集對 Salesforce 有利。他們訓練自己的模型。我認為每個應用程序提供商都會希望這是公開的,並且是每個基礎模型的一部分。所以我不認為,你知道,對我來說,這似乎沒有理由以這種方式擁有專門的模型。
主持人Jacob: 不,這確實是一個很有說服力的觀點,因為我覺得,當你在一個競爭激烈的領域,而你的競爭對手正在公開他們的數據,並且他們的產品變得更容易使用時,你肯定也希望你的產品是這樣的。
鮑勃·麥克格魯: 是的,對我來說有點神秘,為什麼還沒出現那種人們把數據塞進大型語言模型的生態系統。這實際上就相當於谷歌的SEO。
主持人Jacob: 這真是個很有趣的觀點。你認為我們離計算機使用的廣泛應用還有多遠?
鮑勃·麥克格魯: 嗯,我的意思是,我認為對於這些事情有一個很好的經驗法則,那就是當你看到一個演示,它超級有吸引力,但還不太好用。用起來會很痛苦。然後,你知道,給它一年時間,它就會好十倍。而且,這種改進是呈對數線性增長的。所以好十倍,你知道,只是一個級別的改進。但一個級別的改進已經相當了不起。你會開始看到它被用於有限的使用場景。然後再給它第二年。到那時,它會出奇地有效,但你不能每次都依賴它。我們現在用聊天機器人就是這樣,你仍然需要擔心它們會產生幻覺。那麼,採用的問題實際上取決於你要求的可靠性水平。任何可以容忍錯誤的領域都會比那些不能容忍錯誤的領域更快地實現自動化。
主持人Jacob: 所以我想回到喬丹最初的問題,基本上,現在你需要大量的輔助才能集成到正確的數據中,並定義定製的防護措施和工作流程,這是完全有道理的。那麼,在“嘿,很棒的計算機使用模型,企業準備簽約”之間,會存在什麼樣的中間層呢?這個中間層會是什麼樣的?
鮑勃·麥克格魯: 夥計,我認為應該有初創公司來定義它。你知道,我認為我們還不完全知道答案。我認為,當你擁有像計算機使用這樣的一般工具時,你會看到一個有趣的現象,它解決的問題在難度上是分形的,它可以解決很多問題。但隨後你會看到一個真正重要的問題,而你無法完全解決它。然後你會說,好的,現在我們要針對這個做一些非常具體的,也許我們會為此採用一種程序化的方法。所以我認為我們會在一段時間內看到各種方法的混合。
主持人Jordan: 我很好奇,你顯然一直在研究方面工作,並負責一些真正尖端的研究。我們稍微談到了測試時計算。你對其他哪些領域特別感興趣?
鮑勃·麥克格魯: 嗯,我認為我們已經談過了預訓練。我們已經談過了測試時計算。另一個真正令人興奮的事情是多模態。多模態的重要日子。是的,今天發佈了Sora。實際上,這在某種程度上是這個漫長曆程的頂點。大型語言模型,我們假設是2018年發明的。很明顯,你可以應用Transformer和一些相同的技術來適應其他模態。所以你包含了視覺,有了圖像輸出、音頻輸入和音頻輸出。
首先,這些東西一開始是作為類似DALLE或Whisper的輔助模型。最終,它們被集成到主模型中。長期以來一直抵制這種做法的模態是視頻。我認為Sora是第一個進行演示的;其他公司,如Runway,以及一些其他的模型也相繼出現。現在Sora本身已經發布了。我認為視頻與其他模態相比,有兩個真正有趣且不同的地方。
當你創建圖像時,你可能真的只想通過一個提示來創建一個圖像。也許你嘗試幾次。如果你是專業的平面設計師,你可能會編輯這個圖像中的一些細節。但說實話,我們都不是。這裡的很多用途是,你需要一些幻燈片嗎?你是否想要一張圖片來搭配你的推文或演示文稿?這是一個非常直接的過程。
然而,對於視頻來說,哇。我的意思是,這是一系列擴展的事件。它不是一個提示。所以現在你實際上需要一個完整的用戶界面。你需要考慮如何使這個故事隨著時間的推移而展開。我認為這就是我們在Sora發佈中看到的事情之一。Sora在這方面花費了更多的時間思考;產品團隊在這方面投入了比其他一些平臺更多的精力。
你還需要考慮的另一件事是,視頻的成本非常高。訓練這些模型非常昂貴,運行這些模型的成本也非常高。所以,雖然看到Sora質量的視頻很有趣——而且我認為Sora的質量確實更好——但你必須稍微注意一下才能看到它的質量更好,至少如果你只看一個短暫的片段的話。
現在,任何擁有Plus賬戶的人都可以使用Sora。OpenAI發佈了每月200美元的Pro賬戶,其中包括無限制的Sora慢速生成。當你擁有這種水平的質量和分發時,兩個難題已經解決了。這將是其他競爭對手難以企及的高門檻。
主持人Jacob:視頻模型在未來幾年的發展會是什麼樣的?我的意思是,顯然在大型語言模型領域,我們已經看到了巨大的進步,感覺去年的模型現在便宜了十倍,而且速度快得多。你認為視頻方面也會有類似的改進嗎?
鮑勃·麥克格魯: 實際上,我認為類比非常直接。所以如果我考慮一下今天的視頻模型和兩年後的視頻模型之間的差異,首先是質量會更好。現在的瞬時質量已經非常好了。你可以看到反射。如果你分享一些東西,所有難以解決的難題,你可以指出,哦,看,那裡做了反射。有一些煙霧。你知道,困難的是擴展的、連貫的生成。
所以SOAR產品團隊擁有一個故事板功能,允許你在不同的時間點,比如每五秒或每十秒設置檢查點,以幫助為生成提供指導。你知道,從根本上說,如果你想從幾秒鐘的視頻變成一個小時的視頻,這是一個非常困難的問題。我認為這是你將在下一代模型中看到的東西。
另一方面,另一個類比是,我實際上認為它會非常像大型語言模型,如果你想要一個GPT-3質量的token,它比GPT-3剛出現時便宜100倍。Sora的情況也會如此,你將能夠看到這些非常漂亮、逼真的視頻,而且它們的成本幾乎為零。
主持人Jacob: 我覺得夢想是有一部由人工智能生成的完整電影,贏得一些獎項之類的,你知道,用一個無恥的播客問題來問,你認為我們什麼時候會有這樣的電影?
鮑勃·麥克格魯:我只能猜一下。哦,天哪。是的。說實話,贏得一個獎項某種程度上來說門檻太低了,對吧?我想有很多頒獎典禮。真的,這是一部你真正想看的電影嗎?是的。我覺得我們會在兩年後看到它,但它實際上會比我剛才說的更沒那麼令人印象深刻,因為你想看它的原因不是因為視頻本身,而是因為有一位導演擁有創意願景,並使用視頻模型來實現他的創意願景。我認為他們這樣做是因為他們可以在這種媒介中做一些他們無法拍攝的東西。我們可以想象一下。我們這裡沒有人是導演,但我們都可以想象很多可能性。我們不是平面設計師,也不是導演,但,是的,未來會是這樣。
主持人Jordan:沒錯。是的,我們這裡有一些非常特定的技能。是的,我們看到很多公司湧現出來,試圖成為人工智能領域的皮克斯。我們總是會問這個問題,什麼時候這才是真正可行的?所以聽起來比我們至少預想的要快得多。
鮑勃·麥克格魯:這是我的猜測。一旦事情進展到可以演示的階段,之後的進展會非常快。在此之前,進展非常緩慢,或者至少它是不可見的。
主持人Jordan:我想從視頻轉向機器人,你一開始加入 OpenAI 是為了研究很多機器人方面的東西。我們很想了解你對這個領域的看法,以及我們今天的處境,以及你認為它將走向何方。
鮑勃·麥克格魯:這確實是一個非常私人的問題。當我離開 Palantir 時,我的一個想法是,機器人將成為深度學習變得真實的領域,而不僅僅是某人網站上的一個按鈕。所以,我在 Palantir 和 OpenAI 之間花了一年的時間深入瞭解機器人技術,用深度學習編寫了一些關於視覺的早期代碼。這是一個非常具有挑戰性的領域。當時,我以為可能還要五年;那是2015年,而那是完全錯誤的。但是,我認為現在是對的。我相信機器人技術將在五年後得到廣泛應用,儘管會有一些限制。因此,我認為現在是創辦一家機器人公司的好時機。
一個相當明顯的觀點是,基礎模型在快速啟動和運行機器人方面取得了巨大突破,使其能夠在重要方面進行泛化。這有幾個不同的方面。其中比較明顯的是,利用視覺並將視覺轉化為行動計劃的能力,這是基礎模型帶來的。稍微不那麼明顯,也許更有趣的方面是整個生態系統已經發展起來了。現在我已經離開了 OpenAI,我花了一些時間和創始人在一起,我和一些機器人創始人聊過。一位機器人創始人告訴我,他們實際上已經設置了讓機器人能夠對話。這真的很酷而且容易得多;你可以告訴機器人做什麼,它會理解大意。它使用一些專門的模型來執行操作。以前,寫出你想要的東西很麻煩,你必須坐在電腦前,而不是看著機器人。現在你只需要和它說話就行了。
我認為我們仍然不清楚結果的一個主要區別在於,你是在模擬中學習還是在現實世界中學習。我們在機器人領域這兩年的主要貢獻是展示了你可以在模擬器中訓練,並使其推廣到現實世界。使用模擬器有很多原因;例如,在生產系統或現實世界中運行是很麻煩的。你可以進行免費測試等等。但是,模擬器擅長模擬剛體。如果你正在用堅硬的物體進行抓取和放置的任務,那就太好了。但是,世界上的很多東西都是軟綿綿的物體。你必須處理布料,或者,當考慮倉庫時,要處理紙板。不幸的是,模擬器在處理這些場景方面做得不是特別好。因此,對於任何想要真正通用的東西,我們現在唯一的方法就是使用現實世界的演示。正如你從最近出現的一些工作中所看到的,這實際上可以產生有希望的結果。
主持人Jacob:效果非常好。然後,我想,顯然這在某種程度上是不可知的,比如,你知道的,當人們在機器人技術中發現縮放定律,以及人們可能需要多少遠程操作數據時,但是你覺得我們離它很近了嗎?或者,我的意思是,顯然,你知道,在2015年,你認為還有五年。你認為我們離人們所說的機器人技術像 ChatGPT 那樣的時刻還有多遠,人們會說,哦,那真的很棒,那看起來很不一樣而且有效。
鮑勃·麥克格魯:關於預測,尤其是關於機器人技術的預測,你真的要考慮這個領域。所以我對機器人技術的大規模消費者採用持相當悲觀的態度,因為在家裡有一個機器人是很可怕的。機器手臂是致命的。它們可能會殺死你,更重要的是,它們會殺死你的孩子。而且,你知道,你可以使用不同種類的機器手臂,它們沒有這些缺點,但它們有其他缺點。家是一個非常不受約束的地方。
但我確實認為,在各種形式的零售或其他工作環境中,我認為五年後我們會看到這種情況。如果你去亞馬遜的倉庫,你甚至可以看到這種情況;他們已經擁有解決了他們移動問題的機器人。你知道,他們正在研究抓取和放置。我認為你會在倉庫環境中看到大量機器人推出。
然後,你知道,它將在一段時間內以領域為單位逐步推進。我不會預測它何時進入家庭,但我認為你會看到它被廣泛應用。我認為在五年後,我們會以一種今天會感覺奇怪的方式在日常生活中與它們互動。
主持人Jacob:我的意思是,顯然已經有一些獨立的機器人公司。在某種程度上,顯然機器人技術利用了基礎,你知道,LLM 的進步。我很好奇,比如,你知道,這一切是否會融合?顯然有些公司只做視頻模型。有些公司專注於生物、材料科學。當你考慮它的長期發展方向時,你知道,是否會有一個龐大的模型涵蓋所有這些?
鮑勃·麥克格魯:在最前沿的模型規模上,我認為你應該繼續期望這些公司推出一個模型。它將在他們所擁有的每種形式的數據的每個維度上做到最好。這是一個重要的警告。
專業化真正給你帶來的是性價比。在過去的一年裡,你已經看到最前沿的實驗室在擁有大量智能的小模型方面做得更好,這些模型可以以非常低的成本完成類似聊天機器人的用例。
如果你是一家公司,在這一點上,一個非常常見的模式是,你弄清楚你希望人工智能為你做什麼,然後你使用你喜歡的最前沿的模型來運行它。然後,你生成一個龐大的數據庫,並微調一些更小的模型來執行該操作。你知道,這是一個非常常見的做法;OpenAI 提供這項服務,我相信這在每個平臺上都是一個常見的模式。
你可以說,你知道,這非常非常便宜。現在,如果你像這樣訓練了一個聊天機器人,你的客戶服務聊天機器人是這樣訓練的,如果有人偏離了腳本,它就不會像你原來使用前沿模型那樣好。但這沒關係;這是人們願意接受的性價比。
主持人Jacob: 有一件我覺得很有趣的事情,我們之前聊天的時候,你提到了一個關於人工智能進展的宏觀觀點,基本上是在說,在2018年,我們曾預計,到了2024年,我們會擁有各種模型能力,你會從第一性原理出發認為,這些東西已經徹底改變了。就像世界相對於2018年幾乎面目全非。雖然你們確實對更廣闊的世界產生了巨大的影響,但我還不能說人工智能的普及已經完全改變了整個世界運作的方式。你認為為什麼會這樣?
鮑勃·麥克格魯: 嗯,我只是想稍微重述一下,我覺得,雖然聽起來很奇怪,但關於人工智能的正確心態應該是深深的悲觀。比如,為什麼進展如此緩慢?為什麼,你知道,有人說人工智能導致了GDP增長了0.1%。但這並不是因為使用人工智能帶來的生產力提升,而是因為建立訓練人工智能所需的數據中心所產生的資本支出。所以,為什麼人工智能在生產力統計數據中並不明顯?就像人們在20世紀90年代談論互聯網時所說的那樣。
我認為這有幾個原因。首先,2018年的那種觀點認為,一旦你可以和它對話,它就可以編寫代碼,那麼所有人都會立即實現自動化。這和工程師被要求編寫一個功能時的想法是一樣的。你可能會想,“哦,是的,我可以在幾個星期內搞定。”但是當你開始編寫代碼時,你就會意識到,“哦,實際上,這個功能比我想象的要複雜得多。” 如果你是一個優秀的工程師,你可能會估計兩週,但實際上項目可能需要兩個月。如果是一個糟糕的工程師,他們可能會發現這個功能根本就寫不出來。
我認為當我們真正深入研究人類如何完成工作時,就發生了這種情況。是的,你可能會在電話裡和他們交談,但這並不意味著他們所做的只是和你交談。其中涉及到真正的工作。從根本上說,人工智能可以自動化的只是一項任務。然而,一項工作是由許多任務組成的。當你仔細研究真實的工作時,你會發現,對於大多數工作來說,有些任務是無法自動化的。
即使你看看編程,例如,樣板代碼首先被優化,而那些更棘手的部分,比如確定你到底想做什麼,則是最後才被解決的。所以我認為,隨著我們繼續推廣人工智能,我們將發現它在自動化人類工作的全部範圍方面存在越來越多的複雜性和侷限性。
主持人Jordan:那麼考慮到這一點,就進展而言,你認為今天有哪些領域被低估了,應該比現在得到更多的關注?
鮑勃·麥克格魯:嗯,好的。這裡有一個答案,我真正感興趣的初創公司是那些人們利用人工智能來解決一些非常枯燥的問題的公司。
想象一下,你經營一家公司,你可以僱傭所有你想要的聰明人去做一些超級枯燥的事情,比如檢查你所有的支出,並確保你進行了適當的比價。比如,如果你的採購部門都是像埃隆·馬斯克那樣的人,他們真的非常仔細地控制支出,那麼你可能會省下很多錢。
沒有人這樣做,因為,你知道,那些真正能省錢的人,他們會覺得無聊。他們會討厭這份工作,對吧?但是人工智能是無限耐心的。
它不必無限聰明。而且,你知道,我認為在任何地方,如果你在經營你的業務,你可以從那些無限耐心的人所做的事情中獲得價值,那麼這就是人工智能應該自動化的東西。
主持人Jacob:這很有趣,因為我一直認為諮詢師是讓聰明人去解決枯燥問題或在枯燥行業工作的套利方式。而顯然,有了尖端的人工智能模型,你就可以讓一個智商很高的人去解決你永遠不可能讓一個聰明人去做的問題。
鮑勃·麥克格魯:是的,我的意思是,我第一次聽說有人做了生產力研究,結果表明人工智能確實帶來了20%到50%的提升。我就想,哇,太棒了。然後我就發現,哦,是諮詢師。嗯,你知道,人工智能非常擅長“扯淡”,而諮詢師的工作就是“扯淡”。所以也許我們不應該感到驚訝,生產力的提升首先出現在這裡。
主持人Jacob:是的,我認為在表現較差的後一半人中提升幅度也是最大的,對吧?
鮑勃·麥克格魯:沒錯。嗯,實際上,我認為這有點令人充滿希望。因為如果你看看錶現較差的後一半人,你知道,他們擁有人類擁有的、難以自動化的技能,這是這個事情充滿希望的版本。他們知道他們在做什麼,但他們不知道如何編寫代碼來實現它。然後模型出現了,它說,哦,我知道如何編寫代碼來實現它,但我不知道我應該做什麼。所以現在這些表現較差的人實際上可以在他們的工作中得到真正的提升。所以我覺得這非常令人充滿希望。
主持人Jordan:我想,就表現而言,你曾經並且正在與世界上一些最優秀的研究人員合作。你認為是什麼讓一個人工智能研究人員成為最優秀的?
鮑勃·麥克格魯:有許多不同類型的研究人員做著不同的事情。如果你想到像亞歷克·拉德福德這樣的人,他發明了GPT系列和CLIP,你會發現他基本上發明了大型語言模型(LLM),然後繼續進行各種形式的多模態研究。亞歷克是一個喜歡在深夜的奇怪時間獨自工作的人。相比之下,其他像伊利亞·蘇茨克維和雅各布·皮喬基這樣的傑出人物,他們分別是OpenAI的第一任和第二任首席科學家,他們有偉大的想法和願景。他們幫助其他人解決挑戰,並在為公司制定整體路線圖方面發揮著關鍵作用。
最優秀的科學家們都有一個共同的關鍵特徵,那就是一定的毅力。我永遠記得看著阿迪亞·拉梅什,他發明了DALL-E,努力解決生成一張不在訓練集中的圖像的問題,以證明神經網絡具有創造力。DALL-E的最初想法是看看它是否能創造一張粉紅色熊貓在冰上滑冰的圖片,阿迪亞確信這張圖片不存在於訓練數據中。他為此工作了18個月,也許是兩年,試圖實現這個目標。
我記得大約一年後,伊利亞過來給我看了一張照片,說:“你看,這是最新一代的。它真的開始起作用了。” 我看到的是一片模糊,頂部隱約可見粉紅色,底部是白色——只是像素開始聚集在一起。我當時還看不出什麼,但阿迪亞堅持不懈。這種堅韌是每一個成功的科研人員在解決基礎問題時必須具備的。他們必須把這看作是他們的“最後一戰”,並且決心為此堅持數年,如有必要的話。
主持人Jacob:為了使其發揮作用。你從組建這樣一個由這樣一群人組成的研究機構中學到了什麼?
鮑勃·麥克格魯:嗯,有趣的是,我能想到的最好的類比實際上來自 Palantir 的 Alex Carp,他總是說工程師是藝術家。這很有道理。當你和一位真正優秀的工程師交談時,他們只想創造。他們心中有某種東西。代碼是他們將心中的雕塑變成現實的方式。
在 Palantir,你知道,你必須讓他們修復bug,但每次你這樣做,他們藝術家的那一面都會感到悲傷。你必須有一個流程來讓人們協同工作,但他們藝術家的那一面會感到悲傷。事實是,工程師是藝術家,一個 10 倍工程師是 10 倍的藝術家,而研究員是任何工程師的 100 倍藝術家。
要建立一個擁有研究人員的組織,需要考慮的事情要多得多。有一種工程管理方式,你會說如果每個人都是可互換的零件,並且你有一個允許他們協同工作的流程,那就太好了。然而,與研究人員合作是非常需要密切關注的,因為最關鍵的是你不能扼殺他們的藝術性。
正是他們頭腦中對願景的熱情,使他們願意承受所有將願景變為現實的挑戰。
主持人Jordan:你很幸運曾在 Palantir 和 OpenAI 工作過,而且有很多文章都在討論 Palantir 的文化非常特別。當你想起 OpenAI 時,我相信未來也會有很多關於其文化的文章。你認為這些文章會怎麼說?
鮑勃·麥克格魯:是的。我的意思是,我認為其中一點是像我們剛才談到的那樣,與研究人員合作。關於 OpenAI 另一件瘋狂的事情是它經歷了多少次轉型,或者我更喜歡把它看作是多次重建。所以當我加入 OpenAI 時,它是一個非營利組織。公司的願景是通過撰寫論文來構建 AGI。我們知道這是錯誤的;感覺不太對勁。早期的很多人,Sam、Greg 和我,都是創業人士,而這條通往 AGI 的道路感覺不對。
幾年後,公司從非營利組織轉型為營利組織。這在公司內部引起了很大的爭議,部分原因是,我們知道在某個時候我們將不得不與產品互動。我們必須考慮如何賺錢。與微軟的合作成了另一個重建時刻,這也引起了很大爭議。我的意思是,也許賺錢是一回事,但是把它給微軟,給大型科技公司,哇,太糟糕了。
此外,同樣重要的是,我們決定說,好吧,我們不僅要與微軟合作,我們還要使用 API 構建自己的產品。最後,通過 ChatGPT 將消費者服務添加到企業服務中。這些都是初創公司會經歷的決定性的轉型。在 OpenAI,感覺好像每 18 個月或每兩年,我們都在從根本上改變公司的宗旨和在那裡工作的人們的身份。
我們從撰寫論文是你的工作的概念,轉變為構建一個世界上每個人都可以使用的模型的想法。真正瘋狂的是,如果你在 2017 年問我們正確的使命是什麼,那不會是通過撰寫論文來實現 AGI;相反,那會是我們想構建一個每個人都可以使用的模型。但是我們不知道如何實現這一目標,所以我們只能探索並一路找出所有這些事情。
主持人Jacob:你認為是什麼讓你們在進行這些重大轉變時如此成功?
鮑勃·麥克格魯:嗯,我的意思是,首先是必要性。這些都不是隨意選擇的,對吧?你有一個非營利組織,你花光了錢,也許你需要找到一種籌集資金的方式;也許為了籌集資金,你必須成為一家營利性公司。你與微軟的合作,也許他們沒有看到你正在創建的模型的價值,所以你需要構建一個 API,因為它可能真的有效。然後你可以向他們展示,人們實際上想要這些模型。
ChatGPT,我認為這是我們在 GPT-3 之後真正相信的,通過正確的進步,正確的形式不僅僅是人們必須通過中介才能與模型對話的 API,而是該模型將是你可以直接與之交談的東西。所以這是我認為非常刻意的一件事。但眾所周知,它的發生方式是一個意外。我們正在研究它。我們實際上已經訓練了 GPT-4,並且我們希望在模型足夠好,以至於我們每天都使用它時發佈。
我們在 11 月都看了 ChatGPT,我們想,它通過了門檻了嗎?不完全是。領導這個團隊的聯合創始人之一 John Schulman 說,聽著,我真的只想發佈它。我想獲得一些外部經驗。我記得當時在想,如果有一千人使用它,那將是成功。你知道,我們對成功的標準相當低。我們做出了一個決定,沒有把它放在等待列表之後。
然後,你知道,世界再次迫使我們出手,突然之間,世界上每個人都想使用它。當你發佈它時,最初的幾天是什麼樣的?哦,我的天啊,那是非常緊張的。起初,人們有些不相信這真的會發生。有一些焦慮。我們迅速嘗試找出如何獲得 GPU。所以我們暫時把一些研究計算資源轉移到了那裡。
然後就出現了這個問題,它什麼時候會停止?這種情況會繼續下去還是會成為一種時尚?因為我們幾乎在 DALL-E 上也經歷過類似的事情。DALL-E 2 模型曾在互聯網上引起轟動,然後就消失了。所以人們擔心 ChatGPT 實際上也會消失。這是我非常堅信它不會消失的地方,它實際上會比 API 更重要。
主持人Jacob:我的意思是,多麼有趣的經歷啊。我想其中一件很酷的事情是,你離尖端 AI 研究非常近。我很好奇,在過去的一年中,你在 AI 領域改變了什麼想法?
鮑勃·麥克格魯:有趣的是,我不認為我改變了什麼想法。在 GPT-3 之後,進入 2020 年、2021 年,如果你身處其中,那麼未來四五年需要發生的事情,很多都感覺是理所當然的。我們將擁有這些模型。我們將使模型變得更大,它們將成為多模態的。即使在 2021 年,我們也在談論如何需要在語言模型上使用 RL,並嘗試找出如何使其工作。而且,2021 年和 2024 年之間的真正區別不是說需要發生什麼,而是我們能夠讓它發生這個事實。而且,你知道,我們,整個領域,都能夠讓它發生。但在某種意義上,我們現在的處境也感覺有點命中註定。
主持人Jacob:我猜想,展望未來,當你考慮擴展預訓練和擴展測試時計算時,感覺它也像是命中註定要僅憑這兩者就達到 AGI 嗎?或者,你是如何看待這個問題的?
鮑勃·麥克格魯: 我很難理解AGI(通用人工智能)的概念。而且,我認為,如果說有什麼的話,我對AGI有一個很深的批判,那就是不存在一個單一的時刻,實際上,這些問題是分形的。而且,我們將看到越來越多的事物被自動化。但不知怎麼的,我們——我不知道。我有一種感覺,它會變得非常平庸,不知何故,我們都會開著自動駕駛汽車去辦公室,在那裡指揮著人工智能大軍。然後我們會覺得,哦,這有點無聊。感覺仍然像在辦公室,我的老闆仍然是個白痴。這大概就是我們AGI的未來。我們迫不及待地等待下午五點下班之類的。
更嚴肅地說,我一直覺得,而且我認為這在OpenAI內部以及其他前沿實驗室也是一種普遍的觀點,即解決推理是擴展到人類水平智能所需的最後一個基本挑戰。你需要解決預訓練,你需要解決故障模態,你需要解決推理。此時,剩下的挑戰就是擴展。但這非常重要。
擴展非常困難。實際上,根本沒有多少基礎性的想法。幾乎所有的工作都是在如何將它們擴展到接受越來越大的計算量。這是一個系統問題。這是一個硬件問題。這是一個優化問題。這是一個數據問題。這是一個預訓練問題。所有的問題實際上都只是關於擴展。所以,是的,我認為在某種程度上,它已經是註定的了。這裡的工作是擴展它,但這很難。大量的工作。
主持人Jacob: 顯然,我認為人們在談論這些模型擴展其能力的社會影響。我認為我們仍然處於這種討論的早期階段,可能有很多不同的對話需要進行。但您對哪些方面特別感興趣和充滿熱情,您認為我們應該談論哪些方面?
鮑勃·麥克格魯: 是的。我認為最有趣的是,我們正在從一個智能可能是社會中最稀缺資源的時代,過渡到一個智能將無處不在且免費的時代。那麼,稀缺的生產要素又是什麼呢?而且,我認為我們不知道。我猜是能動性。也就是說,你可以去完成事情。你需要提出什麼正確的問題?你需要追求哪些正確的項目?我認為這些類型的問題對於人工智能來說很難為我們解決。我認為這些將是人類需要弄清楚的核心問題。而且,並非每個人都擅長這一點。所以,我認為我們需要思考的是,我們如何發展那種讓我們能夠與之合作的能動性。
主持人Jordan: 您認為這是現在,還是未來?
鮑勃·麥克格魯: 我認為它會感覺非常連續。這是一條指數曲線。而指數曲線的特點是,它們沒有記憶。你總是感覺,你總是在以相同的速度、相同的節奏前進。
主持人Jacob: 這些模型最終不會也弄清楚,我的意思是,如果你考慮一下弄清楚要做什麼或項目目標,你剛剛提到了幾次?例如,你可以想象,在未來最基本的層次上,對模型說,嘿,建立一家好公司,或者創作一件有趣的藝術作品,或者製作一部電影,等等。隨著這些模型變得更強大,這種能動性,我想,也許可以談談這一點。
鮑勃·麥克格魯: 是的,我的意思是,你能否直接要求人工智能解決所有問題?好吧,我認為你可以,而且你會得到一些結果。但我們以Sora為例。如果你在製作一個視頻,你給它一個非常模糊的提示,它會完全為你創建一個視頻。也許它會是一個非常酷的視頻。也許它會比你能想到的最酷的視頻還要好。但它可能不是你想要的視頻。
因此,你也可以與它互動,你給它一個非常詳細的提示,你說,我對我想看到的視頻做了這些具體的選擇。這讓你能夠創建讓你自己或你的觀眾滿意的視頻。
我認為這種張力將持續存在,無論人工智能多麼先進,因為你如何填充空白將決定最終產品的很多內容。
主持人Jacob: 您今天是如何使用最先進的O1模型的?
鮑勃·麥克格魯: 我理解模型,並與之交互的首選方法是,我花了很多時間教我八歲的兒子學習編程。他喜歡問問題,所以我總是在想如何將他今天感興趣的事情與我想教給他的課程聯繫起來。
例如,有一天他說,“爸爸,什麼是網絡爬蟲?它是如何工作的?”這給了我一個機會,我說,好吧,我可以用一個簡短的程序來教他網絡是如何工作的嗎?我嘗試使用一個O1模型,努力創建一個足夠簡短的程序,並且不引入太多我還沒有教過他的新概念。
目標是教他關於網絡的知識,這是我希望他理解的核心概念,同時確保內容對於一個八歲的孩子來說是易於理解的。這花了一些時間來調整程序,但我相信學習過程的一部分是實驗,測試不同的想法是其中一個重要的方面。
主持人Jordan: 我想在測試方面,當您從研究測試的角度考慮時,當新模型出現時,您通常會進行哪些核心評估,並且您最依賴哪些評估?
鮑勃·麥克格魯: 好吧,我的意思是,這裡首先要指出的是,它隨著每一代模型而變化。你知道,當我們開發O1模型時,要看的正確指標是GPQA,它代表谷歌證明問題解答。然而,當我們準備發佈時,它不再是一個非常有趣的指標,因為我們已經從一開始幾乎什麼都沒做到,到它完全飽和。最後剩下的幾個問題通常是措辭不當或不太有趣的問題。因此,你選擇的指標很大程度上取決於你在研究中試圖做的工作,我認為這是一個普遍的經驗。
然而,在過去幾年中一直有用的事情是編程。編程是一項結構化的任務,包括我自己和其他研究人員在內的許多人都可以理解,這非常重要。它可以從完成一行代碼擴展到編寫整個網站。我們還沒有達到編程被完全解決的程度,我認為我們還有很長的路要走。我相信,在我們可以真正完成一個真正的軟件工程師的工作之前,還有幾個數量級的差距。
主持人Jacob:你早期的職業生涯中有一件事很明顯,你當時正在攻讀計算機科學博士學位,而且我記得至少有一部分專注於博弈論。顯然,我認為使用這些模型來探索博弈論中的課題有很多有趣的含義。我想問的是,一般來說,你認為人工智能將如何改變社會科學研究、政策制定以及其他相關領域?如果你今天用這些模型的力量重新審視你之前的工作,你會嘗試做些什麼?
鮑勃·麥克格魯:首先,我其實對學術界非常失望。我認為它有一套糟糕的激勵機制。在某些方面,我把OpenAI的組織設計成學術界的鏡像,創造一個協作可以蓬勃發展的地方。
商業中一個有趣的方面是,很多產品管理的工作都類似於實驗社會科學。你有一個想法,你想在人類身上測試一下。你希望在採用良好方法的同時,看看它是如何工作的。A/B測試就是一個很好的例子;當你這樣做時,你實際上是在進行一種社會科學。
這是我特別興奮的事情之一:如果你在進行A/B測試,為什麼不把你現在與用戶的所有互動都拿來,用這些數據微調一個模型,然後你就突然有了一個模擬用戶,它的反應方式與你的實際用戶一致?這意味著你可以在不投入生產的情況下進行A/B測試。也許之後,你可以對其中一個模擬用戶進行深入訪談,瞭解他們的想法。
這在今天可行嗎?我不知道。我還沒有嘗試過,但明天也許就行了。我認為這是一個很好的普遍原則:每當你發現自己想讓別人為你做某事時,考慮一下是否可以要求人工智能來做。而且,人工智能可能可以處理數百個任務,而人類可能只能完成一個任務,而且還很費勁。
主持人Jordan:是的,我讓雅各布為我做了很多任務,所以。
主持人Jacob:是的,你應該停止那樣做。你應該開始問我的模型。感謝你交付了它。你幫我節省了很多時間。你提到,我想,你設計了學術界現有的激勵機制,並設計了與此形成對比的OpenAI組織。能多談談這方面嗎?
鮑勃·麥克格魯:是的,是的。我的意思是,回想一下2017、2018、2019年。當時,人工智能研究實驗室還不是一個大產業。它們只是研究實驗室。很多參與其中的人來自學術界。如果你看看學術界的結構,就會發現它有一套激勵機制,對於其最初的設計來說是足夠好的。然而,人們非常關注功勞——到底是誰做了這個?論文上的人名按照什麼順序排列?這對於具有學術背景的人來說非常重要。
也許你不想與他人合作,因為它會沖淡你對結果的貢獻。如果有兩個人一起解決問題,這通常更像是競爭,而不是一個把工作速度提高一倍的機會。在這種背景下,我認為DeepMind考慮建立一個模仿學術界但又在公司框架內運作的實驗室,這樣我就可以指導人們,並只專注於深度學習。
另一方面,我認為Brain最初的目標是聚集一些學者,以一種非常學術的方式進行探索性研究。我不會強加方向,而是會在外部安排產品經理,以便他們可能會抓住這些偉大的想法並將其轉化為產品。與此同時,我們是一群創業人士,以及一些傑出的研究人員,包括像伊利亞這樣的人。我們的觀點是,研究實驗室應該像一家初創公司一樣運作。
我們認為,在明確前進方向的同時,給予人們很多自由非常重要,特別是那些傑出的研究人員——其中一些人我們當時甚至沒有意識到他們很出色。我們的目標是讓他們找到他們願意“為之奮鬥”的“山頭”,以創造他們渴望創造的卓越工作。我們強調合作,確保人們為了一個統一的目標而共同努力,而不是僅僅專注於發表大量的論文。
主持人Jacob:我喜歡這個說法。我想你早先已經回顧了OpenAI歷史上一些最著名的決定,從非營利組織到轉型,與微軟的合作,發佈ChatGPT的API。有沒有哪個也許不是那麼有名,但你認為是關鍵的決策點?或者說,你認為哪個決策是很難做出的,或者哪個決策真正改變了組織的走向?
鮑勃·麥克格魯:我認為我之前沒有談到的一個決定,但當時也頗具爭議,那就是決定加倍投入語言建模,並使其真正成為OpenAI的中心焦點。這個決定很複雜,原因有很多。這樣的改變涉及到重組和調整結構,人們必須改變他們的工作。
再次強調,我們最初的文化鼓勵嘗試各種不同的方法,看看哪些方法奏效。我們第一個重要的重大努力是共同努力玩Dota 2遊戲,這延續了人工智能解決越來越難的遊戲的偉大傳統。你從國際象棋到圍棋,然後到Dota 2和星際爭霸,這在某種程度上感覺沒那麼酷。然而,我可以向你保證,從數學上講,這些遊戲真的比圍棋和國際象棋更難,即使它們沒那麼優雅。
Dota 2項目取得了巨大成功,它教會了我們很多東西。從那次經驗中,我們得出了這樣一個信念:你可以通過擴大規模來解決問題,並有一套用於此目的的技術工具。因此,通過決定關閉更多探索性項目,例如機器人團隊和遊戲團隊,並真正將重點重新放在語言模型和通用生成模型上,包括多模態工作,我相信這是一個非常關鍵的選擇,儘管當時非常痛苦。
主持人Jacob:我早先注意到一件事,你顯然提到,你在用你八歲的孩子測試這些模型。而且,我想在你做父母的這段時間裡,顯然八年前的世界與現在大不相同,這在很大程度上歸功於你在人工智能領域推動的進步。我想知道,無論是為了你的生活,還是你養育孩子的方式,你是否基於你對這些模型的力量將在多快的時間內顯現在這個世界上而更新的信念,從而改變了什麼?
鮑勃·麥克格魯:是的,我認為事實是我並沒有改變什麼。而且我認為這可能是我的一個失敗之處,對吧?比如,誰比我更適合去搞清楚孩子們應該學習什麼呢?然而,我認為我幾乎還在嘗試教他們和八年前一樣的東西。
當ChatGPT可以為他編碼時,我為什麼要教我八歲的兒子編碼呢?我認為這是一個謎。但是,在某種意義上,未來是註定的,但實際的運作方式的輪廓,我認為將是非常神秘的,並且會隨著時間的推移向我們揭示。
因此,我認為嘗試那些剛好在你能力邊界上的事情的古老真理非常重要。你要努力學習數學,努力學習編碼,寫作,學習寫好文章,學習廣泛閱讀。我認為這些將培養孩子們和坦率地說,成年人需要的技能,無論人工智能最終會做什麼。
因為從根本上說,這與編碼無關。這與數學無關。而是關於你學習如何以結構化的方式思考問題。
主持人Jordan:好的,這一切都太棒了。我相信我們可以和您再聊上幾個小時。但我們喜歡用一些快速問答來結束對話。第一個問題是,在當今的AI領域,什麼是被過度炒作的,什麼是被低估的?
鮑勃·麥克格魯:哇,好的。嗯,對於什麼是過度炒作的,一個簡單的答案是,我認為是新的架構。市面上有很多新的架構。它們看起來很有趣,但往往在規模化時會崩潰。所以,如果有一個在規模化時不會崩潰的架構,那它就不會被過度炒作。在那之前,它們都是被過度炒作的。至於被低估的,我認為是01。我覺得它被炒作得很厲害,但它是否被恰如其分地炒作了呢?沒有。我認為它被低估了。
主持人Jacob:我知道我們的聽眾都會很好奇,所以我會問,但您能否分享一些關於您在這個時候離開OpenAI的原因?
鮑勃·麥克格魯:嗯,事實是,我在那裡工作了八年,我真的覺得我完成了當初我來這裡時想要完成的大部分事情。而且,我宣佈辭職的時間是在O1預覽版發佈之後,這並非巧合。你知道,我們開發了一個特定的項目,一個研究項目,再次強調,是預訓練,多模態推理。這些問題都得到了解決。坦率地說,這是一份艱苦的工作。當我覺得我已經完成了我需要做的事情時,是時候把它交給下一代對這份工作充滿熱情並致力於解決剩餘問題的人了。我認為他們面臨的問題非常令人興奮。
你對未來有什麼打算嗎?我離開Palantir後,在加入OpenAI之前花了兩年時間。我開始籌劃一家機器人公司,並且嘗試了很多事情。我親自動手製造東西,並與很多人交談。坦率地說,我犯了很多錯誤,但沒有哪個錯誤是真正重要的。在這個過程中,我學到了很多,並形成了自己關於什麼對世界重要以及技術進步的本質是什麼的理論。
所有這些經歷,我遇到的人,以及我想出的想法都幫助我加入了OpenAI。事實證明,這比我離開Palantir後的前六個月裡所能選擇的任何事情都要好得多。所以,我不著急。我將繼續與人會面並弄清楚事情。我真的很享受思考和學習新事物的過程。
主持人Jacob:既然您現在有更多的時間了,有沒有什麼您特別想深入研究的領域,或者是一些您一直想花更多