專注於市場的科技專家和專業懷疑論者認為,人工智能泡沫已經破滅,寒冬又回來了。 李飛飛並不這麼認為。事實上,被譽為“人工智能教母”的李飛飛卻持相反觀點。她目前在斯坦福大學休學,與他人共同創辦了一家名為世界實驗室 (World Labs)的公司。儘管目前的生成式人工智能是基於語言的,但她看到了一個新領域,即系統能夠利用物理、邏輯和我們物理現實的豐富細節構建完整的世界。這是一個雄心勃勃的目標,儘管一些沉悶的大亨們說人工智能的進展已經陷入了嚴峻的停滯狀態,但世界實驗室的融資速度很快。這家初創公司可能還需要一年時間才能推出產品——目前還不清楚它何時推出以及推出後效果如何——但投資者已經投入 2.3 億美元,據報道對這家新興初創公司的估值為 10 億美元。
大約十年前,李飛飛通過創建 ImageNet 幫助人工智能實現轉型。ImageNet 是一個定製的數字圖像數據庫,它使神經網絡變得更加智能。她認為,如果人工智能要創造現實世界,無論是現實模擬還是完全想象的宇宙,當今的深度學習模型也需要類似的推動力。未來的喬治·RR·馬丁斯可能會以提示而不是散文的形式創作他們夢想的世界,然後你可以渲染它並在其中漫遊。李飛飛說:“計算機通過攝像頭和攝像頭背後的計算機大腦來觀察物理世界。將這種願景轉化為推理、生成和最終的交互需要理解物理世界的物理結構和物理動態。這項技術被稱為空間智能。”World Labs 自稱是一家空間智能公司,它的命運將決定這個詞是成為一場革命還是一個笑柄。
李多年來一直痴迷於空間智能。當所有人都為 ChatGPT 而瘋狂時,她和她的前學生賈斯汀·約翰遜 (Justin Johnson) 卻在電話中興奮地談論人工智能的下一次迭代。“未來十年將是關於生成新內容,將計算機視覺、深度學習和人工智能從互聯網世界帶出來,並將它們嵌入到空間和時間中,”約翰遜說,他現在是密歇根大學的助理教授。
在與虛擬網絡先驅、現任Andreessen Horowitz合夥人馬丁·卡薩多共進晚餐後,李飛飛決定在 2023 年初創辦一家公司。安德森霍洛維茨是一家以近乎救世主式地擁抱人工智能而臭名昭著的風險投資公司。卡薩多認為人工智能的發展道路與電腦遊戲類似,電腦遊戲從文本開始,然後轉向 2D 圖形,現在擁有令人眼花繚亂的 3D 圖像。空間智能將推動這一變革。最終,他說,“你可以把你最喜歡的書扔進一個模型裡,然後你真的走進去,以一種身臨其境的方式實時觀看它的播放,”他說。卡薩多和李飛飛一致認為,實現這一目標的第一步是從大型語言模型轉向大型世界模型。
李開始組建團隊,約翰遜是聯合創始人。卡薩多又推薦了兩個人,一個是曾在亞馬遜、Meta 的 Reality Labs 和 Epic Games 工作過的克里斯托夫·拉斯納 (Christoph Lassner),他是Pulsar的發明者。Pulsar 是一種渲染方案,後來產生了一項著名的技術,即3D Gaussian Splatting 。這聽起來像是麻省理工學院長袍派對上的獨立樂隊,但這實際上是一種合成場景的方式,而不是一次性物體。卡薩多的另一個推薦人是本·米爾登霍爾 (Ben Mildenhall),他創造了一種強大的技術,叫做 NeRF(神經輻射場),可以將 2D 像素圖像轉化為 3D 圖形。“我們把現實世界的物體帶入 VR,讓它們看起來非常真實,”他說。他辭去了谷歌高級研究科學家的職務,加入了李的團隊。
大型世界模型的一個明顯目標是將世界意識融入機器人。這確實是世界實驗室的計劃,但還需一段時間。第一階段是建立一個對三維、物理性以及空間和時間概念有深刻理解的模型。接下來是模型支持增強現實的階段。之後,該公司可以涉足機器人技術。如果這一願景得以實現,大型世界模型將改善自動駕駛汽車、自動化工廠,甚至人形機器人。
這還遠得很,而且也不是板上釘釘的事。World Labs 承諾將在 2025 年推出一款產品。當我向創始人詢問產品到底是什麼以及預計的客戶是誰時——比如 World Labs 將如何賺錢——他們強調說他們才剛剛起步。“還有很多邊界需要突破,還有很多未知數,”李說。“當然,我們是世界上解決這些未知數的最佳團隊。”
Casado 的說法更具體一些。他指出,與 ChatGPT 或 Anthropic 的 Claude 一樣,模型可以是產品——其他人可以直接使用或託管其他應用程序的平臺。客戶可能包括遊戲公司或電影製片廠。我記得我寫過皮克斯曾經在怪物皮毛或水的流動等事情上投入了無盡的資源。想象一下用一句話的提示做到這一點。
World Labs 並不是唯一一家致力於解決某些人稱之為物理 AI 問題的公司。Nvidia 首席執行官黃仁勳今年早些時候表示:“為通用人形機器人構建基礎模型是當今 AI 領域最令人興奮的問題之一。” 我最近寫了一篇關於 Archetype 的文章,該公司也在走這條路。但卡薩多堅持認為,World Labs 的野心、才華和願景是獨一無二的。“我已經投資了近 10 年,這是我遇到過的最好的團隊,”他說。風險投資人加大賭注是很常見的,但他投入的不僅僅是金錢:自從他成為風險投資人以來,這是他第一次成為兼職團隊成員,每週在公司待一天。
其他風險投資公司也在投資,包括 Radical Ventures、NEA 和(令人驚訝的是)Nvidia 的風險投資部門,以及包括馬克·貝尼奧夫、裡德·霍夫曼、傑夫·迪恩、埃裡克·施密特、RON·康威和傑夫·辛頓在內的全明星天使投資人名單。(所以你得到了人工智能教父的支持。)已故的蘇珊·沃西基在上個月 不幸去世之前也進行了投資。
所有這些聰明人都會錯嗎?當然。你不用費很大力氣就能發現,World Lab 的願景與最近一個相當戲劇性地淡化的流行詞“元宇宙”有多麼相似。World Lab 的創始人認為,這種短暫的熱潮為時過早,只是基於一些沒有合適互動內容的有前途的硬件而曇花一現。他們暗示,大型世界模型可以解決這個問題。據推測,這些世界都不會將人工智能視為停滯不前。
去年,李飛飛出版了一本結合了回憶錄和人工智能愛情故事的《我眼中的世界》 。當時,我對這本書大加讚賞,並在一篇題為《李飛飛以算法視角開啟人工智能革命》的純文本中與她進行了討論。現在,她希望構建以前從未有人見過的世界。
李飛飛是一個性格內向的人,她不願意談論自己。但她勇敢地想出瞭如何將自己 16 歲時移民到美國的經歷融入故事中。當時她不會說英語,但她克服了重重困難,成為這項關鍵技術的關鍵人物。在擔任現職期間,她還擔任過斯坦福人工智能實驗室主任和谷歌雲人工智能和機器學習首席科學家。李飛飛說,她的書結構像一個雙螺旋,她的個人探索和人工智能的發展軌跡交織在一起,形成一個螺旋狀的整體。“我們繼續通過反思自己來看待自己,”李飛飛說。“反思的一部分是技術本身。最難看清的世界是我們自己。”
在她對 ImageNet 的創造和實施的敘述中,這些線索最引人注目地匯聚在一起。李講述了她決心挑戰那些懷疑能否對數百萬張圖片進行標記和分類的人,包括她的同事,他們懷疑從靠墊到小提琴的龐大類別列表中的每一個至少有 1,000 個示例。這項工作不僅需要技術上的堅韌,還需要成千上萬人的汗水(劇透:亞馬遜的 Mechanical Turk 幫助實現了這一目標)。只有瞭解了她的個人經歷,我們才能理解這個項目。她無所畏懼地承擔如此冒險的項目,這得益於她父母的支持,儘管經濟困難,他們堅持讓她放棄商界的一份收入豐厚的工作,追求成為一名科學家的夢想。實現這一登月計劃將是對他們犧牲的最終認可。
湯姆問道:“當智能手機剛出現時,人們常常談論使用智能手機的公共禮儀——而現在,在公共場所看到滿是盯著手機的人是很常見的。你認為AR頭戴設備的禮儀會是什麼樣的?”
嗨,湯姆,謝謝你的提問。AR 的禮儀不會像AR那樣簡單,當我們的注意力集中在掌上時,一切都很明顯。當公司想出如何將其融入輕量級眼鏡中時,增強現實將達到頂峰——有點像 Meta 的熱門雷朋眼鏡,它目前還沒有實現AR ,但將來會實現。我們現在在手機上看到的很多東西都將在平視顯示器上可讀。
到那時,我們就不會那麼明顯地意識到,在太陽鏡的背後,我們更關注 TikTok、短信和Candy Crush ,而不是我們的晚餐夥伴。公共場所可能看起來不像每個人都在其他地方,但事實確實如此。我預測,觸覺技術將是必不可少的,它可以在火車即將開出、門口被堵住或被搶劫時提醒人們。典型的晚餐對話可能是這樣的:“你聽到我剛才說的話了嗎?”[沉默。]“你聽到我剛才說的話了嗎?[停頓,觸摸眼鏡的側板。]“是的,我當然在注意。”餐廳的每一張桌子上都會發生這種情況!
我對禮儀的預測是:即使站在一起,人們最終也會通過短信進行交流,因為如果他們說的話被傳送到你的眼球和耳機裡,會更有說服力。所以不要再抱怨人們盯著手機了,因為更糟糕的日子即將到來。
您可以將問題提交至mail@wired.com 。在主題行中寫上ASK LEVY 。
還有什麼比這更熱的呢?等著吧。
以下是 Apple 九月發佈會上宣佈的所有內容。
雖然 iPhone 16 備受關注,但充當助聽器的 AirPods可能是蘋果最重要的舉措
當比特幣礦場入駐時,德克薩斯州一個石油小鎮的居民就不那麼友善了。
據馬克·庫班稱,馬克·庫班並沒有遭遇中年危機。
不要錯過本專欄未來的訂閱版本。立即訂閱《WIRED》(純文本讀者可享受 50% 折扣) 。




