你今天的工作,或許並不是真正的工作
這句聳人聽聞的言論出自奧特曼與Rowan Cheung最新的採訪。
在這場長達30分鐘的對談裡,除了自己對AI與工作的思考,奧特曼還分享了GPT-6的進展、ChatGPT是否會成為美國版微信、AGI的設想變化、AI未來的交互模式,以及自己被惡搞成Sora熱梗的感受。
可以說,這次對話涵蓋了從娛樂八卦到前沿科技的多重視角,既有趣味,也直指未來趨勢。
經整理的訪談全文如下:
(注:為方便閱讀,調整了部分語氣詞與鋪墊)
訪談全文
DevDay之後:最大亮點與產品佈局
Q: Dev Day2025裡所有發佈的內容——你最興奮的部分是哪一個?
Sam Altman:我對所有的內容都很興奮。把應用引入ChatGPT這件事,其實我很早就想做了。
但更讓我興奮的是聽大家聊他們用Agent Builder做的各種東西。其實無論是Agent Builder還是Agent Kit,裡面都有很多讓我想親自去用的功能。不過,如果一定要我選一個,我覺得在ChatGPT裡運行應用會是最棒的。
Rowan Cheung:每週活躍用戶8億人的ChatGPT已經成了新的分發平臺。開發者和創業者該怎麼利用Apps SDK在ChatGPT上構建應用呢?
Sam Altman:我覺得我們還需要經過一些迭代,才能真正弄清人們主要會怎麼使用這些功能。比如,人們會習慣根據應用的名字來調用它們嗎?還是他們更希望ChatGPT自己知道他們常用的是什麼,並主動推薦?
我覺得未來開發者會摸索出一種新的分發機制,讓這些應用被自然地用起來。不過這種事情總是這樣:只有當你真的把它發佈到世界上之後,才會被各種意外的使用方式所驚喜。
Rowan Cheung:我記得你們也發佈了文檔教開發者如何提高被推薦的幾率?
Sam Altman:是的,不過還是得帶上免責聲明。全新產品變化很快,我們會在實踐中一起學習。
Rowan Cheung:回到兩年前的第一個Dev Day,你們推出了GPT Builder,那真的很棒。我記得自己也是最早公開搭建 GPT的人之一。從那時到現在,你們在Agent Builder上取得了哪些突破?
Sam Altman:最大的變化是模型本身變得更強了。我回想起第一個Dev Day,那時的模型能力和現在相比,差距非常大——22、23個月的時間,模型能力已經進步得驚人。同時我們也學到了很多關於用戶想要怎樣構建這些Agent的東西。他們不僅希望在ChatGPT上構建,也希望能在其他平臺上使用。讓我印象最深的是,現在你可以非常輕鬆地搭建一個相當複雜的系統——用可視化界面、上傳幾個文件、授權訪問數據源、告訴它你的需求,然後幾分鐘就能部署好。我昨天在彩排時第一次完整看這個過程,感到震撼。藉助Codex、Agent Ki等工具快速開發令人印象深刻的軟件,這種體驗像是經歷了一次“地殼變動”。
Rowan Cheung:現在在Agent Builder裡基本可以零代碼構建agent,對吧?
Sam Altman:是的,不過如果你懂一點或很多代碼,你能做更復雜的事情。但即便是普通的知識工作者,也可以開始構建 agent。可以說,這幾乎是一場針對Agent的“零代碼革命”。
Rowan Cheung:這對下一波創業者或開發者意味著什麼?
Sam Altman:這是我一直在思考的問題。我昨天在後臺看Romain的演示,心想——如果是一年前做,這些東西要花多長時間啊?而現在幾乎可以實時完成,我甚至覺得自己的創意都跟不上它的速度了。我不完全知道這會帶來什麼改變,但可以肯定的是——世界上將被編寫的軟件數量會大幅增加,測試和改進創意所需的時間會大幅下降。你可以嘗試更多想法,更快找到好點子,但具體還會改變什麼,我還沒完全搞明白。
距離第一家十億級純血Agent公司還有多久?
Q:第一家由Agent運營的十億美元公司什麼時候誕生,Agent Builder能達到那種自主水平了嗎?
Sam Altman:還沒呢。以前我們有個小打賭池,預測第一家單人十億美元公司會什麼時候出現。雖然現在還沒正式設立,但有很多猜測——比如第一家“零人公司”。
Rowan Cheung:幾個月?幾年?
Sam Altman:我預期是幾年。但現在我們甚至可以可信地談論——你輸入一個prompt到聊天機器人,它就能運行。這本身就非常不可思議。
Rowan Cheung:不過我們看到的一些agent產品,還需要大量人工監督和反饋。什麼時候才能實現agent連續一週無需反饋就能工作?
Sam Altman:我覺得Codex距離能完成一週工作並不遠。雖然不一定是 2025 年能實現,但今天我和一些人聊時,他們都說——現在它已經能完成整天任務了,太快了。我很少覺得AI的進步讓我暈頭轉向,但觀察 Codex 能完成任務的時間延長速度,這次確實讓我震撼。可以預期,一週級任務也不會太遠了。
Rowan Cheung:技術瓶頸在哪?
Sam Altman:更智能的模型、更長的上下文、更好的記憶能力。
Rowan Cheung:所以你們有agent,各種模型升級,Codex,還能用API。回想一下,如果把20歲剛從斯坦福退學的年輕人帶到現在、給他你現在掌握的所有知識,你會讓他建什麼?又不會建什麼?
Sam Altman我前幾天也在想這個問題。我很羨慕現在這一代20歲的退學生,因為能構建的東西太多了,機會空間極其廣闊。過去幾年我幾乎沒有完整的心智空間去認真思考自己會做什麼。但我知道,有很多很酷的東西可以做。今天和大家聊這些項目,真的很讓人興奮。
Rowan Cheung:我最近一直在思考這個問題,也想了很多其他開發者可能也在思考——現在你能做的事情太多了。在構建這些產品時,你有沒有什麼建議,比如如何找到一種獨特優勢來維持領先?是通過分發渠道、數據,還是某種工作流模式?
Sam Altman:在抽象層面上回答這個問題總是覺得很難,因為最好的獨特優勢,本質上是獨特的——你必須為自己摸索出來。OpenAI 花了很多功夫才找到我們的優勢。一般來說,這個問題沒有通用答案。
最好的答案,是你找到只適合你正在做的事情、你的產品、技術,以及你在市場上的位置和時機的那種優勢。這通常也是創辦新事物時創造價值的重要部分。
我能說的一個通用經驗是——你邊做邊摸索。有一句我一直很喜歡的商業名言:“讓戰術成為戰略。”你可以從做那些有效的事情開始,而令人驚訝的是,在這個過程中,常常會自然出現可以發展成戰略的東西。
如果你當年問我,我們啟動ChatGPT時,哪些會成為持久優勢,我會說完全不知道。我可能有一些猜測,但不會自信。後來證明最令人興奮的一個例子是——記憶(memory),它成為我們的重要競爭優勢,也是用戶持續使用 ChatGPT 的原因。那時我們完全沒考慮到這一點。你開始構建功能,然後有時候就會自然浮現出“哦,這可能成為我們一個非常持久的優勢”。
GPT-6:為產品打造模型
Q:在GPT-6上,你覺得應該建立哪些優勢?或者說,在構建一個產品時應該思考什麼?
Sam Altman:這其實就是你必須自己去摸索的部分。我很樂意找機會一起頭腦風暴,這會很有趣。但說實話,OpenAI佔據了我幾乎所有的思考空間,我沒機會去認真考慮如何創辦新公司,這有點遺憾。AI 改變了世界的很多事情,但促成公司優勢的基本因素不會因此改變。比如網絡效應、品牌與營銷優勢、用戶數據,以及市場效應。如果你列一個清單,看近幾年什麼方式行得通,現在看大致相同,但可能會有新的戰術去建立這些優勢。
Rowan Cheung:最近你們推出了GDPval基準,用來衡量 AI 模型在主要知識工作崗位中實際經濟任務的表現。令我驚訝的是,GPT-5排在第二,僅次於Claude的Opus模型。這你們還能把結果發佈出來,非常厲害,你們對結果怎麼看?
Sam Altman:首先,如果我們不願意發佈模型排名第二的結果,那就太糟了。總會有些事情我們做得最好,也會有些做得不如別人。而建立持續進步的文化方式就是——愉快而直接地承認,在某些基準或評測上,別人比你做得更好。我認為Claude團隊在理解企業用例和漂亮地呈現輸出上做得非常出色,所以我一點也不意外,反而受到激勵想做得更好。
Rowan Cheung:這個基準會影響你們構建GPT-6的方式嗎?
Sam Altman:會影響我們部分後訓練(post-training)的方式,但我認為GPT-6的整體策略不會改變。
AGI:無需誇大,也不必低估
Q:你對 AGI(通用人工智能)的定義是——當它在大多數經濟價值最高的工作上超越人類時。那在GDPval評分上,什麼時候你會說我們已經達到了 AGI?
Sam Altman:我一直在思考這個問題。首先,像很多人一樣,我對AGI有多個定義。越接近它,這個概念就越模糊。但我最關心的一點,也是讓我驚喜的是,我們終於到了一個開始發生的時刻——那就是當AI能夠進行新穎發現,能夠擴展人類知識總量的時候。這些成就目前都很小,我不想誇大。
但你現在可以在Twitter上看到很多例子,各個學科的科學家們說,AI 做出了一個小發現、提出了新方法、或者解決了某個問題。再強調一下,我既不想誇大,也不想低估。這才是真正重要的事情。而我們正處在這一切的開端,並且樂觀地認為未來幾個月、幾年我們能大力推動,這是件大事。這可能是我最關心的“AGI”指標。
Rowan Cheung:有沒有特別讓你興奮的科學突破,想讓AI去解決或發現的?
Sam Altman:當然,治癒疾病,發現新的物理規律,那會很棒。但即便是現在發生的小事,比如數學方面的進展,也讓我覺得很重要。當GPT-4推出時,我就有這種感覺。我知道關於圖靈測試存在很多爭議,但大眾對圖靈測試的認知,曾經覺得它遙不可及,結果一旦AI通過了,人類社會基本沒有更新認知。大家興奮兩週後,就開始抱怨為什麼 AI 不夠快,或者這不管用,讓它更好。這也體現了人類的偉大——那項“AI永遠的測試”就這麼過去了,而我們都適應了。我感覺現在也會發生類似的事情——我們會逐漸習慣AI做科學發現。
Rowan Cheung:最近斯坦福做了一項“workslop”研究。這個詞用來描述一種低迴報的AI輸出——表面看起來很完美,但實際上會因為返工增加額外工作量。
研究調查了1000多名辦公室職員,結果顯示有41%的人過去一個月裡曾遇到同事產生的workslop,也就是同事使用AI生成的內容需要自己額外花時間去修改或清理。平均每次清理耗時1小時56分鐘,每位員工每月因此損失約 186美元。
如果AI能像在場許多人一樣將某些人的工作效率提高10倍,那麼就需要系統的教育和培訓,讓大家明白什麼時候該用AI,什麼時候不該用。
Sam Altman:首先,很多人類自己也會產生類似workslop的東西,這不是AI獨有的現象。比如,有些郵件只會增加額外工作,或者會議本身也可能拖慢效率。所以不必期待AI會不同。經濟會自我調整,利用工具提高效率的人和公司,會比那些用工具拖慢組織的人,更能影響未來。當然,像使用任何新工具一樣,會有學習曲線,但我認為速度會很快。
Rowan Cheung:OpenAI有沒有做教育或培訓,幫助人們更好地建立、學習這些AI的使用?
Sam Altman:有的。人們總會用工具去做自己想做的事。我學到的一點是,你可以製作很棒的教育內容和培訓,但人們會去嘗試各種奇怪玩法,比如讓AI鸚鵡學舌什麼的。不過我們確實嘗試創造很多內容,幫助大家在工作流中使用AI。在Codex的一些場景中,採用速度非常快,整個公司的集成和高效使用只需幾天或幾周。
惡搞CEO和AGI
Q:Sora上全是惡搞你的視頻,你害怕嗎?
Sam Altman:其實沒想象中奇怪。看一個有點,但看上百個就還行。
當時團隊有人問我,可不可以讓我的cameo功能開放?這是新技術,我覺得如果我都不嘗試,那就是我的失誤,所以我就決定做了。後面坐飛機的時候,我想會不會看起來很怪,結果剛上線時確實有點,但很快就適應了——顯然這是一個充滿生成視頻的應用,這些內容很有趣。
Rowan Cheung:我唯一擔心的是去水印的問題。今早有幾家公司推出了Sora水印去除工具。如果別人可能去掉水印然後在社交媒體上發佈,會影響我的個人品牌嗎?這是個什麼樣的機制?
Sam Altman:首先,我們發佈這類技術的原因之一,是因為我們看到它終將普及。未來幾個月或幾年,會有優秀的開源模型,任何人都能用公開的視頻生成你的影像。社會最終會適應。我們發現,一種方式是提前發佈並設定護欄,讓社會和技術有時間共同進化。
這種方法有效。文本相對簡單,視頻會更難,因為視頻衝擊力更強,但我相信我們會學會適應。很快大家會意識到,網絡上會有大量無水印、開源模型生成的假視頻,這不可避免。提前讓社會適應這一點,可能有價值。
Rowan Cheung:Sora的目標是生成幾乎無法分辨的AI視頻?
Sam Altman:目標是 AGI。我認為高質量的視頻對實現AGI很重要,原因有很多,比如空間推理、我們可以從世界模型中學到的東西。希望有一天,機器人領域的真正進展也會非常重要。但我覺得優秀的視頻是件好事——我不希望未來的唯一交互界面只是文字。我非常期待未來能有實時視頻流的交互體驗,它會不斷生成全新的用戶體驗。這會很棒。但最重要的是,我認為這是通向真正AGI的一條非常有價值的路徑。
Rowan Cheung:週五,你發佈了一篇博客,說可能會探索對允許在Cameo中使用自己面孔的人進行收入分成。能分享一些細節嗎?這個怎麼運作?
Sam Altman:是的,很多時候,當你發佈一個新產品時,會發現人們使用的方式與你預期的不同。我們原本認為會有少量創作者製作非常酷、非常複雜的視頻並分享出去,然後有大量觀眾觀看。確實有這種情況。但實際上,大量用戶只是給三五好友製作視頻,在群聊裡分享,而不是在社媒裡。我不確定這種使用方式能否持續,但如果持續,它會大幅影響計算資源需求與用戶互動的比例。
未來可能會讓人們為生成視頻付費。比如你每天生成100個視頻發給朋友,或者你想生成包含某位名人的視頻(並且他們也同意),也許可以對生成付費分成。我們需要實驗看看如何操作。
不過,我不喜歡對一個六天前剛上線的產品下定論,這一切可能只是新鮮感,也可能不會形成長期使用場景。但至少到目前為止,它的使用量很大。
Rowan Cheung:你考慮過在Sora App中放廣告嗎?
Sam Altman:還沒有,但這方面有趣的可能性也很大。當然,也可能有可怕的做法。與ChatGPT不同,我們可以用訂閱模式獲得收入;但如果Sora用戶主要是在信息流中瀏覽內容,那麼廣告可能是更自然的模式。
如果主要是私信,那又是另一種模式。我樂觀地認為,也許到今年年底,或者更現實地說,到明年第一季度末,我們能理解產品的最終形態,並據此設計商業模式。我認為按生成次數收費是合理的,也值得嘗試。其他商業模式則取決於產品如何發展。
AI能消滅的工作就不是工作
Q:智能時代,十億知識工作崗位可能會首先被影響,然後才會創造新工作。你怎麼看?
(注:如果50年前告訴農民,互聯網會創造十億個新工作崗位,他們可能不會相信。同樣的,現在很多人認為AI會創造很多新工作崗位。)
Sam Altman:我覺得農民不僅不會相信會發生這樣的事情,他們可能會看你做的工作(互聯網媒體),覺得那不是真正的工作。
種地是在提供人們真正需要的東西,養活他們,這才是真正的工作。而我們這些人,生活條件優越,食物豐富,財富充足,我們做的很多事情像是在打發時間的遊戲,需要感到重要,但可能不算“真正工作”。
對我們而言,這些工作感覺很真實。我很感激能做一些既令人滿足又重要的事情。未來的工作可能會非常不同,可能比現在我們認為的工作形式更輕鬆。但我相信人類的內在驅動力仍然存在,我們會找到很多事情去做。
Rowan Cheung:希望我們還能探索太空。你覺得AGI出現後,人類會重點關注什麼?
Sam Altman:我希望一切都能向各個方向發展,去做所有事情。太空對我來說很酷,但你或其他人可能有自己覺得有趣的方向。我希望一切皆有可能。
Rowan Cheung:如果明天可以制定一條全球政策,你會定什麼?
Sam Altman:很難只選一條。但我一直在思考AI監管的問題——是否合理,是否會讓大公司佔優勢。我認為,當模型非常強大時,應該有全球性的框架來降低災難性風險,尤其是針對最前沿的安全問題。如果有一條全球政策能做到這一點,那將非常好。
ChatGPT會成為美國版微信嗎?
Q:在中國,微信幾乎是一個“萬能App”,購物、社交、聊天都能做。現在ChatGPT也有購物、網頁搜索、Sora等功能,你們是不是想打造一個美國版微信?
Sam Altman:不,有很多原因讓我認為這種方式在美國市場行不通。我們想做的是一個真正優秀的 AI 超級助手。
Rowan Cheung:為什麼要把功能單獨推出?比如Sora是獨立App,為什麼不直接放進ChatGPT?
Sam Altman:ChatGPT 對很多人來說是最個人化的賬號,把社交體驗放進去會顯得奇怪。可以想象做消息功能,因為人們會分享和協作。但人們對 ChatGPT 的認知和娛樂App的認知差別很大,可能會產生不協調。當然,很多功能我們還是放進了 ChatGPT。
Rowan Cheung:你覺得最重要、最有用的代理(agents)是什麼?最讓你興奮的是什麼?
Sam Altman:可以看看 Codex 的發展,並思考在其他行業的應用。比如法律、財務建模等,是否可以有類似 Codex 的體驗。已經有優秀的初創公司在做這些事情。隨著技術成熟,如果這些工具在各自行業中能達到 Codex 在編碼領域的水平,那將是我最興奮的方向。我能想象一個世界:你只用與一堆代理對話,就能啟動一家初創公司。我認為Agent Builder或agent kits還不夠好,但可以看到從這裡到那裡的路徑。
奧特曼:語音不是交互的最終形式
Q:之前你在主題演講裡提到過語音可能是AI或agent的最終形式,能詳細說說嗎?
Sam Altman:我不認為語音是交互的最終形式。有很多時候,語音並不是合適的交互方式。
比如你在公共交通站,邊走邊講話,這會很煩人。但很多時候,語音是非常自然的交互方式。語言本身就是這樣,但有時候是語音,有時候是打字,這裡其實還沒有蓋棺定論。
我們都習慣了智能音箱這一類產品,雖然經常被拿來開玩笑,但很多人真的在使用並喜歡它們。而智能音箱其實還不夠好,不是因為概念錯,而是當時AI不夠強大,周邊基礎設施也不夠完善。想象一下,如果你只需對設備說話,它就能準確完成你想要的操作,然後幾乎不打擾你——那種體驗,就像是我理想中想要使用的計算機。
Rowan Cheung:你們會做語音交互嗎?
Sam Altman:這需要一段時間。我們需要耐心去打造一種全新的設備,在大規模上實現超高質量。這是完全不同的電腦使用方式,我們需要創造性的空間去探索。
我們確實有一些很讓人興奮的想法,但目前還不能透露,也不會在短期內透露。不過我們會努力做出一種非常值得等待的產品。
參考鏈接:
[1]https://www.youtube.com/watch?v=zwnVUiwObl8
[2]https://futurism.com/artificial-intelligence/sam-altman-real-work-ai[3]https://x.com/rowancheung
本文來自微信公眾號“量子位”,作者:henry,36氪經授權發佈。