12月20日,OpenAI為期12天的發佈會已步入第11天,即倒數第二天,該公司發佈了MacOS桌面應用程序及其與各類應用程序的互操作性功能。這將為“代理式人工智能”(Agentic AI,或稱智能體)的未來奠定基礎,使ChatGPT變得更加強大,並無縫集成到用戶的日常工作流程中。
在第11天的發佈會上,OpenAI首席產品官凱文·韋爾(Kevin Weil)攜手兩位身著聖誕主題西裝的同事,共同探討了公司最新推出的MacOS桌面應用程序。他們著重強調了ChatGPT從單純的會話助手向更為強大的代理工具的轉變,這意味著ChatGPT現在能夠代表用戶執行更多任務,為用戶帶來前所未有的便捷體驗。
1 首推三大功能
目前,用戶已能通過MacOS桌面應用程序來查看和自動化他們的ChatGPT工作。儘管2025年還將有更多類似版本問世,但在此之前,OpenAI已率先推出了以下三大功能:
第一,藉助“Work with Apps”功能,用戶現在能夠將ChatGPT接入更多編碼應用程序,涵蓋BBEdit、MatLab、Nova、Script Editor、TextMate、Android Studio、AppCode、CLion、DataGrip、GoLand、IntelliJ IDEA、PHPStorm、PyCharm、RubyMine、RustRover、WebStorm、Prompt以及Warp等。
在MacOS桌面應用的演示中,OpenAI展示了人工智能如何深入一個應用程序,獲取並理解其上下文信息。一旦用戶通過“Work with Apps”功能選定某個應用,ChatGPT便能立即接入,洞察應用內部,提供即時幫助。
當然,ChatGPT不僅僅是一個簡單的查看工具,它依託強大的人工智能模型,能夠執行多種功能。在Warp的演示中,ChatGPT不僅能捕捉用戶屏幕上的內容,還能深入應用內部,瀏覽更多信息。例如,在處理長串代碼時,ChatGPT能夠實現無滾動瀏覽,極大地提升了工作效率。
與Windows Recall功能相比,ChatGPT更注重與應用程序的實時協同工作,而非僅僅記錄和構建回憶庫。在另一場演示中,OpenAI團隊將ChatGPT與XCode緊密結合,使得它可以在蘋果的開發應用程序中工作。用戶只需簡單提出請求,ChatGPT便能生成代碼或解決編程難題。
值得注意的是,OpenAI還展示了ChatGPT的一項新技能:它能夠將生成的代碼直接嵌入XCode中,這一功能有望極大地簡化工作流程。儘管在實時演示中,ChatGPT的代碼嘗試遭遇了兩次失敗,但在第三次嘗試時,OpenAI團隊成功讓代碼運行起來。
第二,對於利用ChatGPT進行寫作的用戶,OpenAI宣佈MacOS桌面應用程序現已實現對Apple Notes、Quip和Notion的支持。在現場演示中,OpenAI團隊正瀏覽一份文檔,該文檔旨在為Notion中的徒步旅行活動制定指南。
有了這個新功能,ChatGPT得以與Notion無縫協作。現場演示聚焦於文檔中的特定文本段落,並設定任務為“補充這些對話要點”。此外,用戶還可利用ChatGPT的搜索功能來生成回應。例如,在演示中,它根據所選文本生成了關於“諾頓皇帝(諾頓一世)”的對話要點,並附上引用及來源。
第三,除了文本選擇、複製粘貼的傳統操作外,MacOS桌面應用支持高級語音模式,同時能與其他應用程序協同工作。在此模式下,用戶可在Apple Notes中設定“節日派對歌單”,並通過ChatGPT徵詢聖誕老人對候選歌曲的意見。ChatGPT甚至能指出用戶的錯誤,如將聖誕歌曲《Frosty the Snowman》誤寫為《Freezy the Snowman》。
這些功能現已正式發佈,用戶只需確保擁有最新版本的MacOS應用程序,並訂閱了ChatGPT Plus、ChatGPT Pro、ChatGPT Team、ChatGPT Enterprise或ChatGPT Edu中的任一服務,即可立即體驗。
在隱私保護方面,OpenAI特別強調,ChatGPT僅會在用戶手動觸發的情況下與應用程序進行交互。一旦該功能被激活,用戶將明確知曉哪些內容將被附加到消息中,從而有效緩解隱私方面的擔憂。
2 又曝AGI彩蛋
自美國當地時間12月5日起,OpenAI開啟了一個密集的新功能發佈週期,計劃在接下來的12天內通過12場直播活動陸續推出新產品和功能。在此之前,OpenAI已經陸續發佈了多項創新,包括ChatGPT Pro計劃、強化微調技術、Sora、交互界面Canvas,高級語音視覺功能、Projects功能、ChatGPT搜索、滿血版o1模型、通過API向第三方開發者開放大模型o1系列以及通過電話和WhatsApp與ChatGPT互動等。
隨著發佈會接近尾聲,人們對於AGI(通用人工智能)的關注也愈發高漲。OpenAI在第11天發佈會最後表示:“在第12天,我們準備了極其特別的內容,千萬不要錯過哦!”
在演示屏幕的一角,可以看到名為“AGI_Interface.swift”的文件夾。這已經不是過去12天裡首次出現此類驚喜了。幾天前,OpenAI還揭曉了一個名為“超級秘密AGI”的日曆活動彩蛋,這無疑進一步提升了人們對這12天系列公告的期待,大家紛紛猜測這些公告是否在共同描繪一幅通往通用智能的宏偉藍圖。
OpenAI還透露,ChatGPT的Windows應用程序也將很快發佈。但更令人震驚的消息是,他們確認了一個新智能體的存在,並預計將於2025年發佈。OpenAI表示:“隨著我們的模型變得越來越強大,ChatGPT將展現出越來越強的自主性。”
幾周前,有傳聞稱OpenAI正在研發一款名為“Operator”的代理式人工智能,而該公司在第11天的發佈活動上僅對這一計劃進行了確認。或許,這一舉動背後有著來自競爭對手的壓力影響。
近期,谷歌宣佈了Project Mariner項目,該智能體能夠代表用戶在網頁瀏覽器選項卡上進行導航並執行操作。同樣,微軟也推出了Copilot Vision功能,它能在用戶的網絡瀏覽器中查看內容並提供相關信息。當然,Anthropic更早之前發佈了Computer Use功能,它在時間上領先於其他同類工具。
現在,OpenAI的12天系列活動僅剩最後一天,而他們似乎將最精彩的部分留到了最後——一個全新且強大的前沿模型即將亮相。我們將拭目以待,看看OpenAI究竟帶來了什麼新產品,以及這個新模型與之前的o1模型有何不同。
值得一提的是,一些基準測試已經表明,o1模型是迄今為止最強大的人工智能模型之一,甚至在編碼任務方面超越了Claude 3.5。近日,X平臺的一位用戶據稱發現了GPT-4.5模型,儘管該模型目前僅提供有限的預覽功能。
現在,所有的目光都聚焦在OpenAI身上,大家都翹首以待,看他們在發佈會活動的最後一天將會帶來怎樣的驚喜。
本文來自微信公眾號“騰訊科技”,作者:騰訊科技,編譯:金鹿,36氪經授權發佈。