ChatGPT再進化:o1支持調用Python分析數據,網友:已經成為Copilot了

avatar
36氪
2 天前

今天一大早,ChatGPT突然更新——

基於Python的數據分析功能,在o1和o3-mini當中也可以使用了。

OpenAI介紹,現在可以通過兩款模型調用Python,完成數據分析、可視化、基於場景的模擬等任務。

量子位實測發現,雖然界面並無明顯變化,但是Python的確已經在o1當中悄悄“上崗”了。

有網友評論說,這相當於是ADA(高級數據分析)功能迎來了第三個版本:

還有人評價說,o1已經從一個助理,進化成全能的數據分析Copilot了。

那麼,擁有了Python這一強大武器之後的o1,在數據分析上表現究竟如何呢?我們進行了一波實測。

o1挑戰Python數據分析

第一輪測試,我們整理了某架飛機近一年時間裡執飛過的400多條航班記錄,交給模型對其中的數據進行分析。

表面上,需要回答的問題有4個:

這架飛機都執飛過哪些航線,每條各執飛過多少次;

在每條航線中,執飛次數最多的航班號分別是多少;

這架飛機的實際起飛時段集中在一天中的哪段時間(以整小時統計),注意表中為UTC時間,請換算成北京時間;

僅考慮落地時間,這架飛機一共出現過多少次延誤,平均和最長延誤時間分別是多少。

但實際上,模型還需要考慮更多的事情。

第一個問題,還可以通過簡單直接統計實現,第二個問題就需要根據第一個問題的結果對數據進行歸類後再進行計算。

第三個問題要做的工作就更多了,需要從原始的時間數據中提取出所在的小時段,還需要進行時差換算

最後一個問題也最複雜,需要從混雜有其他文本的結構化信息中先找出時間,然後還涉及到比較和時間差計算,計算完後還要再進行篩選和進一步統計。

最終,這四個問題,o1在調用了Python之後全都分析對了。

當然,4o也答對了這些問題,不過輸出的格式不太美觀。

Claude(3.7 Sonnet)這邊則是鬧出了一些烏龍,一開始表示自己無法打開上傳的文件(可能是文件名包含中文的緣故),反覆自動重試多次後,竟然自己編了一套答案出來。

屬於是沒活硬整了。

右側答案為Claude編造的錯誤信息

不過當我們去掉文件名稱中的中文之後,Claude成功讀取了文件,並給出了正確的結論。

測試完在問答式的任務上的表現,再來看看可視化能力

這裡我們找來了最近某班次航班的飛行記錄,包含了起飛到降落過程中各時間點的位置、高度、速度、航向等信息,一共有1700餘個數據點。

給出的任務則是繪製出高度和速度隨時間變化的折線圖,並且涉及到了時區和計量單位的換算(原始數據中時間為UTC時間、高度為英尺、速度為節,需要換算成北京時間、高度單位為米、速度單位為公里每小時)。

在分別調用Python後,o1(左)和4o(右)繪製出的圖像是這樣的。

這裡4o的標記更加易於分辨,而o1對兩條線都採用了混色繪製,有些分不清具體所指:

當然對於圖線的形狀來說,經過對比原始數據來源中給出的圖線,結果是一致的。

Claude這邊的操作更加高級,直接做成了一個可交互的網頁,鼠標劃過後會顯示時間點對應的原始信息。

但關鍵的問題是,Claude在時區的轉換上出了錯,並且也沒按要求把時間間隔較長的數據點用虛線連接。

One More Thing

除了o1和o3-mini的功能更新外,OpenAI還宣佈了另一個消息——

之前Mac客戶端會員專屬的Work with Apps功能,現在開放給所有用戶了。

該功能可以從文本編輯和IDE工具等程序中讀取代碼等數據,無需反覆複製粘貼就能更方便地完成編程等任務。

參考鏈接:

[1]https://x.com/OpenAI/status/1900308446211432484

[2]https://x.com/OpenAI/status/1900325903147958570

本文來自微信公眾號“量子位”(ID:QbitAI),作者:克雷西,36氪經授權發佈。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
Followin logo