本文為機器翻譯
展示原文
此圖展示了大規模語言模型 (LLM) 的快速發展及其功能的迅速擴展。
總而言之,人工智慧 (AI) 雖然之前只能完成人類幾分鐘就能完成的簡單任務,但現在正迅速發展到能夠執行複雜、專業化的任務,而這些任務需要人類集中精力四到五個小時才能完成。
- 圖表座標軸
X 軸:LLM 發布年份 (2020–2026)
代表 AI 模型隨時間推移的出現。
Y 軸:人類完成任務所需的時間
人類專家完成特定任務所需的時間被用來作為衡量任務難度的指標。數值越高,任務越複雜、越專業化。
- 早期階段 (2020–2023)
在 GPT-3 時代,AI 僅在人類只需幾秒鐘或幾分鐘就能完成的非常簡單的任務上取得了較高的成功率,例如句子補全或簡單的資訊檢索。 - 目前及近期展望(2024-2026 年)
圖表突然向上飆升,顯示技術進步呈指數級而非線性成長。
隨著 o4-mini、gpt-5 和 Claude Opus 4.5 等模型的出現,任務解決難度顯著增加。
- 具體任務範例的進展
圖表左側列出的任務展示了人工智慧的智慧發展程度。
修復小型 Python 庫中的錯誤(約 1.5 小時):人工智慧不再局限於簡單的編碼,而是開始發展調試技能,能夠找到並修復庫中的錯誤。
利用緩衝區溢位漏洞(約 2 小時):這項任務需要進階駭客技術和安全知識來識別和利用安全漏洞。
訓練對抗穩健的圖像模型(約 4 小時):這是一項人工智慧工程任務,它超越了簡單的圖像創建,需要訓練能夠抵禦對抗性攻擊的穩健人工智慧模型。結論與啟示
這張圖表的核心訊息是:人工智慧已不再只是輔助工具,而是進入了專家級的領域。
如果人工智慧能夠在幾秒鐘或幾分鐘內完成人類需要半天才能完成的任務,它將徹底改變各行各業的生產力。
這顯示人工智慧在執行以往只有高技能知識工作者才能完成的任務方面,例如編碼、安全分析和建模,擁有越來越大的潛力。
圖表顯示,y軸每四個月翻一番,這意味著人工智慧能夠完成一整天(24小時)甚至更長的工作的那一天指日可待。

Chubby
@kimmonismus
In all seriousness: 2026 will be the year where everything changes all of a sudden.

我們完蛋了
這是“人工智慧領域最重要的圖表”
每隔四個月,人工智慧能夠完成的編碼任務長度(與人類相比)就會翻倍
你知道這有多快嗎? x.com/aidigest_/stat…

來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
分享





