斯坦福 2025 年 AI 指數報告:10 張圖表看懂人工智能發展現狀

AI 優化技術持續進步,但與此同時,該技術的應用與濫用也呈現出氾濫態勢。

撰文:元宇宙之心

最新發布的《2025 人工智能指數報告》顯示,人工智能領域正日趨成熟:AI 優化技術持續進步,但與此同時,該技術的應用與濫用也呈現出氾濫態勢。

報告於 2025 年 4 月 7 日發佈,由斯坦福大學以人為本人工智能研究院(HAI)發起,由來自學術界和產業界的跨學科專家組成的 AI 指數指導委員會主導編制。

該報告持續追蹤人工智能領域多項關鍵進展,主要包括:年度重大技術突破、基準測試新紀錄、生成式 AI 投資動向、教育領域應用趨勢、技術監管立法進程等核心維度。

以下是來自該報告的 10 個核心要點:

01.小模型迎來性能突破

2022 年時,能在 MMLU 多任務語言理解基準測試中達到 60% 準確率的最小模型是擁有 5400 億參數的 PaLM。

而到 2024 年,微軟僅 38 億參數的 Phi-3-mini 模型就實現了同等表現,兩年間模型體積縮小了 142 倍。

02.模型使用成本驟降

對於 MMLU 測試中達到 GPT-3.5 水平(64.8% 準確率)的模型,單次百萬 token 查詢成本從 2022 年 11 月的 20 美元,暴跌至 2024 年 10 月的 0.07 美元(Gemini-1.5-Flash-8B 模型),18 個月內降幅超 280 倍。不同任務的 LLM 推理價格年降幅達 9-900 倍不等。

03.中國模型迎頭趕上

美國雖仍保持頂尖 AI 模型數量優勢(2024 年 40 個重要模型 vs 中國 15 個 / 歐洲 3 個),但中國模型在質量上快速逼近。

在 MMLU、HumanEval 等核心基準測試中,中美模型性能差距已從 2023 年的兩位數百分比縮小至 2024 年的毫釐之間。中國在 AI 論文發表量和專利數量上持續領跑全球。

04.AI 濫用事件激增

根據 AI 事件數據庫(AI Incidents Database)統計,2024 年 AI 相關危害事件達 233 起,創歷史新高,較 2023 年暴增 56.4%。典型案例包括深度偽造私密影像、涉嫌導致青少年自殺的聊天機器人等。雖非全貌,但問題激增態勢令人震驚。

05.Agent 實用性突破

AI Agent 展現初步潛力。2024 年推出的 RE-Bench 為評估 Agent 複雜任務設立了嚴格基準:在短時任務(2 小時)中,頂級 AI 系統表現超人類專家 4 倍;但在長時任務(32 小時)中,人類反超 AI 達 2 倍優勢。

值得注意的是,AI 已在特定領域(如編寫特定代碼)達到專家水平,且效率更高。

06.AI 投資額飆升

2024 年美國私營領域 AI 投資高達 1090 億美元,幾乎是中國(93 億美元)的 12 倍、英國(45 億美元)的 24 倍。

在生成式 AI 領域差距更為顯著:美國投資額超出歐盟與英國總和 255 億美元,較 2023 年的 211 億美元差距進一步擴大。

07.企業加速擁抱 AI 技術

企業正在轉向 AI。2024 年,報告使用 AI 的受訪者比例從 2023 年的 55% 躍升至 78%。更值得注意的是,將生成式 AI 應用於至少一項業務職能的企業比例實現翻倍增長,從 33% 激增至 71%。

08.醫療 AI 產品迎來審批爆發

FDA 批准的 AI 醫療設備數量呈現指數級增長。自 1995 年首個 AI 醫療設備獲批後,2015 年僅累計批准 6 個,而到 2023 年這一數字已飆升至 223 個,展現出醫療 AI 應用的加速普及態勢。

09.美國 AI 監管:州政府主導推進

在聯邦立法進展緩慢的背景下,美國各州正成為 AI 監管的主力軍。2016 年全美僅通過 1 項州級 AI 相關法案,到 2023 年增至 49 項。

而過去一年間,這一數字更是翻倍增長至 131 項。儘管聯邦層面提出的 AI 法案數量也有所增加,但實際通過率仍然偏低。

10.亞洲對 AI 持更多樂觀態度

全球對 AI 的接受度呈現明顯地域差異:在中國(83%)、印尼(80%)和泰國(77%),絕大多數民眾認為 AI 產品利大於弊;而在加拿大(40%)、美國(39%)和荷蘭(36%),持此樂觀態度的民眾比例不足半數。

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論