斯坦福 2025 年 AI 指數報告：10 張圖表看懂人工智能發展現狀

深潮TechFlow

04-08

AI 優化技術持續進步，但與此同時，該技術的應用與濫用也呈現出氾濫態勢。

撰文：元宇宙之心

最新發布的《2025 人工智能指數報告》顯示，人工智能領域正日趨成熟：AI 優化技術持續進步，但與此同時，該技術的應用與濫用也呈現出氾濫態勢。

報告於 2025 年 4 月 7 日發佈，由斯坦福大學以人為本人工智能研究院（HAI）發起，由來自學術界和產業界的跨學科專家組成的 AI 指數指導委員會主導編制。

該報告持續追蹤人工智能領域多項關鍵進展，主要包括：年度重大技術突破、基準測試新紀錄、生成式 AI 投資動向、教育領域應用趨勢、技術監管立法進程等核心維度。

以下是來自該報告的 10 個核心要點：

01.小模型迎來性能突破

2022 年時，能在 MMLU 多任務語言理解基準測試中達到 60% 準確率的最小模型是擁有 5400 億參數的 PaLM。

而到 2024 年，微軟僅 38 億參數的 Phi-3-mini 模型就實現了同等表現，兩年間模型體積縮小了 142 倍。

02.模型使用成本驟降

對於 MMLU 測試中達到 GPT-3.5 水平（64.8% 準確率）的模型，單次百萬 token 查詢成本從 2022 年 11 月的 20 美元，暴跌至 2024 年 10 月的 0.07 美元（Gemini-1.5-Flash-8B 模型），18 個月內降幅超 280 倍。不同任務的 LLM 推理價格年降幅達 9-900 倍不等。

03.中國模型迎頭趕上

美國雖仍保持頂尖 AI 模型數量優勢（2024 年 40 個重要模型 vs 中國 15 個 / 歐洲 3 個），但中國模型在質量上快速逼近。

在 MMLU、HumanEval 等核心基準測試中，中美模型性能差距已從 2023 年的兩位數百分比縮小至 2024 年的毫釐之間。中國在 AI 論文發表量和專利數量上持續領跑全球。

04.AI 濫用事件激增

根據 AI 事件數據庫（AI Incidents Database）統計，2024 年 AI 相關危害事件達 233 起，創歷史新高，較 2023 年暴增 56.4%。典型案例包括深度偽造私密影像、涉嫌導致青少年自殺的聊天機器人等。雖非全貌，但問題激增態勢令人震驚。

05.Agent 實用性突破

AI Agent 展現初步潛力。2024 年推出的 RE-Bench 為評估 Agent 複雜任務設立了嚴格基準：在短時任務（2 小時）中，頂級 AI 系統表現超人類專家 4 倍；但在長時任務（32 小時）中，人類反超 AI 達 2 倍優勢。

值得注意的是，AI 已在特定領域（如編寫特定代碼）達到專家水平，且效率更高。

06.AI 投資額飆升

2024 年美國私營領域 AI 投資高達 1090 億美元，幾乎是中國（93 億美元）的 12 倍、英國（45 億美元）的 24 倍。

在生成式 AI 領域差距更為顯著：美國投資額超出歐盟與英國總和 255 億美元，較 2023 年的 211 億美元差距進一步擴大。

07.企業加速擁抱 AI 技術

企業正在轉向 AI。2024 年，報告使用 AI 的受訪者比例從 2023 年的 55% 躍升至 78%。更值得注意的是，將生成式 AI 應用於至少一項業務職能的企業比例實現翻倍增長，從 33% 激增至 71%。

08.醫療 AI 產品迎來審批爆發

FDA 批准的 AI 醫療設備數量呈現指數級增長。自 1995 年首個 AI 醫療設備獲批後，2015 年僅累計批准 6 個，而到 2023 年這一數字已飆升至 223 個，展現出醫療 AI 應用的加速普及態勢。

09.美國 AI 監管：州政府主導推進

在聯邦立法進展緩慢的背景下，美國各州正成為 AI 監管的主力軍。2016 年全美僅通過 1 項州級 AI 相關法案，到 2023 年增至 49 項。

而過去一年間，這一數字更是翻倍增長至 131 項。儘管聯邦層面提出的 AI 法案數量也有所增加，但實際通過率仍然偏低。

10.亞洲對 AI 持更多樂觀態度

全球對 AI 的接受度呈現明顯地域差異：在中國（83%）、印尼（80%）和泰國（77%），絕大多數民眾認為 AI 產品利大於弊；而在加拿大（40%）、美國（39%）和荷蘭（36%），持此樂觀態度的民眾比例不足半數。

來源

免責聲明：以上內容僅為作者觀點，不代表Followin的任何立場，不構成與Followin相關的任何投資建議。

喜歡

評論