文|陳斯達
編輯|鄧詠儀
一週縱覽
本週大事件不斷。最大熱點當屬英偉達GTC大會。英偉達正式發佈新一代AI芯片”Blackwell B200”,創始人黃仁勳稱其為史上最成功的產品。
其他玩家也沒有閒著。馬斯克旗下AI初創公司xAI就開源了大模型Grok-1,其參數量高達3410億。另一邊,OpenAI終於有了新消息,據傳將在年中推出 GPT-5。更為重磅的消息來自硬件玩家——蘋果公司正積極與谷歌和OpenAI展開洽談,希望將大模型引入iPhone。
硅谷的AI獨角獸們就頗為動盪。Inflection AI創始人、谷歌 DeepMind 聯合創始人即將加入微軟的AI陣營。Stability AI依舊在風雨飄搖之中,繼此前核心技術團隊集體離職後,本週CEO也宣佈跑路了。
國內本週舞臺屬於“長文本”(Long Context)。月之暗面正式宣佈旗下Kimi智能助手已支持200萬字超長無損上下文,在市場引起廣泛關注;隨後,阿里通義千問更新,免費開放1000萬字長文檔處理功能,百度、360智腦也相繼宣佈即將上線200萬-500萬字的長文本處理能力。在週末,通用大模型創業公司階躍星辰正式對外亮相,發佈Step-2萬億參數MoE語言大模型預覽版。
Key Points
- OpenAI有望年中推出GPT-5
- 蘋果與谷歌、OpenAI談合作,大模型或進iPhone
- 馬斯克Grok-1開源,參數量3410億
- 復現Sora,Colossal-AI發佈開源項目“Open-Sora”
- Stability.ai 發佈 Stable Video 3D
- Kimi智能助手支持200萬字上下文,出圈爆火
- 大模型廠商「階躍星辰」首亮相,已訓萬億參數大模型
- 英偉達發佈最強AI芯片
- 微軟“僱傭式”收購Inflection AI,創始人加入微軟
- Stability AI核心團隊閃崩,CEO辭職
- 蘋果遭美國司法部反壟斷訴訟
- 聯合國通過首個全球AI決議
- 英偉達考慮收購以色列AI創企Run:ai
- 沙特計劃設立400億美元基金投資AI
- 「小英偉達」Astera Labs上市,募集6億美金
- Suno正式發佈V3音樂生成模型
- Adobe新研究:0.11秒從草圖生成圖像
大模型第一線
OpenAI有望年中推出GPT-5
據 The Business Insider 援引匿名知情人士消息,OpenAI 公司正計劃籌備在今年年中推出 GPT-5,預計時間是夏季。此外,知情人士透露,一些企業客戶已經提前體驗了最新模型的演示以及與之相配套的 ChatGPT 增強功能。一位體驗過 GPT-5 版本的 CEO 對其表現給出了高度評價:“它的表現非常出色,帶來了明顯的改進。”
蘋果與谷歌、OpenAI談合作,大模型或進iPhone
據彭博社最新報道,蘋果公司正積極與谷歌和OpenAI展開深度談判,旨在將這兩家公司的生成式大型語言模型整合進iPhone的全新人工智能功能中,為未來的iOS 18系統奠定強大的底層框架。正式官宣預計要等到今年夏季之後。同時,3月23日消息,據《華爾街日報》報道,蘋果與百度就在其中國設備中使用百度生成式AI技術進行了初步談判。目前還無法確定蘋果是否與其他中國生成式AI公司合作。
馬斯克Grok-1開源,參數量3410億
3月18日,馬斯克旗下AI初創公司xAI宣佈,其研發的大模型Grok-1正式對外開源開放,用戶可直接通過磁鏈下載基本模型權重和網絡架構信息。Grok-1是一個由xAI 2023年10月使用基於JAX和Rust的自定義訓練堆棧、從頭開始訓練的3140億參數的混合專家(MOE)模型,遠超OpenAI的GPT模型。不過,此次開源的版本,是Grok-1預訓練階段的原始基礎模型,沒有針對任何特定應用(例如對話)進行微調。
復現Sora,Colossal-AI發佈開源項目Open-Sora
繼推出成本直降 46% 的 Sora 訓練推理復現流程後,Colossal-AI團隊全面開源全球首個類 Sora 架構視頻生成模型 “Open-Sora 1.0”,涵蓋了整個訓練流程,包括數據處理、所有訓練細節和模型權重,攜手全球 AI 熱愛者共同推進視頻創作的新紀元。
Open-Sora 1.0 生成的都市繁華掠影
Stability.ai 發佈 Stable Video 3D
Stability.ai發佈Stable Video 3D,利用其多視圖一致性來優化 3D 神經輻射場(NeRF)和網格表示,以提高直接從新穎視圖生成的 3D 網格的質量,能夠從任何給定角度提供連貫的視圖,並具有熟練的概括能力。Stable Video 3D質量和多視圖顯著提高,性能優於之前發佈的Zero 123XL等其他開源替代品。
Stable Video 3D生成效果
「Kimi智能助手」支持200萬字上下文,出圈爆火
3月18日,大模型廠商“月之暗面”正式宣佈,旗下Kimi智能助手已支持200萬字超長無損上下文,並於即日起開啟產品內測。21日下午,月之暗面旗下大模型應用Kimi的APP和小程序均無法正常使用。月之暗面表示,觀測到Kimi的系統流量持續異常增高,遠超對資源的預期規劃。受到Kimi熱度的催化,華策影視、掌閱科技、中廣天擇、福昕軟件相關概念股股價持續攀升。
大模型廠商「階躍星辰」首亮相,已訓萬億參數大模型
3月23日,2024全球開發者先鋒大會上,通用大模型創業公司階躍星辰正式對外亮相。階躍星辰研發的Step-1V 千億參數多模態大模型,在中國權威的大型模型評估平臺“司南”(OpenCompass)多模態模型評測榜單中位列第一。階躍星辰創始人、CEO姜大昕博士在大會上正式對外發布了Step-2萬億參數大語言模型預覽版,模型採用 MoE架構,聚焦深度智能的探索,並提供API接口給部分合作夥伴試用。
大事件
英偉達發佈新一代AI芯片
3月18日-21日期間,英偉達在美國聖何塞召開GTC大會,發佈下一代芯片架構Blackwell,這一GPU平臺也是黃仁勳口中,英偉達史上最成功的產品。據介紹,Blackwell GPU以數學家David Harold Blackwell的名字命名,同樣沿用了英偉達此前推出的Hopper架構。Blackwell GPU中包含2080億個晶體管,可支持多達10萬億個參數的AI模型。
微軟“僱傭式”收購Inflection AI,創始人加入微軟
3月19日,微軟正式宣佈,人工智能初創公司Inflection AI 的 Mustafa Suleyman 和 Karén Simonyan 及其他大部分員工將加入Microsoft AI,專注於面向消費者的 AI 產品和研究。3月22日,據知情人士透露,微軟已同意向Inflection AI支付約6.5億美元,主要以許可協議的形式,使Inflection AI的模型可以在Azure 雲服務上銷售。這意味著,以僱用核心團隊成員加上“模型授權費”之名,微軟只實質上完成了對Inflection這家估值一度在AI排行榜上名列第三(僅次於OpenAI和Anthropic)的公司的收購。
Stability AI核心團隊閃崩,CEO辭職
當地時間3月23日,獨角獸AI公司Stability AI稱,宣佈公司 CEO Emad Mostaque 辭職。Emad Mostaque 在社媒平臺 X 上宣佈,自己離職後將致力於去中心化人工智能(Decentralized AI)。本週早些時候,核心研發團隊已集體辭職。Stability AI因開發了文生圖大模型Stable Diffusion而知名,創立於2020年底,2022年估值一度高達10億美元。
蘋果遭美國司法部反壟斷訴訟,市值蒸發1100億美元
路透社消息,當地時間3月21日,美國司法部長梅里克·加蘭在當天的新聞發佈會上表示,美國司法部和十幾個州的總檢察長對蘋果公司提起反壟斷訴訟,指控蘋果公司利用其對蘋果產品硬件和軟件的控制壟斷手機市場,損害了消費者、開發商和競爭對手公司的利益。受此消息影響,蘋果當天股價大跌4.09%,市值蒸發超過1100億美元(約8000億元人民幣),總市值回落至2.65萬億美元。
聯合國通過首個全球AI決議
當地時間3月21日,聯合國大會投票通過了第一個有關人工智能(AI)的決議草案,以確保這項新技術能夠惠及所有國家、尊重人權並且是“安全、可靠和值得信賴的”技術。據悉,美國為這項決議草案的發起國,中國參與了共同提案。
融資動態
英偉達考慮收購以色列AI創企Run:ai
以色列經濟學家報消息,3月17日,英偉達被曝正洽談收購以色列人工智能基礎設施平臺Run:ai,交易價值可能達到10億美元。Run:ai 由首席執行官 Omri Geller 和首席技術官 Ronen Dar 博士於 2018 年成立。2022 年 3 月,Run:ai 在 C 輪中籌集 7500 萬美元,由老虎環球基金(Tiger Global Management)和 洞見創投(Insight Partners) 領投。
沙特計劃設立400億美元基金投資AI
據紐約時報,三位瞭解計劃的人士透露,沙特阿拉伯政府計劃創建一支約400億美元的基金,用於投資人工智能(AI)技術。若順利成立,這支基金將使沙特成為全球最大的AI投資者。知情人士表示,最近幾周,沙特公共投資基金(PIF)的代表已經與硅谷最成功的風投公司Andreessen Horowitz(a16z)等金融機構討論了潛在合作伙伴關係,議題包括基金如何運作及a16z可發揮的作用。
「小英偉達」Astera Labs上市,募集6億美金
3月20日,芯片製造商Astera Labs在美國納斯達克上市,募資6億美元。借AI的東風,投行將Astera Labs包裝成“小英偉達”的概念,這使Astera Labs深受市場追捧。Astera Labs核心產品之一是數據和內存連接半導體,可有效提升軟硬件之間的連接效率和速度,客戶包括行業巨頭如亞馬遜和微軟。其上市首日收盤價為62.03美元,較發行價上漲72.31%,以收盤價計算,公司市值約94.59億美元。
新玩意
Suno正式發佈V3音樂生成模型
AI音樂生成創企Suno正式發佈文生音樂模型v3,該模型可在幾秒鐘內創建完整的兩分鐘歌曲。該工具可以通過其免費的獨立網站訪問,也可以通過啟用Suno的第三方插件Microsoft Copilot訪問。用戶只需要簡單的文字描述,就能創作出具備專業水準的音樂。
Suno界面
體驗地址:https://app.suno.ai
前沿研究
Adobe新研究:0.11秒從草圖生成圖像
3月19日,來自CMU、Adobe的團隊在arXiv上發表論文,提出一種圖像推理方法。據介紹,該方法解決了現有條件擴散模型的兩個限制:由於迭代去噪過程導致的推斷速度較慢、對配對數據進行模型微調的依賴。為了解決這些問題,作者引入了一種通用方法,通過對抗學習目標將單步擴散模型適應於新的任務和領域,既能利用預訓練擴散模型的內部知識,同時還能實現高效的推理。對於512*512的圖像,在A6000上生成時間為0.29秒,在A100上為0.11秒。
論文截圖
論文地址:
https://arxiv.org/pdf/2403.12036.pdf
試玩地址:
https://huggingface.co/spaces/gparmar/img2img-turbo-sketch
👇🏻 掃碼加入「智湧AI交流群」👇🏻
歡迎關注




