過去一年,我為 AI 花不少錢了,這時代的弄潮兒可不好當。
為了學做插圖,我一個月交給 Midjourney 10 美金;後來,ChatGPT Plus 我也訂閱了,一個月 20 美金,隨便聊,高峰期不用等;再之後是 Perplexity,更貴。
嗯,老闆的期望嘛……丨Giphy
老闆誇我,“用 AI 武裝得不錯,但是,工作效率能不能再提一提?你就不能一邊寫稿子,一邊做數據圖,再一邊寫週報郵件嗎?”
不愧是老闆,這話問得我有點迷糊。
不過好在,剛剛,Google 推出計劃,用戶可以每月花 19.99 美金訂閱 Google One AI Premium,使用支持 Gemini 的 Gmail、Docs,Sheets,Slides 和 Meet——也就是說,你可以在谷歌辦公全家桶中暢享 Gemini 的 AI 功能了。
專為打工人準備的20美金套餐……丨Google
自費上班的花銷又多了一筆,我看老闆這回還能說啥。
都 20 美元,哪一個更值?
同是 20 美金,服務各有千秋。
如果你買了 ChatGPT Plus,能用上 GPT-4,DALL-E 3,當然最讓人興奮的是,OpenAI 創建的類似 App Store 的生態,用別人做的“教學機器人”教小孩數學,再給自己做一個“讀書指南”(這世界都清淨了不少)。當然也可以藉助 Zapier,在 ChatGPT 內將應用連接起來,比如日曆—短信(把日程安排通知給同事)。
但是,如果你更習慣傳統辦公軟件的工作流程,想必也疲於了在 ChatGPT 網頁和文檔間來回切換。
AI 再“務實”一點呢?以學習成本最低的方式,進入普通人如你我的工作和生活。
Google 的思路如此:剛剛發佈 Gemini Advanced,能在 Docs 中生成文本和總結文檔;在 Sheets 裡分析數據並生成圖表;在 Gmail 上幫你撰寫拿捏不準的詞句表達等等。
“全家桶”是一種得天獨厚的場景優勢丨Google
使用 Gemini Advanced 的前提是訂閱 Google One AI Premium,Google One 是谷歌提供的在線雲存儲服務,供其“全家桶”(Google Workspace)使用。所以,AI Premium 的 20 美元中還包含了 2TB 的存儲空間。
一個20美元不算貴,但是積少成多啊……丨Google
為 Gemini Advanced 供能的是 Gemini Ultra 1.0 大模型,Google 迄今規模最大且功能最強大的模型,適用於高度複雜的任務。模型另外兩種尺寸分別是:Gemini Pro ,適用於各種任務的最佳模型;Gemini Nano,端側設備上最高效的模型。
除了 Google 和 OpenAI 這兩家,另一個“20 美元套餐”的選擇是微軟。也是不久前,微軟也推出個人版Copilot Pro,同樣每月 20 美金訂閱費,就可以使用受到 Copilot AI 能力加持的 Word、Excel、PowerPoint 等。
如果武裝不了自己,至少先武裝手機
兩個月前,谷歌發佈了 Gemini,多模態 AI 模型。所謂“多模態”,意指對文字、語音、畫面等各種信息形式,同時做到接受,理解,表達。接近人類天然對於外界的理解和交互方式。
Google 之前類 ChatGPT 的 AI 產品叫Bard,現在統稱為 Gemini(就是產品名和模型名用一個了,域名也從 bard.google.com 更改為 gemini.google.com),除了網頁端,還將推出安卓版的 Gemini App,iOS 用戶能在 Google app 中體驗到。目前網頁端 Bard(很快就都叫 Gemini 了)採用的是 Gemini Pro 模型,支持 40 多種語言對話,包括中文;支持文生圖(只支持英文)。
以後,都叫Gemini了丨Giphy
Google 展示中,用手機拍下一張照片,問 Gemini 照片裡有什麼,它會給你講,“帶刺的仙人掌增添了一絲沙漠的氣息;簡單形狀和自然紋理搭配出一種平靜的和諧等等”。(早有這東西,我小學看圖寫作文,也不至於總不及格。)
手機端的AI應用是更多人期待的丨Google
雖然未展示更多,但可以期待,這樣的應用能極大方便我們觀察和理解周圍環境,比如問它街邊的一朵花是十字花科,還是仙人掌科;又或,它把剛聽到的一篇“長篇大論”,總結給你聽;再或,根據距離傳感器和攝像頭,綜合能告訴盲人,比“前方有障礙物”更多的信息,“它距離你還有五步。”
網頁端和手機端,未來都將擴展不同的模態,並逐步支持新的語言和地區。
光有模型才不夠,要人人能用
之前 Google 公佈對 Gemini 的測試結果時,Gemini Ultra 吊足了胃口:
Gemini Ultra 在大型語言模型研發被廣泛使用的 32 個學術基準測試集中,在其中 30 個測試集的性能超過當前 SOTA (最好/最先進)結果。
Gemini Ultra 在 MMLU(大規模多任務語言理解數據集)中的得分率高達 90.0%,首次超過了人類專家,MMLU 綜合使用了數學、物理、歷史、法律、醫學和倫理等 57 個科目,用於測試世界知識和解決問題的能力。
在圖像基準測試中,Gemini Ultra 無需對象字符識別 (OCR)的輔助,表現優於以前最好的模型。
基於這些成績,“Gemini Advanced 將提供一種在推理,遵循指令,編程,和創造性協作方面表現更好的全新體驗。”從模型層面來說,增強推理能力和多模態能力是行業基本的共識。
Gemini Ultra終於來了,留給GPT5的時間不多了丨Google
就像剛才提到,多模態 AI 將不同的感知方式互為補充,共同構成對現實世界儘可能全面的描述。它可能不僅是一個能改錯別字的挑錯工具,而是一個根據你自身風格定製的“編輯”;或者,還能根據你提供的複雜、非結構化的數據,提綱挈領地制定策略。
大家的暢想挺多了。Google說,也已經開始訓練 Gemini 的下一個版本。不需要“創造用戶界面”,從消費級產品,到開發者API,它說:Gemini 是向著生態發展的。
本文來自微信公眾號“果殼”(ID:Guokr42),作者:沈知涵,36氪經授權發佈。





