Meta 的新 Llama 3.1 AI 模型免費、功能強大且有風險

07-23

本文為機器翻譯

展示原文

大多數科技巨頭都希望將人工智能賣給大眾。但馬克·扎克伯格卻免費贈送 Meta 認為是世界上最好的人工智能模型之一。

Meta 週一免費發佈了大型語言模型Llama的最大、功能最強的版本。Meta 尚未披露開發 Llama 3.1 的成本，但扎克伯格最近告訴投資者，他的公司正在 AI 開發上投入數十億美元。

通過最新發布的版本，Meta 表明大多數人工智能公司青睞的封閉式方法並不是開發人工智能的唯一途徑。但該公司也把自己置於圍繞發佈不受控制的人工智能所帶來的危險的爭論中心。Meta 訓練 Llama 的方式可以防止模型默認產生有害輸出，但可以修改模型以消除此類保護措施。

Meta 表示，Llama 3.1 與OpenAI 、谷歌和Anthropic等公司提供的最佳商業產品一樣聰明和實用。在衡量人工智能進展的某些基準測試中，Meta 表示該模型是地球上最聰明的人工智能。

“這非常令人興奮，”斯坦福大學 (Stanford University) 副教授、研究開源 AI 的Percy Liang表示。Liang 表示，如果開發人員發現新模型與業界領先的模型（包括OpenAI 的 GPT-4o）一樣強大，那麼許多人可能會轉向 Meta 的產品。“看看使用情況如何轉變將會很有趣，”他說。

在新機型發佈時發佈的一封公開信中，Meta 首席執行官扎克伯格將 Llama 與開源Linux操作系統進行了比較。當 Linux 在 20 世紀 90 年代末和 21 世紀初開始流行時，許多大型科技公司都投資於封閉式替代方案，並批評開源軟件風險大、不可靠。然而，如今 Linux 已廣泛應用於雲計算，併成為 Android 移動操作系統的核心。

“我相信人工智能也會以類似的方式發展，”扎克伯格在信中寫道。“今天，幾家科技公司正在開發領先的封閉模型。但開源正在迅速縮小差距。”

然而，Meta 決定免費提供其 AI 並非毫無私利。之前發佈的 Llama幫助該公司在 AI 研究人員、開發人員和初創公司中佔據了有影響力的地位。梁還指出，Llama 3.1 並非真正開源，因為 Meta 對其使用施加了限制，例如限制了該模型在商業產品中的使用規模。

新版 Llama 擁有 4050 億個參數或可調整元素。Meta 已經發布了兩個較小的 Llama 3 版本，一個有 700 億個參數，另一個有 80 億個參數。Meta 今天還發布了這些模型的升級版，品牌為 Llama 3.1。

Llama 3.1 太大，無法在普通計算機上運行，但 Meta 表示，許多雲提供商（包括 Databricks、Groq、AWS 和 Google Cloud）將提供託管選項，以允許開發人員運行該模型的自定義版本。該模型也可以在Meta.ai上訪問。

一些開發人員表示，新版 Llama 可能會對 AI 開發產生廣泛影響。開源 AI 項目EleutherAI的執行董事Stella Biderman也指出，Llama 3 並非完全開源。但 Biderman 指出，Meta 最新許可證的變更將允許開發人員使用 Llama 3 訓練自己的模型，而目前大多數 AI 公司都禁止這樣做。Biderman 說：“這真的是一件大事。”

與 OpenAI 和谷歌的最新模型不同，Llama 不是“多模式”的，這意味著它不是為處理圖像、音頻和視頻而設計的。但 Meta 表示，該模型在使用網絡瀏覽器等其他軟件方面明顯表現更好，許多研究人員和公司認為這可以讓人工智能更有用。

在 OpenAI 於 2022 年底發佈 ChatGPT 後，一些人工智能專家呼籲暫停人工智能開發，因為他們擔心該技術可能被濫用或過於強大而無法控制。此後，生存警報逐漸消退，但許多專家仍然擔心不受限制的人工智能模型可能會被黑客濫用或用於加速生物或化學武器的開發。

圖靈獎獲得者傑弗裡·辛頓 (Geoffrey Hinton) 表示：“世界各地的網絡犯罪分子都會很高興”，他在機器學習領域（即深度學習）的開創性工作為大型語言模型奠定了基礎。

辛頓於 2013 年加入谷歌，但去年離開公司，公開談論更先進的人工智能模型可能帶來的風險。他說，人工智能與開源軟件有著根本的不同，因為模型不能以同樣的方式進行審查。“人們會根據自己的目的對模型進行微調，而其中一些目的非常糟糕，”他補充道。

Meta 謹慎發佈 Llama 的早期版本，有助於緩解一些擔憂。該公司表示，在發佈之前，Llama 經過了嚴格的安全測試，並補充說，幾乎沒有證據表明其模型使武器開發變得更加容易。Meta 表示，它將發佈幾款新工具，通過調節輸出並阻止突破限制的企圖，幫助開發人員確保 Llama 模型的安全。Meta 發言人 Jon Carvill 表示，公司將根據具體情況決定是否發佈未來的模型。

計算機科學家、專注於人工智能危險的非營利組織人工智能安全中心主任 Dan Hendrycks 表示，Meta 在發佈模型之前通常都進行了很好的測試。他說，新模型可以幫助專家瞭解未來的風險。“今天發佈的 Llama 3 將使大型科技公司以外的研究人員能夠開展急需的人工智能安全研究。”