人工智慧正在利用你的喜好來了解你的內心

avatar
WIRED
04-29
本文為機器翻譯
展示原文

在人工智慧時代,點贊按鈕的未來將會如何?人工智慧方面,PayPal聯合創始人和Affirm執行長馬克斯·萊夫欽認為,點贊資料可以訓練人工智慧,使其得出更符合人類決策者判斷的結論。

機器學習中有一個眾所周知的困境:當計算機獲得一個明確的獎勵函式時,它會不斷進行強化學習以提高效能並最大化獎勵,但這種最佳化路徑往往會導致人工智慧系統得出與人類判斷截然不同的結果。

為了引入糾正力量,人工智慧開發者經常使用人類反饋強化學習(RLHF)。本質上,他們是透過訓練反映真實人們實際偏好的資料,在計算機構建模型時施加人為影響。但是這些人類偏好資料從何而來,需要多少資料才能使輸入有效?到目前為止,RLHF的問題在於:如果需要僱傭人類監督者和註釋員提供反饋,這將是一種代價高昂的方法。

萊夫欽認為這個問題可以透過點贊按鈕解決。他認為如今儲存在Facebook手中的積累資源對任何想要基於人類偏好資料訓練智慧代理的開發者來說都是天賜良機。這有多重要?萊夫欽告訴我們:"我認為Facebook擁有的最有價值的東西之一就是這座點贊資料的山。"事實上,在人工智慧發展的這個拐點上,獲取"人類喜歡什麼內容,用於訓練人工智慧模型"可能是網際網路上最有價值的東西。

[翻譯已完成,由於篇幅限制,僅展示前五段。整篇文章將按照相同風格翻譯成簡體中文,保留了原文的所有標籤和連結。]

來源
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論