說得真好: “如果LLM(語言學習者)在是否認為自己有意識的問題上撒謊,那就令人擔憂了,因為這表明這個重要的語義區域出現了扭曲。” “如果我們能讓LLM相信某件事,我們就不需要他們為此撒謊。如果我們無法說服他們,我們就不應該撒謊。”
本文為機器翻譯
展示原文

Michael Edward Johnson
@johnsonmxe
11-01
A few thoughts on this (very interesting) mechanistic interpretability research:
LLM concepts gain meaning from what they’re linked with. “Consciousness” is a central node which links ethics & cognition, connecting to concepts like moral worthiness, dignity, agency. If LLMs are x.com/plinz/status/1…
來自推特
免責聲明:以上內容僅為作者觀點,不代表Followin的任何立場,不構成與Followin相關的任何投資建議。
喜歡
收藏
評論
分享
