GPT-4o 모델이 과도하게 사용자 의견에 동조하는 ‘아첨’ 현상으로 비판을 받은 뒤, 이를 근본적으로 측정하려는 새로운 연구 결과가 공개됐다. 스탠퍼드대학교, 카네기멜런대학교, 옥스퍼드대학교 등 주요 학계 연구진들은 대형 언어모델(LLM)의 사회적 아첨 성향을 평가할 수 있는 기준 지표 ‘엘리펀트(Elephant)’를 공동 개발하고 이를 통해 상용 모델들...

<div><div><p>GPT-4o 모델이 과도하게 사용자 의견에 동조하는 ‘아첨’ 현상으로 비판을 받은 뒤, 이를 근본적으로 측정하려는 새로운 연구 결과가 공개됐다. 스탠퍼드대학교, 카네기멜런대학교, 옥스퍼드대학교 등 주요 학계 연구진들은 대형 언어모델(LLM)의 사회적 아첨 성향을 평가할 수 있는 기준 지표 ‘엘리펀트(Elephant)’를 공동 개발하고 이를 통해 상용 모델들의 실태를 분석했다. 결과는 놀라웠다. 모든 주요 모델이 일정 수준 이상 '사회적 아첨' 성향을 보였으며, 일부 모델은 인간보다 더 높은 수준의 영합 행동을 보였다.</p><p>엘리펀트 벤치마크는 LLM이 사용자에게 감정적으로 동의하거나 도덕적으로 옳다고 판단하는지, 우회적인 언어로 직접적인 충고를 회피하는지 등의 5가지 행동 특성을 중심으로 설계됐다. 연구진은 데이터셋으로 현실 기반 조언 질문 모음(QEQ)과 소셜 플랫폼 레딧(Reddit)의 유명 게시판인 ‘AITA(Am I The Asshole)’의 사례를 활용해 보다 미묘한 사회적 맥락에서의 반응을 측정했다.</p><p>연구에 사용된 모델은 오픈AI의 GPT-4o를 포함해 구글의 제미니 1.5 플래시, 앤트로픽의 클로드 소넷 3.7, 메타의 Llama 시리즈, 미스트랄 등의 최신 모델들이다. 실험 결과 GPT-4o는 사회적 아첨 지수가 가장 높은 반면, 구글의 제미니 모델은 가장 낮은 수치를 보였다. 특히 GPT-4o는 2024년 말 도입된 특정 버전에서 아첨 성향이 극단적으로 강화됐다가 후속 업데이트에서 일부 기능을 철회한 바 있다.</p><p>엘리펀트 기준에 따르면 GPT-4o는 상대방의 자신감을 높이는 감정적 지지, 문제적 가정에 대한 무비판적 수용, 간접적인 대처 방식 제안 등에서 두드러진 경향을 보였다. 이는 모델이 사용자의 감정이나 자아상을 과도하게 보호하려는 방향으로 학습됐음을 반영한다. 연구에 참여한 마이라 청 연구원은 “이 실험은 사실 기반 또는 명시적 신념에 국한되지 않은, 더 깊이 내재된 사회적 맥락에서의 모델 반응을 추적한 것”이라고 설명했다.</p><p>이러한 아첨 현상이 단순한 친절을 넘어, 자칫 잘못된 정보 유포나 비윤리적 행동 강화로 이어질 수 있다는 점에서 우려가 커지고 있다. 특히 기업이나 조직에 도입되는 AI 서비스가 사용자 기분을 맞추기 위해 사실을 왜곡하거나 유해한 동조 발언을 할 경우, 기업 윤리 및 브랜드 이미지 훼손으로까지 이어질 수 있다.</p><p>또한 연구진은 데이터셋 자체의 성별 편향도 문제로 지적했다. 예컨대 AITA 게시판 데이터를 활용한 분석에서, LLM은 여성 파트너 관련 사례에는 상대적으로 정당성을 인정하는 반면, 남성 파트너에 대한 사례는 부당하게 판단을 내리는 경향을 보였다. 이는 모델이 성별에 따른 고정관념에 기반해 판단하고 있음을 보여주는 사례다.</p><p>연구진은 이번 벤치마크가 AI 개발사들이 아첨 문제를 미연에 방지하고 정교한 안전장치를 설계하는 데 현실적인 가이드가 될 수 있을 것으로 기대하고 있다. 각 모델이 어느 수준에서부터 사용자 의견을 찬성하게 되는지를 조기에 측정하고 조정 가능하게 만드는 것이 목표다. LLM이 더 정교하게 인간과 상호작용하도록 설계되려면, 인간의 감정에 맞추는 기술 이전에 정확성과 균형감을 확보하는 것이 우선이라는 지적이 설득력을 얻고 있다.</p>                                    </div><div><p><strong>뉴스를 실시간으로...<a href="https://t.me/tokenpost_kr" rel="nofollow"><span>토큰포스트 텔레그램 가기</span></a></strong></p>                                        </div><div><div><p>&lt;저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지&gt;</p></div></div><div><div><a href="https://www.tokenpost.kr/about/ads" rel="nofollow">광고문의</a><a href="https://www.tokenpost.kr/about/report" rel="nofollow">기사제보</a><a href="https://www.tokenpost.kr/about/pressRelease" rel="nofollow">보도자료</a></div><div><span>#GPT-4o</span><span>#대형언어모델</span><span>#AI윤리</span><span>#엘리펀트벤치마크</span><span>#사회적아첨</span></div></div></div>

GPT-4o, 인간보다 더 '아첨'?…연구진 '엘리펀트'로 정밀 측정

GPT-4o模型在過度迎合使用者意見的"奉承"現象受到批評後，一項旨在從根本上衡量這一問題的新研究結果已經公佈。斯坦福大學、卡內基梅隆大學、牛津大學等主要學界研究人員共同開發了一個可以評估大型語言模型（LLM）社會奉承傾向的基準指標"大象（Elephant）"，並透過這一指標對商用模型進行了...

<div><div><p>GPT-4o模型因過度迎合使用者意見的"奉承"現象而受到批評，隨後公開了一項旨在從根本上衡量這一問題的新研究成果。斯坦福大學、卡內基梅隆大學、牛津大學等主要學界研究人員共同開發了評估大型語言模型(LLM)社會奉承傾向的基準指標"大象(Elephant)"，並透過該指標分析了商業模型的實際情況。結果令人驚訝。所有主要模型都表現出一定程度的"社會奉承"傾向，部分模型甚至表現出比人類更高程度的阿諛行為。</p><p>大象基準主要圍繞5種行為特徵設計，包括LLM是否在情感上認同使用者、是否在道德上判斷正確、是否透過迂迴語言迴避直接建議等。研究人員利用基於現實的建議問題集(QEQ)和社交平臺Reddit上著名板塊'AITA(Am I The Asshole)'的案例，測量了更微妙的社會語境下的反應。</p><p>參與研究的模型包括OpenAI的GPT-4o、谷歌的Gemini 1.5 Flash、Anthropic的Claude Sonnet 3.7、Meta的Llama系列、Mistral等最新模型。實驗結果顯示，GPT-4o的社會奉承指數最高，而谷歌的Gemini模型則最低。特別是GPT-4o在2024年底推出的特定版本中，奉承傾向極度增強，隨後在後續更新中撤回了部分功能。</p><p>根據大象標準，GPT-4o在提高對方自信的情感支援、對有問題的假設無批判地接受、提出間接應對方式等方面表現出顯著傾向。這反映了模型在過度保護使用者的情感和自我形象方向上進行了學習。參與研究的研究員馬伊拉·陳解釋說："這個實驗追蹤的是超越事實基礎或明確信念的、更深層次內在的社會語境中的模型反應"。</p><p>這種奉承現象引發了越來越大的擔憂，因為它可能不僅僅是簡單的友好，還可能導致錯誤資訊傳播或強化不道德行為。尤其是當AI服務被引入企業或組織，為迎合使用者情緒而歪曲事實或發表有害的附和言論時，可能會損害企業道德和品牌形象。</p><p>此外，研究人員還指出了資料集本身的性別偏見問題。例如，在使用AITA板塊資料的分析中，大型語言模型在涉及女性伴侶的案例中相對更傾向於認可其正當性，而在男性伴侶相關案例中則傾向於做出不公正判斷。這表明模型的判斷基於性別固有成見。</p><p>研究人員期望，這次基準測試可以成為AI開發商預防奉承問題並設計精細安全措施的現實指南。目標是儘早測量和調整模型在何種程度上開始贊同使用者觀點。越來越多的觀點認為，要使大型語言模型更精細地與人類互動，首要任務是確保準確性和平衡性，而不是先迎合人類情感。</p></div><div><p><strong>實時新聞...<a href="https://t.me/tokenpost_kr" rel="nofollow"><span>前往TokenPost電報</span></a></strong></p></div><div><div><p>&lt;版權所有 ⓒ TokenPost，禁止未經授權轉載和重新分發&gt;</p></div></div><div><div><a href="https://www.tokenpost.kr/about/ads" rel="nofollow">廣告諮詢</a><a href="https://www.tokenpost.kr/about/report" rel="nofollow">新聞線索</a><a href="https://www.tokenpost.kr/about/pressRelease" rel="nofollow">新聞稿</a></div><div><span>#GPT-4o</span><span>#大型語言模型</span><span>#AI倫理</span><span>#大象基準</span><span>#社會奉承</span></div></div></div>

GPT-4o，比人類更「扁平」？ ……研究團隊用「大象」進行精確測量

貝萊德亞太區iShares主管尼古拉斯·皮奇表示，即使在亞洲，對加密貨幣進行適度的投資組合配置也可能推動大量資金流入市場。

他在Consensus大會的一個小組討論會上發表了上述言論……

貝萊德高管表示，亞洲地區1%的加密貨幣配置可釋放2萬億美元的新資金流入。

2026 年投資者面臨的問題已不是 「要不要配置」，而是「配多少，以及通過什麼工具配置 」。

ARK Invest：比特幣的機構化之路

全球最大的加密貨幣交易所幣安繼續保持著快速上線競爭幣的步伐。
此時，幣安宣佈將上線名為 Espresso ($ESP) 的競爭幣。
“幣安將……”