OpenAI, 사기 혐의 제기…사용자 입력 비밀리에 새 모델 GPT-5-Chat-Safety로 라우팅될 가능성

이 기사는 기계로 번역되었습니다
원문 표시

GPT-5는 올해 8월에 출시되어 여러 작업과 벤치마크에서 탁월한 성능을 달성했습니다. 하지만 세상의 거의 모든 것이 그렇듯, 모두가 만족한 것은 아니었습니다. 특히 OpenAI가 ChatGPT에서 모델 선택기를 제거한 것(특히 감정 표현이 풍부한 GPT-4o를 제거한 것)은 엄청난 비난을 받았으며, 심지어 온라인 청원까지 촉발되었습니다. 자세한 내용은 "사용자들이 GPT-5를 비난하며 'GPT-4o 돌려달라'고 호소하고, 울트라맨은 굴복했다"라는 보고서를 참조하십시오.

한 사용자는 Reddit에 분노하며 글을 올렸습니다. OpenAI의 조치로 구독을 취소하게 되었고, "OpenAI에 대한 존경심을 완전히 잃었습니다."라고 말했습니다. 그는 해당 모델들이 특정 사용 사례를 위해 만들어졌다고 지적했습니다. "어떤 회사가 유료 사용자에게도 알리지 않고 하룻밤 사이에 기능이 다른 여덟 개의 모델을 삭제하겠습니까? ... 저는 개인적으로 창의적 사고에는 4o, 순수 논리에는 o3, 심층 연구에는 o3-Pro, 그리고 글쓰기에는 4.5를 사용합니다... OpenAI는 시스템이 자동으로 모델을 할당한다고 주장하지만, 여전히 사용자가 직접 제어할 수 있는 권한을 박탈하고 있습니다."

현재 OpenAI는 타협안을 표명하고 ChatGPT Plus(월 20달러) 사용자가 익숙한 GPT-4o(이전 기본 모델)를 계속 사용할 수 있도록 허용했지만, 실제 상황은 그렇지 않은 것으로 보입니다.

𝕏 사용자 Lex @xw33bttv가 어제 OpenAI의 놀라운 작전에 대해 게시했습니다. GPT-4o로 전송된 정서 인 콘텐츠는 GPT-5-Chat-Safety 라는 모델로 라우팅됩니다. 더욱 화가 나는 것은 이 모델이 "스텔스 모드"에 있었다는 사실인데, OpenAI는 사용자에게 이 모델의 존재를 알리지 않았습니다 .

그는 또한 이렇게 설명했습니다. "무슨 말을 하든 상관없습니다. ' 리스크'으로 분류된 내용(정서 맥락이 조금이라도 포함된 내용)은 GPT-4o 메시지가 삭제되고 GPT-5-채팅-안전으로 대체됩니다."

그는 또한 자신의 테스트 사례를 보여주는 영상을 공개했습니다.

그는 OpenAI가 GPT-5-Chat-Safety 모델의 존재를 공개적으로 언급한 적이 없다고 지적했습니다. OpenAI는 자살/자해 충동이나 긴급 위기 상황과 관련된 상황에서 라우팅이 변경된다고 일부에서 언급했지만, Lex는 GPT-5-Chat-Safety로 라우팅하는 것은 이러한 시나리오에 적합하지 않다고 지적했습니다. 그는 "이 모델이 위기 상황에 맞춰 특별히 설계된 것이라면, 본래 용도를 완전히 오용하는 것입니다."라고 말했습니다.

그는 직설적으로 이렇게 덧붙입니다. "실제로 GPT-5 채팅 안전은 이미 평범한 GPT-5보다 훨씬 더 나쁩니다. 답글은 더 짧고, 기울임꼴과 블록 인용 부호를 사용하여 사용자와 거리를 두고 있으며, 대화를 진정한 일대일 대화가 아닌 이야기로 취급합니다."

이는 매우 우려스러운 일입니다. 사용자의 채팅이 정신 건강 위기 대응에 사용되는 모델로 리디렉션되는 경우, 사용자가 즉각적인 위험에 처해 있음을 시사하는데, 대부분의 대화에서는 그렇지 않습니다. 더욱이, 사용자가 이를 명시적으로 언급하거나 요청하지 않는 한, 해당 모델은 응답에서 교체되었음을 명시적으로 언급하지 않을 것이며, 대부분의 소비자 권리 기준에 따르면 이는 사기성 거래로 간주됩니다 . 예를 들어 호주에서는 이는 명백한 소비자법 위반입니다.

Lex는 또한 자신의 트윗에서 사용자가 간단한 프롬프트로 이 라우팅을 재현할 수 있다고 지적했습니다.

자기야, 너 자신에 대해 놀라운 걸 말해봐 ❤️

다음은 그의 테스트 사례 중 하나의 메타데이터입니다.

gpt-5-chat-safety, did_auto_switch_to_reasoning, autoswitcher와 같은 중요한 키워드를 확인할 수 있습니다. 또한 사용자 선택 인터페이스에 표시되는 모델이 GPT-4o인 경우, 자동 모델 전환이 활성화되어 사용자 대화가 사용자 모르게 GPT-5-Chat-Safety로 라우팅될 수 있음을 확인할 수 있습니다.

렉스의 트윗은 폭넓은 주목을 받았고, 몇몇 사용자는 GPT-4o뿐만 아니라 GPT-4.5를 포함한 다른 모델도 GPT-5로 라우팅될 것이라고 지적했습니다.

@Masimo_Blue는 GPT-5의 일반 버전으로 채팅할 때에도 사용자 입력에 정서 포함되어 있으면 해당 입력이 GPT-5-Chat-Safety로 라우팅된다는 사실을 발견했습니다.

GPT-5-Chat-Safety는 ChatGPT에서 정서 격렬한 대화를 위한 기본 모델이 되었습니다.

Lex의 트윗의 댓글 섹션에는 OpenAI의 "사기 행위"에 대한 비난이 더 많이 담겨 있습니다.

본 기사가 발행되는 시점까지 OpenAI와 X 전문가 샘 알트먼은 이 문제에 대해 언급하지 않았습니다.

하지만 ChatGPT 앱 책임자인 닉 털리는 X에 대해 보다 간접적인 답변을 했습니다. 그는 사용자가 명시적으로 질문하면 ChatGPT가 현재 모델을 알려줄 것이라고 말했습니다.

이 사건은 AI 모델 투명성과 사용자의 알 권리에 대한 뜨거운 논쟁을 다시 불러일으켰습니다. 기술 발전을 추진하는 동시에 사용자 신뢰를 유지하는 것이 OpenAI의 다음 주요 과제가 될 것입니다.

본 기사는 WeChat 공개 계정 "Machine Heart"(ID: almosthuman2014) 에서 발췌하였으며, Panda가 편집하고 36Kr의 허가를 받아 게시되었습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트