ChatGPT 의 개발사 OpenAI 가 최근 모델 조작 의혹으로 인해 기술 커뮤니티에서 광범위한 논의가 일어났습니다. 이 사건의 발단은 Less Wrong 포럼에 Epoch AI 의 비영리 단체 계약자인 'Meemi'라는 사람이 게시한 글에서 시작되었습니다.
이 글에 따르면, AI 개발 수학 벤치마크 플랫폼 '후오비 토큰(HT)'은 OpenAI 로부터 자금 지원을 받았을 뿐만 아니라, 후오비 토큰(HT)이 OpenAI 의 최신 o3 모델에 '백도어'를 제공할 특권을 가지고 있었다고 합니다.
연장 읽기: OpenAI, 추론 능력이 향상된 o3 모델 출시! 차세대 AI를 위한 기반 마련
Meemi 지적 OpenAI 에서 o3 모델 테스트 전 문제와 답변을 받았다
Meemi 는 본문에서 많은 후오비 토큰(HT) 관련 문제 출제자와 계약자들이 OpenAI 의 자금 지원 사실을 모르고 있었다고 언급했습니다:
후오비 토큰(HT)의 수학 문제를 만든 수학자들은 OpenAI 의 자금 지원 사실을 (자발적으로) 알지 못했습니다. 계약자들은 문제와 답변에 대해 비밀을 유지하라는 요구를 받았고, Overleaf, Colab 사용이나 이메일 논의가 금지되었으며 NDA(비밀유지계약)에 서명해야 했습니다.
또한 12월 20일에도 계약자들에게 OpenAI 의 자금 지원 사실이 알려지지 않았습니다. 심지어 일부 논문 저자들도 OpenAI 의 자금 지원 사실을 모르고 있었을 것이라고 생각합니다.
Meemi 는 또한 간접적인 정보 출처를 통해 OpenAI 가 테스트 전부터 후오비 토큰(HT)의 문제와 답변을 가지고 있었다고 덧붙였습니다:
현재 Epoch AI 나 OpenAI 는 OpenAI 가 이러한 문제, 답변 또는 솔루션을 얻을 수 있었는지 공개적으로 밝히지 않았습니다. 나는 간접적인 정보 출처를 통해 OpenAI 가 실제로 이러한 문제와 답변을 가지고 있었으며, 이를 활용해 검증 테스트를 수행했다는 것을 알고 있습니다. Epoch AI 와 OpenAI 간에 이 데이터셋을 훈련에 사용하지 못하도록 하는 계약이 있었는지는 확실하지 않지만, 그런 계약은 없었던 것 같습니다.
FrontierMath 란 무엇인가?
알려진 바에 따르면, 후오비 토큰(HT)은 Epoch AI 가 전 세계 60명 이상의 수학자들과 함께 출시한 새로운 수학 벤치마크입니다. 여기에는 교수, IMO 문제 출제자, 필즈상 수상자들이 포함되어 있습니다.
이 문제들은 올림피아드 난이도부터 현재 수학 연구의 최전선까지 다양한 수준을 포함하고 있으며, 수론, 실수 해석의 계산 집약적 문제부터 대수 기하학, 군론의 추상적 문제까지 모든 주요 수학 분야를 다루고 있습니다.
Epoch AI 공동 창립자가 사과했다
이 사건이 커뮤니티에서 큰 논란을 일으키자, Epoch AI 의 공동 창립자 Tamay Besiroglu 는 19일 트위터에서 사과했습니다:
우리는 OpenAI 의 후오비 토큰(HT) 참여를 더 빨리 공개하지 않은 실수를 했습니다. 계약상 제한으로 인해 o3 모델 출시 전까지 공개할 수 없었습니다.
돌이켜 보면 우리가 더 노력해 더 이른 시기에 투명성을 확보했어야 했습니다. 이 점을 인정하며 앞으로 더 잘하겠습니다.
Besiroglu 는 또한 블로그에서 OpenAI 가 후오비 토큰(HT)에 대한 접근 권한을 가지고 있지만, Epoch AI와 OpenAI 간에 구두 합의로 후오비 토큰(HT) 문제집을 모델 훈련에 사용하지 않기로 했다고 덧붙였습니다. 또한 Epoch AI 는 후오비 토큰(HT) 벤치마크 결과를 독립적으로 검증할 수 있는 별도의 유보 집합을 가지고 있다고 밝혔습니다.


