OpenAI는 오늘 자사의 가장 강력한 인공지능 모델의 개선된 버전을 발표했습니다. 이 모델은 질문에 대해 더 많은 시간을 할애하여 숙고하는 것이 특징입니다. 이는 구글이 이 유형의 첫 번째 모델을 발표한 지 하루 만에 발표된 것입니다.
OpenAI의 새로운 모델인 o3는 지난 9월 소개된 o1을 대체합니다. o1과 마찬가지로 새로운 모델은 단계별 논리적 추론이 필요한 질문에 대해 더 나은 답변을 제공하기 위해 문제에 대해 숙고하는 시간을 가집니다. (OpenAI는 "o2"라는 명칭을 사용하지 않기로 했는데, 이는 이미 영국의 모바일 통신사 이름이기 때문입니다.)
"우리는 이것이 AI의 다음 단계의 시작이라고 생각합니다. 이러한 모델을 사용하여 점점 더 복잡한 작업을 수행할 수 있게 됩니다." 라고 OpenAI CEO Sam Altman은 금요일 라이브 스트림에서 말했습니다.
o3 모델은 선행 모델인 o1보다 여러 측면에서 훨씬 높은 점수를 받았습니다. 이는 복잡한 코딩 관련 기술과 고급 수학 및 과학 역량을 측정하는 지표에서 그렇습니다. 특히 ARC-AGI에서 측정한 결과, o3는 o1보다 3배 더 뛰어난 성능을 보였습니다.
구글도 유사한 연구를 진행하고 있습니다. 구글 연구원 Noam Shazeer는 어제 X에 게시한 글에서 회사가 자체 추론 모델인 Gemini 2.0 Flash Thinking을 개발했다고 밝혔습니다. 구글 CEO Sundar Pichai는 이를 "지금까지 가장 심도 있는 모델"이라고 언급했습니다.
이 두 경쟁 모델은 OpenAI와 구글 간의 경쟁이 그 어느 때보다 치열해졌음을 보여줍니다. OpenAI가 더 많은 투자를 유치하고 수익성 있는 사업을 구축하기 위해서는 지속적인 발전을 입증하는 것이 중요합니다. 한편 구글은 AI 연구 분야에서 선두 자리를 지키고 있음을 보여주고자 합니다.
이러한 새로운 모델들은 AI 기업들이 단순히 모델의 규모를 확대하는 것을 넘어서, 더 큰 지능을 끌어내기 위해 노력하고 있음을 보여줍니다.
OpenAI는 o3와 o3-mini의 두 가지 버전의 새로운 모델을 공개하지 않고 있지만, 외부인들이 이를 테스트할 수 있도록 초청할 것이라고 밝혔습니다. 또한 OpenAI는 o1의 정렬 기술에 대한 더 자세한 내용을 공개했습니다. 이는 모델이 요청의 성격을 숙고하여 자신의 가이드라인을 위반할 수 있는지 여부를 판단하는 것을 포함합니다.
대규모 언어 모델은 많은 질문에 대해 놀라울 정도로 잘 답변할 수 있지만, 기본적인 수학이나 논리가 필요한 퍼즐을 해결할 때는 종종 실수합니다. OpenAI의 o1은 단계별 문제 해결 훈련을 통해 이러한 유형의 문제를 더 잘 해결할 수 있는 AI 모델을 만들어냈습니다.
문제를 추론하는 모델은 사용자를 대신하여 복잡한 문제를 안정적으로 해결할 수 있는 소위 AI 에이전트를 배치하고자 하는 기업에게도 중요할 것입니다. o3 모델은 모델의 대리 능력을 측정하는 SWE-Bench에서 o1보다 20% 더 뛰어난 성과를 보였습니다.
"이는 우리가 실제로 유용성의 경계를 넘어서고 있음을 의미합니다." 라고 OpenAI 연구 부문 선임 부사장 Mark Chen은 오늘의 라이브 스트림에서 말했습니다.
"이 모델은 프로그래밍에 굉장합니다." 라고 Altman이 덧붙였습니다.
기술 기업들이 연말에 진정한 돌파구를 찾지 못했지만, AI 발표의 속도는 최근 매우 빨라지고 있습니다.
이번 달 초 구글은 자사의 주력 모델인 Gemini 2.0의 새로운 버전을 발표하고, 이를 웹 브라우징 도우미와 스마트폰 또는 스마트 안경을 통해 세상을 보는 보조 기능으로 시연했습니다.
OpenAI는 크리스마스를 앞두고 비디오 생성 모델의 새로운 버전, ChatGPT 기반 무료 검색 엔진, 그리고 1-800-ChatGPT를 통해 전화로 ChatGPT에 접근할 수 있는 방법 등 다양한 발표를 했습니다.
2024년 12월 20일 오후 1시 16분 업데이트: 이 기사에 OpenAI의 추가 의견과 세부 사항이 반영되었습니다.