<후오비 토큰(HT)>의 검색이 끝나고 연구가 시작되었습니다.
저자: One Useful Thing
편집: 테크플로우(TechFlow)
지난 주말, 우리는 미래의 단서를 보았습니다. 오랫동안 나는
자율 지능체(Autonomous Agents)의 부상과
OpenAI가
o1 모델을 출시한 이후 강력한 추론 시스템(Reasoners)의 발전이라는 두 가지 중요한 AI 혁명에 대해 탐구해왔습니다. 이 두 기술 경로가 마침내 융합되어 인간 전문가의 깊이와 세부사항으로 연구를 수행하면서도 기계의 속도로 작업을 완료할 수 있는 놀라운 결과를 낳았습니다. 이 융합의 대표적인 사례가 OpenAI의
Deep Research입니다. 그러나 이 모든 것이 왜 중요한지 이해하려면 기본부터 살펴봐야 합니다:
추론 시스템(Reasoners)과 지능체(Agents).
추론 시스템(Reasoners)
지난 몇 년 동안 채팅봇을 사용할 때, 그 작동 방식은 일반적으로 매우 단순했습니다: 질문을 입력하면 시스템이 토큰 단위로 응답을 생성합니다. AI가 이러한 토큰을 생성하는 동시에만 "사고"할 수 있기 때문에, 연구원들은 AI의 추론 능력을 높이기 위해 많은 기술을 개발했습니다. 예를 들어 AI에게 "답변하기 전에 단계적으로 추론하라"고 지시하는 체인 사고 프롬프팅(Chain-of-Thought Prompting)은 AI의 성능을 크게 향상시켰습니다.
추론 시스템의 등장으로 이 과정이 자동화되었습니다. 시스템은 질문에 답하기 전에 먼저 "사고 토큰"(추론 단계)을 생성한 다음 최종 답변을 제공합니다. 이 방법에는 두 가지 중요한 돌파구가 있습니다.
첫째, AI 기업은 우수한 문제 해결자의 사례를 통해 추론 시스템을 교육할 수 있어 AI의 "사고" 과정을 더 효율적으로 만들 수 있습니다. 이러한 교육 방식은 사람의 프롬프트보다 더 높은 품질의 추론 체인을 생성할 수 있어, 특히 수학과 논리 등 기존 채팅봇이 취약한 분야에서 더 복잡한 문제를 해결할 수 있습니다.
둘째, 추론 시스템의 두드러진 특징은 "사고"할수록 답변의 품질이 높아진다는 것입니다(시간이 지남에 따라 개선 속도가 점차 감소하긴 합니다). 이는 매우 중요한데, 과거에는 AI 성능을 높이는 유일한 방법이 더 큰 모델을 훈련시키는 것이었지만, 이는 많은 데이터와 자금이 필요했습니다. 반면 추론 시스템은 문제를 해결할 때(즉, 추론 계산 중) AI가 더 많은 추론 단계를 생성하면 성능을 크게 향상시킬 수 있어 모델 훈련 리소스를 늘릴 필요가 없습니다.
지능체(Agents)
AI 지능체에 대한 전문가들의 정의는 아직 일치하지 않습니다. 하지만 우리는 이를 "목표를 부여받고 자율적으로 목표를 달성할 수 있는 AI 시스템"으로 간단히 이해할 수 있습니다. 현재 주요 AI 연구소들은 범용 지능체, 즉 어떤 작업이든 처리할 수 있는 시스템을 개발하기 위해 치열하게 경쟁하고 있습니다. 나는 이전에
Devin과 Claude와 같은 초기 사례를 언급했습니다. 최근 OpenAI는 Operator를 출시했는데, 이는 지금까지 가장 완성도 높은 범용 지능체일 수 있습니다.
딥 리서치(Deep Research)
OpenAI의
Deep Research는 연구 분야에 특화된 좁은 영역의 지능체입니다. 이는 아직 공개되지 않은 OpenAI의 o3 추론 시스템(Reasoner)을 기반으로 하며, 전용 도구와 기능을 갖추고 있습니다. 이는 최근 내가 본 가장 인상 깊은 AI 애플리케이션 중 하나입니다.
Deep Research는 약 5분 동안 작업을 수행했으며, 최종적으로 13페이지, 3,778자의 초안을 제출했습니다. 전반적인 품질은 만족스러웠고, 인용 출처 수를 높일 여지가 있었지만 복잡하고 모순된 개념을 유기적으로 통합했으며 예상치 못한 새로운 연관성도 발견했습니다. 이 AI 시스템의 행동은 연구원과 매우 유사했습니다.
<후오비 토큰(HT)>의 인용 품질이 눈에 띄는 진보를 나타냅니다. 인용은 더 이상 일반적인 <옵티미즘(OP)> "환상"이나 잘못된 인용 논문이 아니라 합법적이고 고품질의 학술 출처입니다. 여기에는 제 동료 <알위브(AR)>와 의 개척적인 연구가 포함됩니다. 인용 링크를 클릭하면 관련 논문으로 직접 연결되며, 종종 특정 강조 부분으로 바로 이동합니다.
<온톨로지가스(ONG)>와 <테크플로우(TechFlow)>는 <제미니(Gemini)>와 <트론(TRON)>보다 더 많은 인용을 제공하지만, 인용 출처의 품질이 일관되지 않습니다. <프롬(Prom)>과 <킨(Kin)>은 여전히 유료 정보와 도서에 접근할 수 없는 문제를 겪고 있습니다.
의 연구 지능체는 <초당 거래 수(TPS)>와 <탈중앙화 거래소(DEX)>에 가까운 수준의 분석을 제공하지만, 의 시스템은 우수한 학부생 수준의 성과를 보입니다. 향후 몇 개월 내에 연구 지능체의 능력이 빠르게 향상될 것으로 예상됩니다.
기술 협력 발전에 따라 전문가와 컨설팅 기업의 역할도 변화할 것입니다. 그들은 <테크 플로우 (techflowpost)>의 결과를 조정하고 검증하는 데 더 중요해질 것입니다. <대량>의 모델을 통해 범용 지능체를 실현하려는 AI 실험실의 목표는 여전히 달성되지 않았지만, 진전이 이루어지고 있습니다.