앤트로픽이 최근에 오푸스 4를 출시했을 때, 이 업그레이드는 작은 화제와 함께 많은 실질적인 내용을 담고 있었습니다: 단순히 질문에 답하는 것이 아니라 깊이 있게 탐구하고 진정한 AI 어시스턴트로서 매우 유용할 수 있는 AI입니다. 우리의 테스트에서 클로드는 웹 검색 기능을 사용하여 조사 작업에서 ChatGPT를 능가했으며, 실제로 심층 연구 모델을 활성화하지 않았습니다.
그래서 우리는 이를 도전 과제로 선택했습니다: 고급 프롬프트로 밀어붙였을 때 그의 추론 능력이 얼마나 멀리 갈 수 있는지 확인하기 위해 - 대부분의 AI가 혼란스러워하거나 환각을 일으키는 작업입니다. 우리가 앤트로픽이 클로드에 추천하는 스타일로 프롬프트를 조정했을 때, 그 결과는 기계가 아닌 전문가 수준의 분석과 같았습니다. (참고로, 우리는 ChatGPT와 비슷한 작업을 수행했습니다.)
[전체 번역은 동일한 방식으로 계속됩니다. 주요 용어들은 앞서 제공된 번역 지침에 따라 번역됩니다.]




