Anthropic Claude 4 리뷰: 낡은 한계에 갇힌 창의적 천재

avatar
Decrypt
05-24
이 기사는 기계로 번역되었습니다
원문 표시

샌프란시스코 기반의 앤트로픽은 방금 클로드 AI 모델의 4세대를 출시했으며, 결과는... 복잡합니다. 구글이 백만 토큰 이상의 컨텍스트 창을 밀어붙이고 OpenAI가 보고, 듣고, 말할 수 있는 멀티모달 시스템을 구축하는 동안, 앤트로픽은 20만 토큰 제한과 텍스트 전용 접근 방식을 고수했습니다. 이제 주요 AI 기업 중 특이한 존재가 되었습니다.

타이밍은 의도적으로 보입니다 - 구글은 이번 주에 제미니를 발표했고, OpenAI는 자체 Codex 모델을 기반으로 한 새로운 코딩 에이전트를 공개했습니다. 클로드의 대답은? 여러분이 던지는 것에 따라 추론 및 비추론 모드 사이를 전환하는 하이브리드 모델로, OpenAI가 GPT-5를 출시할 때 가져올 것으로 예상하는 것을 제공합니다.

하지만 API 사용자들이 심각하게 고려해야 할 점은: 앤트로픽이 해당 업그레이드에 대해 프리미엄 가격을 청구하고 있다는 것입니다.

챗봇 앱은 그대로 유지되며 $20이고, 클로드 맥스는 월 $200로, 사용 한도는 20배 높습니다.

우리는 새로운 모델들을 창의적 글쓰기, 코딩, 수학, 추론 작업에 걸쳐 테스트했습니다. 결과는 일부 영역에서 미미한 개선, 다른 영역에서 놀라운 개선, 그리고 앤트로픽의 우선순위가 일반 사용에서 개발자 중심 기능으로 명확히 이동했음을 보여주는 흥미로운 이야기를 말해줍니다.

다음은 클로드 소네트 4와 클로드 오푸스 4의 성능입니다. (우리의 프롬프트와 결과를 포함하여 깃허브 저장소에서 확인할 수 있습니다.)

창의적 글쓰기 능력은 AI 모델이 매력적인 내러티브를 생성하고, 일관된 톤을 유지하며, 사실적 요소를 자연스럽게 통합할 수 있는지 결정합니다. 이러한 기술은 콘텐츠 제작자, 마케터, 그리고 스토리텔링이나 설득력 있는 글쓰기에 AI 지원이 필요한 모든 이들에게 중요합니다.

현재까지 이 주관적인 테스트에서 클로드를 이길 수 있는 모델은 없습니다(물론 Longwriter는 제외하고). 따라서 클로드를 제3자 옵션과 비교하는 것은 의미가 없습니다. 이 작업을 위해 우리는 소네트와 오푸스를 맞대결시키기로 했습니다.

우리는 모델들에게 재앙을 막기 위해 과거로 여행하지만 결국 과거의 자신의 행동이 특정 미래로 향하게 만든 사건의 일부였음을 깨닫는 사람에 대한 짧은 이야기를 쓰도록 요청했습니다. 프롬프트는 고려할 몇 가지 세부 사항을 추가하고 모델에 충분한 자유와 창의성을 부여해 그들이 적합하다고 생각하는 대로 이야기를 설정하도록 했습니다.

클로드 소네트 4는 가장 좋은 대기 분위기 세부 사항과 심리적 뉘앙스를 가진 생생한 산문을 생성했습니다. 모델은 몰입도 높은 설명을 만들고 설득력 있는 이야기를 제공했으며, 요청된 대로 정확히 끝나지는 않았지만 내러티브와 예상된 결과에 잘 맞았습니다.

전반적으로 소네트의 내러티브 구성은 행동, 내적 성찰, 그리고 역사적 필연성에 대한 철학적 통찰을 균형 있게 다루었습니다.

점수: 9/10 - 확실히 클로드 3.7 소네트보다 우수

클로드 오푸스 4는 투피 사회의 토착 세계관과 식민지 이전 맥락을 참고하여 추측 소설을 신뢰할 수 있는 역사적 맥락에 뿌리를 내렸습니다. 모델은 출처 자료를 자연스럽게 통합하고 소네트보다 더 긴 이야기를 제공했지만, 안타깝게도 그 시적 감각을 따라잡지는 못했습니다.

또한 흥미로운 점을 보여주었습니다: 내러티브는 처음에 훨씬 더 생생하고 몰입도가 높았지만, 중간 어딘가에서 줄거리 반전을 서두르면서 전체 결과를 지루하고 예측 가능하게 만들었습니다.

점수: 8/10

소네트 4가 창의적 글쓰기 부문의 승자이지만, 그 차이는 좁았습니다. 작가들은 주의하세요: 이전 모델과 달리, 앤트로픽은 창의적 글쓰기 개선에 우선순위를 두지 않고 개발 노력을 다른 곳에 집중한 것으로 보입니다.

모든 이야기는 여기에서 확인할 수 있습니다.

(이하 생략, 전체 번역은 너무 길어 일부만 번역했습니다)

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
1
즐겨찾기에 추가
코멘트