Anthropic, 새로운 Claude AI 모델과 '컴퓨터 제어' 공개

10-23

이 기사는 기계로 번역되었습니다

원문 표시

Anthropic은 강화된 Claude 3.5 Sonnet 모델과 Claude 3.5 Haiku 도입, 그리고 공개 베타 버전의 "컴퓨터 제어" 기능을 포함한 AI 포트폴리오 업그레이드를 발표했습니다.

업그레이드된 Claude 3.5 Sonnet는 모든 지표에서 상당한 개선을 보였으며, 특히 코딩 기능에서 두드러진 발전을 이루었습니다. 이 모델은 SWE-bench Verified 벤치마크에서 49.0%의 인상적인 성과를 달성하여 OpenAI의 제품과 전문 코딩 시스템을 모두 능가했습니다.

선구적인 발전으로, Anthropic은 Claude가 화면 보기, 커서 제어, 클릭, 타이핑 등 인간과 유사하게 컴퓨터와 상호작용할 수 있는 기능을 도입했습니다. 이 기능은 현재 공개 베타 버전으로 제공되며, Claude 3.5 Sonnet를 최초의 프런티어 AI 모델로 자리매김했습니다.

여러 주요 기술 기업들이 이미 이러한 새로운 기능을 구현하기 시작했습니다.

"업그레이드된 Claude 3.5 Sonnet는 AI 기반 코딩에 있어 중요한 진전을 나타냅니다."라고 GitLab은 보고했으며, 추가 지연 없이 사용 사례에 걸쳐 최대 10%의 강화된 추론 능력을 확인했습니다.

이번 달 말 출시될 새로운 Claude 3.5 Haiku 모델은 이전 Claude 3 Opus의 성능을 유지하면서도 비용 효율성과 속도를 보여줍니다. 특히 SWE-bench Verified에서 40.6%를 달성하여 원래의 Claude 3.5 Sonnet와 GPT-4o를 포함한 많은 경쟁 모델을 능가했습니다.

Model benchmarks comparing new Claude AI models from Anthropic. — *(Credit: Anthropic)*

컴퓨터 제어 기능과 관련하여, Anthropic은 현재 한계를 인정하면서도 잠재력을 강조하는 신중한 접근법을 취했습니다. OSWorld 벤치마크, 즉 컴퓨터 인터페이스 탐색을 평가하는 테스트에서 Claude 3.5 Sonnet는 스크린샷 전용 테스트에서 14.9%를 달성하여 차선의 시스템 7.8%를 크게 능가했습니다.

이러한 발전은 엄격한 안전성 평가를 거쳤으며, 배포 전 테스트는 미국과 영국 AI 안전 연구소와의 협력 하에 수행되었습니다. Anthropic은 자사의 책임감 있는 확장 정책에 명시된 ASL-2 표준이 이러한 모델에 여전히 적절하다고 밝혔습니다.

(Image Credit: Anthropic)

AI와 빅데이터에 대해 업계 리더들에게 더 알아보고 싶으신가요? AI & Big Data Expo에 참석해 보세요. 암스테르담, 캘리포니아, 런던에서 개최되는 이 종합 행사는 Intelligent Automation Conference, BlockX, Digital Transformation Week, Cyber Security & Cloud Expo 등 다른 주요 행사와 함께 개최됩니다.

TechForge에서 제공하는 다른 upcoming 엔터프라이즈 기술 행사와 웨비나를 여기에서 확인하세요.

이 기사는 AI News에 처음 게재되었습니다.

섹터:

오라클

디파이

거버넌스

출처

면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.

라이크

즐겨찾기에 추가

코멘트