X Freeze의 인사이트

03-31

이 기사는 기계로 번역되었습니다

원문 표시

Grok 4.20 베타 버전이 통신(에이전트 도구 사용) 부문 𝜏²-Bench에서 97%의 정확도로 2위를 차지했습니다. 이 모델은 Claude Opus 4.6(max), GPT-5.4(xhigh), 제미니(Gemini) 3.1 Pro보다 뛰어난 성능을 보이며, 에이전트 워크플로우 부문에서 최고 점수를 기록한 골렘(GLM)-5에 근접하고 있습니다. AI 에이전트에게 있어 도구 호출은 핵심적인 부분이며, 바로 이 부분에서 Grok 4.20이 진가를 발휘합니다. 최첨단 인텔리전스가 즉시 작동하여 업계에서 초당 토큰 처리 속도가 가장 빠릅니다.