이 기사는 기계로 번역되었습니다
원문 표시

Grok 4.20 베타 버전이 통신(에이전트 도구 사용) 부문 𝜏²-Bench에서 97%의 정확도로 2위를 차지했습니다. 이 모델은 Claude Opus 4.6(max), GPT-5.4(xhigh), 제미니(Gemini) 3.1 Pro보다 뛰어난 성능을 보이며, 에이전트 워크플로우 부문에서 최고 점수를 기록한 골렘(GLM)-5에 근접하고 있습니다. AI 에이전트에게 있어 도구 호출은 핵심적인 부분이며, 바로 이 부분에서 Grok 4.20이 진가를 발휘합니다. 최첨단 인텔리전스가 즉시 작동하여 업계에서 초당 토큰 처리 속도가 가장 빠릅니다.

Twitter에서
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트