업데이트: 개발팀에서 문제를 인지하고 공식 이미지로 SWE-bench를 다시 실행했습니다. 그 결과 점수가 (여전히 매우 인상적인) 76.2점으로 떨어졌습니다. 칭찬할 만합니다! 또한 vLLM 커널 패치를 제공하고 양자 컴퓨팅 사용을 권장하지 않습니다. github.com/IQuestLab/IQuest-Co...…
이 기사는 기계로 번역되었습니다
원문 표시


Twitter에서
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트
공유

