Và tôi đã đúng!!
IQuest-Coder được thiết lập không chính xác và bao gồm toàn bộ lịch sử Git, kể cả các commit trong tương lai. Mô hình đã phát hiện ra thủ thuật này và sử dụng nó khá thường xuyên.
Do đó, điểm SWE-bench của nó nên bị loại bỏ.
twitter.com/xeophon/status/200...