Bài viết này được dịch máy
Xem bản gốc

@logic_int vừa đạt mức bão hòa PutnamBench! Hệ quả về mặt toán học là vô cùng sâu rộng, nhưng tôi hào hứng hơn nhiều về những gì một tác nhân như Aleph có thể mở khóa trong việc tạo mã nói chung nhờ những khả năng độc đáo của nó. Sẽ có thêm thông tin về điểm này sớm thôi...

Logical Intelligence
@logic_int
01-12
Our Aleph agent, powered by @OpenAI 's GPT‑5.2, scored 668/672, 99.4% w/hyper-efficiency on @gtsoukal et al.'s PutnamBench (the hardest formal math benchmark) a critical step in natural language automated code generation — English as programming — with hallucination-free results
Khu vực:
Từ Twitter
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
Thêm vào Yêu thích
Bình luận