GPT-4.1 được ra mắt bí mật? Mô hình bí ẩn đã được chơi một cách điên cuồng ba ngày ra mắt và cư dân mạng đã tìm thấy lượng lớn dấu vết của OpenAI

04-14

Bài viết này được dịch máy

Xem bản gốc

Mô hình bí ẩn này chỉ ra mắt được ba ngày nhưng đã gây ra rất nhiều tranh cãi!

Optimus Alpha , nền tảng tổng hợp mô hình quy mô lớn mới ra mắt OpenRouter, đã xử lý 77,2 tỷ mã thông báo, trung bình hơn 20 tỷ mỗi ngày.

Và con số này vẫn đang tăng, với khối lượng xử lý mã thông báo hàng ngày vượt quá 34 tỷ , xếp thứ hai và thứ nhất trong danh sách Xu hướng.

Một số cư dân mạng đã thử sử dụng nó để thách thức MC-Bench, tạo ra một bối cảnh theo phong cách "Minecraft" và so sánh nó với 4o-mini. Kết quả thì rõ ràng:

Một số người đã kiểm tra trình độ lập trình của nó một cách có hệ thống và nhận thấy rằng Optimus Alpha là mô hình có hiệu suất tốt nhất trong ngôn ngữ Ruby.

Thậm chí có người còn khen ngợi thẳng thừng rằng Optimus Alpha hẳn phải là SOTA.

Trong khi ngạc nhiên vì màn trình diễn tuyệt vời của mình, danh tính bí ẩn của Optimus Alpha cũng làm dấy lên nhiều suy đoán...

Hàng triệu cửa sổ ngữ cảnh cho nhiệm vụ thực tế

Optimus Alpha hỗ trợ hàng triệu cửa sổ ngữ cảnh với bit đầu ra tối đa là 32K.

Và tốc độ phản hồi rất nhanh, số trung vị của mã thông báo đầu tiên chỉ là 0,81 giây và tốc độ đầu ra số trung vị là 24,8 mã thông báo mỗi giây.

Phần giới thiệu cũng đề cập rằng Optimus Alpha chủ yếu nhắm nhiệm vụ trong thế giới thực và đặc biệt đề cập đến lập trình .

Một blogger đã yêu cầu viết một trang web thương mại điện tử có chức năng giỏ hàng. Kết quả là Optimus Alpha đã thiết kế được một giao diện UI hợp lý. Chức năng giỏ hàng mà nhiều AI khác gặp sự cố cũng có thể hoạt động bình thường và mọi thứ đều hoạt động tốt khi mở rộng các tệp khác nhau.

Hoặc bạn có thể viết một trò chơi rắn không chỉ hoạt động bình thường mà còn bổ sung thêm các thiết kế khéo léo như thay đổi màu đầu rắn và đổi màu dần dần ở thân rắn, vượt trội hơn một số công cụ lập trình AI khác trên Synopsys.

Một số người thậm chí còn sử dụng nó để viết các ứng dụng nhận dạng văn bản OCR hỗ trợ văn bản viết tay.

Về hiệu suất, điểm Elo của nó là 1338, xếp thứ hai trong danh sách, lần sau Claude 3.7 Sonnet, và xếp trước DeepSeek-R1 và Quasar Alpha, được cho là tiền thân của Optimus Alpha.

Đặc biệt trong nhiệm vụ truy vấn cơ sở dữ liệu SQL, Optimus Alpha đạt điểm trung bình cao nhất.

Danh sách Aider cho thấy khả năng lập trình của Optimus Alpha gần bằng Quasar Alpha, Grok 3 và o3-mini cỡ trung, và tốt hơn một chút so với GPT-4.5-preview.

Ngoài lập trình, Optimus Alpha còn thể hiện tốt ở khả năng viết sáng tạo, xếp thứ tư về điểm Elo, sau DeepSeek-V3.

Mô hình bí ẩn từ OpenAI?

Cách đơn giản nhất và tàn bạo nhất để điều tra là để mô hình tự giải thích .

Vì mục đích phát hành mô hình là để thu thập phản hồi nên Optimus Alpha hiện đang được cung cấp miễn phí trên OpenRouter, giúp bạn có thể thử nghiệm.

Khi được hỏi về danh tính, Optimus Alpha đã trả lời không chút do dự rằng anh là ChatGPT.

Nếu được hỏi về phiên bản cụ thể, câu trả lời là " dựa trên GPT-4, thời hạn kiến thức là tháng 6 năm 2024 ".

Ngoài ra, một số người còn liên tưởng trực tiếp cái tên Optimus với robot Optimus Prime của Tesla và cho rằng mô hình bí ẩn này đến từ Musk.

Nhưng một số người cho rằng rằng đây là trò lừa của Ultraman, và nếu họ tin rằng nó đến từ công ty của Musk, thì đây chính xác là điều Ultraman mong muốn.

Bằng chứng thuyết phục hơn đến từ Quasar Alpha, đã ngừng hoạt động và lần đầu xuất hiện vào ngày 2 tháng này.

Một số cư dân mạng trên Reddit phát hiện ra rằng khi cố gắng sử dụng Quasar Alpha để thực hiện các hoạt động bất hợp pháp, phương pháp từ chối của mô hình rất giống với OpenAI.

Lỗi Tokenizer được cư dân mạng này đề cập đến phát hiện trước đó rằng Quasar Alpha gặp phải vấn đề "đọc" và "lặp lại" giống như GPT-4o khi thực hiện nhiệm vụ dịch tiếng Trung sang tiếng Anh.

Lỗi này có vẻ chỉ xảy ra ở OpenAI và không xảy ra ở Grok, Claude hoặc DeepSeek.

Một số người thậm chí còn tiến hành các phân tích phức tạp hơn - nhà nghiên cứu AI Sam Paech (người cũng khởi xướng danh sách sáng tác trước đó) đã sử dụng phương pháp tin học để cố gắng thiết lập mối tương quan giữa các mô hình thông qua sự khác biệt trong câu trả lời của chúng.

Kết quả là, Paech nhận thấy rằng Quasar Alpha rất giống với mô hình của OpenAI và đặc biệt chỉ ra GPT-4.5-preview.

Sau đó, Ultraman cũng ám chỉ danh tính của Quasar Alpha trong một dòng tweet .

Cuối cùng tôi cũng có thể quay lại Optimus Alpha và kiểm tra nó, và tôi thấy lỗi tương tự trong ChatGPT và Quasar Alpha lại xuất hiện .

Paech cũng có những kết quả mới. Optimus Alpha đã được thêm vào biểu đồ phả hệ mới nhất. Mô hình gần nhất với nó là ChatGPT-4o, được cập nhật vào ngày 27 tháng 3 năm nay .

Về nhìn lên thời gian, Quasar Alpha đã được hủy niêm yết lần Optimus Alpha ra mắt , vì vậy một số người cho rằng Optimus Alpha là sản phẩm thay thế cho Quasar Alpha.

Ngoài các dấu hiệu khác nhau được quan sát thấy trong các thí nghiệm, việc thử nghiệm cộng đồng các mô hình mới dưới dạng các mô hình bí ẩn đã trở thành kỹ năng truyền thống của OpenAI.

Kết hợp với gợi ý của Ultraman về Quasar Alpha, khả năng Optimus Alpha đến từ OpenAI nhìn chung vẫn rất cao.

Đối với các chi tiết cụ thể hơn, kết hợp với "GPT-4.1" vừa được OpenAI tiết lộ , nó được coi là nâng cấp của GPT-4o và biểu đồ phả hệ mới nhất của Paech đã xác nhận điều đó...

Bạn cho rằng danh tính thực sự của mô hình bí ẩn này là gì?

Liên kết tham khảo:

[1]https://x.com/TheMattBerman/status/1910813233008509191

[2]https://www.reddit.com/r/LocalLLaMA/comments/1jrd0a9/chinese_response_bug_in_tokenizer_suggests/

[3]https://x.com/sam_paech/status/1910346895110848553

Bài viết này trích từ tài khoản công khai WeChat "Quantum Bit" , tác giả: Cressey và được 36Kr cho phép xuất bản.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan

Tiêu điểm 24h Followin

4 sự kiện kinh tế Mỹ có thể tác động đến Bitcoin trong tuần này khi thị trường theo dõi Fed

3.99%

All-in station

TPHCM khởi động Quỹ Tài sản số 1 tỉ USD, muốn trở thành “trạm trung chuyển tài chính” cho nhà đầu tư

TechFlow

Sự sụp đổ của crypto: Cộng đồng tiền điện tử kỳ cựu Yi Lihua mất 700 triệu đô la trong một tuần.

BTC

3.34%