GPT-4.1 được bí mật tung ra để thử nghiệm? Mô hình bí ẩn đứng đầu danh sách lập trình, cộng đồng đào sâu vào OpenAI, cư dân mạng: thiên tài tiếp thị lại xuất hiện

04-11

Bài viết này được dịch máy

Xem bản gốc

Gần đây, một mô hình AI bí ẩn có tên "Quasar Alpha" với nguồn gốc không rõ đã được ra mắt một cách âm thầm và nhanh chóng trở thành mô hình AI về lập trình máy tính có lượng sử dụng cao nhất trên nền tảng thứ ba OpenRouter (một nền tảng dịch vụ cung cấp giao diện thống nhất để truy cập nhiều mô hình ngôn ngữ AI), thậm chí được đánh giá là "tốt hơn bất kỳ mô hình nào hiện có". Điều còn ngạc nhiên hơn là nhiều người dùng và nhà nghiên cứu đã phát hiện từ các chi tiết kỹ thuật rằng Quasar Alpha rất có thể là phiên bản mới của OpenAI.

Địa chỉ trải nghiệm: https://www.quasar-alpha.org/

Theo hiểu biết, Quasar Alpha được giới thiệu cách đây vài ngày, có cửa sổ ngữ cảnh 100 nghìn token, có thể xử lý văn bản siêu dài và tài liệu phức tạp, khả năng tạo mã xuất sắc, khả năng tuân thủ lệnh mạnh mẽ, hỗ trợ chức năng kết nối mạng và đa phương thức, và hoàn toàn miễn phí. Và sau khi Quasar Alpha gây ra cuộc thảo luận sôi nổi trong cộng đồng AI, một mô hình bí ẩn khác là Optimus Alpha cũng được giới thiệu vào hôm qua, cũng miễn phí và mở, một lần nữa làm bùng cháy sự chú ý của mọi người.

Thông tin được công bố hiện tại

Theo thông báo dự án công khai, Quasar Alpha là một mô hình chung được ngụy trang được cung cấp cho cộng đồng, với mục đích thu thập ý kiến phản hồi. Tất cả các lời nhắc và nội dung được tạo ra bởi mô hình này sẽ được nhà cung cấp ghi lại và có thể được sử dụng để cải thiện mô hình.

Địa chỉ dự án: https://openrouter.ai/openrouter/quasar-alpha

Điểm nổi bật của Quasar Alpha nằm ở khả năng xử lý ngữ cảnh siêu dài. Độ dài ngữ cảnh 100 nghìn token có nghĩa là mô hình có thể xử lý một lượng thông tin tương đương với hàng trăm trang tài liệu, tính năng này mang lại lợi thế đáng kể trong các nhiệm vụ chuỗi dài, đặc biệt là trong các kịch bản yêu cầu hiểu sâu và suy luận phức tạp.

Hơn nữa, mô hình này được tối ưu hóa đặc biệt cho các nhiệm vụ mã hóa, có thể tạo ra mã chất lượng cao một cách hiệu quả, nhưng mục tiêu thiết kế ban đầu vẫn là một công cụ AI đa năng, phù hợp cho các ứng dụng đa dạng từ tạo văn bản đến phân tích dữ liệu. Thiết kế kết hợp giữa tính chuyên nghiệp và tính rộng rãi này đang giúp Quasar Alpha nổi bật giữa nhiều mô hình AI, với số lượng trường hợp sử dụng liên tục gia tăng.

Từ trang tổng quan, mô hình này đang nhanh chóng thu hút sự chú ý, hiện đã vào top 10 trong năm danh mục trường hợp sử dụng chính. Theo số liệu thống kê do OpenRouter cung cấp, các ứng dụng nổi tiếng sử dụng Quasar Alpha bao gồm Roo Code và Cline, đều là các tiện ích mở rộng VS Code dựa trên AI để mã hóa, điều này cũng cho thấy Quasar Alpha là một mô hình khá ổn định và đáng tin cậy.

Một mô hình bí ẩn khác, Optimus Alpha, cũng có cửa sổ ngữ cảnh 100 nghìn token và khả năng mã hóa xuất sắc. Điểm khác biệt là Optimus Alpha được tối ưu hóa cho các nhiệm vụ chung, phù hợp với các ứng dụng trong thế giới thực. Và hiện tại, Optimus Alpha cũng đã được nhiều ứng dụng nổi tiếng sử dụng.

Địa chỉ dự án: https://openrouter.ai/openrouter/optimus-alpha

Đáng chú ý là Optimus Alpha đã cung cấp một API tương thích với OpenAI cho hơn 300 mô hình và nhà cung cấp, người dùng có thể gọi trực tiếp hoặc sử dụng bộ công cụ phát triển phần mềm của OpenAI để gọi. Ngoài ra, còn có một số bộ công cụ phát triển phần mềm của bên thứ ba có thể được sử dụng.

Nhiều manh mối chỉ về nguồn gốc từ OpenAI

Tuy nhiên, tính bí ẩn của Quasar Alpha và Optimus Alpha cũng đã gây ra một số nghi vấn trong cộng đồng AI. Nguồn gốc cụ thể của chúng vẫn chưa rõ, có người đoán rằng chúng có thể là dự án thử nghiệm của một công ty công nghệ lớn (như OpenAI hoặc Google), thậm chí có thể là phiên bản thử nghiệm của mô hình hàng đầu thế hệ tiếp theo.

(Phần còn lại của bản dịch tương tự, tuân thủ các quy tắc dịch như trên)

Đối với những người hành nghề và doanh nhân quan tâm đến lĩnh vực AI, câu hỏi "Ai là mô hình ngôn ngữ mạnh nhất" chắc chắn là một vấn đề quan trọng đáng khám phá. Một người trải nghiệm mô hình tên Austin Starks sau khi thử nghiệm thủ công Optimus Alpha và Quaser Alpha trong một thời gian đã cho biết, đối với các nhiệm vụ tạo truy vấn SQL phức tạp, hai mô hình bí ẩn do OpenRouter xây dựng này không nghi ngờ gì là lựa chọn mạnh nhất trên thị trường hiện nay về hiệu suất PURE và độ chính xác.

Từ dữ liệu được công bố, Optimus Alpha và Quasar Alpha không chỉ hoàn toàn khả dụng mà còn vượt xa các mô hình cổ điển khác. Điểm trung bình của Optimus Alpha đạt 0,83, trong khi điểm trung bình của Claude 3.7 Sonnet chỉ là 0,66. Còn Gemini 2.0 Flash và Grok 3, điểm số của chúng lần lượt chỉ là 0,717 và 0,747. Hơn nữa, các chỉ báo khác của chúng, như tỷ lệ thành công (tức là mô hình có hoàn thành hay không) cũng đứng đầu. Quan trọng hơn, hai mô hình này hoàn toàn miễn phí.

So sánh hiệu suất của các mô hình AI hàng đầu trong việc tạo truy vấn SQL

Cụ thể, anh ấy đã thử nghiệm sử dụng mô hình lớn để xử lý tính phức tạp và nhiễu của thị trường chứng khoán. Như hình minh họa, là cách sử dụng mô hình lớn để trả lời các câu hỏi như "Trong số các cổ phiếu của các doanh nghiệp có giá trị vốn hóa thị trường trên 200 tỷ đô la, những cổ phiếu nào có chỉ số RSI thấp nhất?". Quy trình cụ thể như sau: mô hình lớn chuyển đổi câu hỏi ngôn ngữ tự nhiên thành truy vấn cơ sở dữ liệu; thực thi truy vấn trên cơ sở dữ liệu; mô hình lớn khác "chấm điểm" đầu ra và đảm bảo kết quả hợp lý; liên tục tạo truy vấn cho đến khi kết quả chính xác.

Để đánh giá các mô hình, anh ấy đã sử dụng EvaluateGPT mã nguồn mở để thử nghiệm, thông qua một bộ 40 câu hỏi tài chính có thể thấy hiệu suất xử lý trung bình của các mô hình, kết quả hoàn toàn ngoài dự đoán. Trong nhiệm vụ này, các mô hình Quaser Alpha và Optimus Alpha đã vượt xa tất cả các mô hình khác, Optimus Alpha cũng trở thành một trong những mô hình nhanh nhất.

Về chi phí, Quaser Alpha và Optimus Alpha đều miễn phí đầu vào và đầu ra, còn mô hình có chi phí thấp thứ hai là Gemini 2.0 Flash, với chi phí 0,10 đô la mỗi triệu token đầu vào và 0,40 đô la mỗi triệu token đầu ra.

Starks cho rằng, so với các đối thủ cạnh tranh vẫn đang tính phí theo token, những mô hình "ẩn dật" này đang định nghĩa lại khả năng không có chi phí. Mặc dù tình hình sau này có thể thay đổi, nhưng các mô hình không bị giới hạn này hiện tại quả thực có thể được sử dụng tùy ý.

Liên kết tham khảo:

https://blog.kilocode.ai/p/quasar-alpha-what-we-know-thus-far

https://medium.com/@austin-starks/there-are-new-stealth-large-language-models-coming-out-thats-better-than-anything-i-ve-ever-seen-19396ccb18b5

https://prompt.16x.engineer/blog/quasar-alpha-openai-stealth-model

https://www.theverge.com/news/646458/openai-gpt-4-1-ai-model

Bài viết này đến từ trang WeChat "AI tiền tuyến", được tổng hợp bởi Hoa Vệ, Hạt Nhân Cola, được 36kr ủy quyền đăng tải.

Nguồn

Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.

Thích

Thêm vào Yêu thích

Bình luận

Chia sẻ

Nội dung liên quan