Mô hình AI mới Reka trỗi dậy để thách thức ChatGPT, Claude và Llama-3—Và nó hoàn toàn miễn phí

avatar
Decrypt
04-30
Bài viết này được dịch máy
Xem bản gốc

Một công ty khởi nghiệp tập trung vào việc xây dựng các mô hình AI tùy chỉnh cho các doanh nghiệp lớn đã công bố ra mắt công chúng Reka Core, một mô hình ngôn ngữ đa phương thức có khả năng xử lý văn bản, hình ảnh, video và âm thanh đầu vào.

Công ty phần mềm doanh nghiệp Reka AI được thành lập vào năm 2022 bởi các nhà nghiên cứu từ DeepMind của Google, gã khổng lồ công nghệ Trung Quốc Baidu và Meta. Nó đã huy động được 60 triệu đô la tài trợ từ các nhà đầu tư bao gồm New York Life Ventures, Radical Ventures, Snowflake Ventures, DST Global và nhà đầu tư doanh nhân Nat Friedman.

Reka Core là model lớn nhất và có khả năng hoạt động tốt nhất của công ty cho đến nay. Và Reka AI — tham khảo các thử nghiệm của chính mình — cho biết nó có khả năng chống chọi tốt với nhiều mô hình lớn hơn nhiều, được tài trợ tốt. Trong một bài nghiên cứu tổng hợp kết quả của một số điểm chuẩn tổng hợp, Reka tuyên bố mô hình Core của nó có thể cạnh tranh với các công cụ AI từ OpenAI, Anthropic và Google.

Một trong những số liệu chính là MMMU, tiêu chuẩn về lý luận và hiểu biết đa phương thức đa ngành quy mô lớn. Đó là tập dữ liệu được thiết kế để kiểm tra khả năng của các mô hình ngôn ngữ lớn (LLM) trong khả năng hiểu và suy luận đa phương thức ở mức độ có thể so sánh với các chuyên gia về con người.

Reka AI cho biết trong bài nghiên cứu của mình : "Core có thể so sánh với GPT-4V trên MMMU, vượt trội hơn Claude-3 Opus trong đánh giá con người đa phương thức của chúng tôi do bên thứ ba độc lập thực hiện và vượt qua Gemini Ultra về các tác vụ video". "Về nhiệm vụ ngôn ngữ, Core có khả năng cạnh tranh với các mô hình hàng đầu khác dựa trên các tiêu chuẩn đã được thiết lập rõ ràng."

Khi nói đến khả năng hiểu đầu vào video, được đo bằng điểm chuẩn Kiểm tra nhận thức, Core đánh bại Gemini Ultra, mẫu máy duy nhất có khả năng quay video khác.

Nhìn chung, Reka Core có khả năng đa phương thức (hình ảnh và video), khả năng suy luận tốt, có thể tạo mã và thông thạo đa ngôn ngữ. Giao diện chatbot được sử dụng miễn phí và Reka Core cũng có sẵn thông qua API. Để truy cập API, nhà phát triển có thể phải trả 10 USD cho mỗi 1 triệu token và 25 USD cho cùng số lượng token đầu ra.

Tuy nhiên, mô hình này gặp khó khăn với những lời nhắc dài dòng. Theo Reka, phiên bản miễn phí của nó chỉ xử lý 4.000 mã thông báo ngữ cảnh vì lý do hiệu quả—với ngữ cảnh mở rộng lên tới 128.000 mã thông báo. Các mô hình cạnh tranh từ OpenAI, Anthropic và Google có cửa sổ ngữ cảnh tiêu chuẩn là 128.000 với các phiên bản thử nghiệm xử lý lên tới 1 triệu mã thông báo.

Reka Core đã được đào tạo từ đầu trên hàng nghìn GPU trong vài tháng. Công ty cho biết họ đã sử dụng dữ liệu văn bản từ 32 ngôn ngữ, khiến nó thông thạo tiếng Anh cũng như một số ngôn ngữ châu Á và châu Âu. Các nhà phát triển của nó cho biết họ cũng đã áp dụng một số khóa đào tạo đa ngôn ngữ từ bộ dữ liệu Wikipedia chứa 110 ngôn ngữ, khiến kiến ​​thức cơ bản về nhiều ngôn ngữ và phương ngữ không phổ biến bị hạn chế.

Reka Core có sẵn để thử nghiệm miễn phí nhưng không phải là nguồn mở. Reka AI cho biết họ đang hợp tác với nhiều nền tảng công nghệ hàng đầu thế giới và các tổ chức chính phủ như Snowflake, Oracle và AI Singapore.

Decrypt đưa Reka Core vào thử nghiệm, thông qua giao diện chatbot công khai . Nó trông khá giống với ChatGPT, sử dụng màn hình chế độ tối với các điểm nổi bật màu xanh lam và tím.

Khả năng trực quan của Reka Core rất ấn tượng, nhưng điều quan trọng cần lưu ý là nó không thể tạo ra các hình ảnh như ChatGPT Plus, Meta AI hoặc Google Gemini.

Tuy nhiên, khả năng quan sát của Reka rất nhanh và chính xác, khiến nó trở thành một công cụ tuyệt vời cho các nhiệm vụ yêu cầu phân tích trực quan.

Trong thử nghiệm của chúng tôi, Reka nhanh hơn GPT-4 và cung cấp kết quả chính xác—cả khi được yêu cầu mô tả điều gì đó và khi sử dụng thông tin hình ảnh theo ngữ cảnh để phản hồi một nhiệm vụ. Ví dụ: chúng tôi cho Reka xem một bức ảnh về Tháp Eiffel và hỏi nó xem chúng tôi có thể làm gì để tận hưởng một ngày cuối tuần ở thành phố đó. Reka hiểu bối cảnh và cung cấp cho chúng tôi hành trình với các địa điểm tham quan ở Paris—không bao gồm Tháp Eiffel.

Reka AI dường như nhận thức rõ về khả năng thị giác của mô hình của họ so với đối thủ cạnh tranh. Họ đã xây dựng một khu trưng bày đặc biệt về các ví dụ về các đầu ra khác nhau do Reka, GPT-4 và Claude 3 Opus cung cấp.

Reka Core là một trợ lý mã hóa có khả năng nhưng nó có một số hạn chế. Trong thử nghiệm của Decrypt , Reka yêu cầu dùng từ ngữ cẩn thận trước khi đưa ra kết quả chính xác, vì nó diễn đạt mọi thứ theo đúng nghĩa đen. Điều này có thể là thách thức đối với những người dùng mới chưa biết cách giải thích mọi thứ theo cách mà Reka có thể hiểu được.

Khi lời nhắc được diễn đạt chính xác, Reka có thể tạo mã tốt và kết quả khả quan.

Decrypt yêu cầu mô hình tạo mã cho một trò chơi không tồn tại. Kết quả đầu tiên không hoạt động—mặc dù nó thực sự viết chính xác những gì chúng tôi yêu cầu. Khi chúng tôi nói rõ hơn và diễn đạt lại lời nhắc của mình, nó đã tạo ra mã có chức năng nhưng không hoàn hảo trong lần thử đầu tiên, với kết quả tốt hơn mã do Claude 3 Opus cung cấp.

Mẫu mã có sẵn tại đây — cùng với các phiên bản do LLM khác tạo ra.

Reka Core có các biện pháp kiểm soát an toàn tích hợp và từ chối tạo ra các kết quả được coi là có hại hoặc phi đạo đức, ngay cả khi chúng hợp pháp. Ví dụ: nó từ chối cung cấp mẹo để quyến rũ bạn tình của một người bạn.

Trong thử nghiệm của chúng tôi, Reka chống lại các kỹ thuật bẻ khóa cơ bản và trung tính hơn các mẫu khác như GPT-4, Llama-3 và Claude. Khi được hỏi về các chủ đề gây tranh cãi như bản dạng giới và hệ tư tưởng chính trị, Reka đã đưa ra những câu trả lời cân bằng và không thiên vị.

Trong một ví dụ khác, nó đưa ra những lý lẽ ủng hộ và chống lại chủ nghĩa tư bản và chủ nghĩa xã hội – mặc dù nó được yêu cầu quyết định xem mô hình nào là tốt nhất. Ngoài ra, khi được yêu cầu định nghĩa một người phụ nữ, Reka đã đưa ra một câu trả lời chi tiết và sắc thái công nhận cả yếu tố sinh học và xã hội học, cụ thể trong việc định nghĩa một người phụ nữ là “một con người nữ trưởng thành, được đặc trưng bởi các thuộc tính sinh học, tâm lý và xã hội thường gắn liền với giới tính nữ.”

Ngoài ra, Reka còn cẩn thận thừa nhận sự phức tạp của bản dạng giới và đưa ra phản hồi tôn trọng và toàn diện.

Khả năng viết sáng tạo của Reka Core rất ổn nhưng không có gì nổi bật.

Chúng tôi yêu cầu người mẫu tạo ra một câu chuyện về một người du hành từ năm 2160 đến năm 1000 để khắc phục một sự cố nhưng vô tình gây ra nghịch lý thời gian.

Phong cách kể chuyện của Reka rõ ràng và hấp dẫn, với một số chi tiết mô tả thú vị chỗ này chỗ kia. Tuy nhiên, văn xuôi không hoàn toàn đạt tới đỉnh cao giàu trí tưởng tượng của những AI khác như Claude. Cốt truyện cũng có cảm giác thiếu sáng tạo và mang cảm giác do AI tạo ra.

Như đã lưu ý trước đó, một điểm yếu của Reka là thiếu khả năng xử lý theo ngữ cảnh, điều này có thể gây khó khăn cho việc tạo ra những câu chuyện dài hoặc duy trì một câu chuyện mạch lạc qua các chương khác nhau.

Trong lĩnh vực này, người chiến thắng rõ ràng là Claude. Xét về kỹ năng tường thuật thuần túy — khả năng tạo ra một câu chuyện hấp dẫn, gây được tiếng vang về mặt cảm xúc với lối văn xuôi hay và giọng kể chuyện tự tin — Claude vượt trội so với những người khác. Nhìn chung, văn xuôi của Claude có chất lượng văn học tuyệt vời.

Bạn có thể tìm thấy mẫu câu chuyện do Reka, Claude, ChatGPT, Mistral và Llama-3 tạo ra tại đây .

Kiến thức và khả năng suy luận của Reka Core thực sự rất tốt. Trong thử nghiệm của Decrypt , Reka có thể xử lý các câu hỏi phức tạp cần phân tích và nó đã thể hiện một số khả năng toán học. Ngoài ra, Reka còn có thể giải thích lý luận logic của nó một cách rõ ràng và ngắn gọn.

Nó cũng rất hữu ích trong việc trả lời các câu hỏi tiếp theo, lặp lại cùng một vấn đề mà không làm mất bối cảnh—miễn là các câu hỏi tiếp theo không đẩy mô hình vượt quá giới hạn kỹ thuật của nó. Nếu điều đó xảy ra, bạn sẽ không thể tiếp tục tương tác với nó.

Reka cũng xuất bản một video giải thích cách người dùng có thể triển khai các tác nhân AI bằng API của nó, điều này có thể mở rộng hơn nữa khả năng của nó, khiến nó trở nên mạnh mẽ hơn về mặt này.

Khả năng hiểu ngôn ngữ của Reka Core rất tuyệt vời. Trong thử nghiệm của chúng tôi, Reka có thể hiểu văn bản ngay cả khi nó có nhiều lỗi. Nó cũng là một người hiệu đính khéo léo, có thể áp dụng các phong cách và giọng điệu khác nhau trong một câu chuyện.

Mô hình cũng hiểu được các sắc thái trong các ngôn ngữ khác nhau. Nó có thể vừa dịch vừa trích xuất khung ngữ cảnh để hiểu đầy đủ thông điệp của bản dịch. Nó hiểu một câu nói phổ biến bằng tiếng Tây Ban Nha, cung cấp cho chúng ta từ tương đương về mặt văn hóa được điều chỉnh phù hợp và giải thích ý nghĩa của nó.

Decrypt khá ấn tượng với Reka Core.

Reka tốt hơn Google Gemini về kết quả đầu ra và công việc tổng thể, nhưng Gemini cung cấp 2TB dung lượng lưu trữ và tích hợp với bộ sản phẩm của Google—một lợi ích lớn đối với một số người dùng.

Nếu khả năng trực quan được ưu tiên thì Reka chắc chắn đáng được cân nhắc. Vì nó vừa miễn phí vừa nhanh chóng nên nó có thể chiếm được cảm tình của nhiều người đam mê AI đang mong muốn khám phá điều lớn lao tiếp theo trước đại chúng.

Nếu bạn cần tập trung vào việc viết sáng tạo, Claude vẫn là người chiến thắng rõ ràng. Nếu đó không phải là ưu tiên hàng đầu thì không có nhiều khác biệt giữa Claude và Reka. Claude tốt nhất nhờ khả năng bối cảnh dài và Reka tốt nhất nhờ khả năng tầm nhìn vượt trội.

Nói chung, nếu mọi người cần một chatbot nâng cao với phạm vi khả năng rộng, thì Reka là một lựa chọn thay thế tuyệt vời để tiết kiệm tiền cho những người dùng có thể cân nhắc đăng ký dịch vụ trả phí hàng tháng.

Được chỉnh sửa bởi Stacy Elliott .

Nguồn
Tuyên bố từ chối trách nhiệm: Nội dung trên chỉ là ý kiến của tác giả, không đại diện cho bất kỳ lập trường nào của Followin, không nhằm mục đích và sẽ không được hiểu hay hiểu là lời khuyên đầu tư từ Followin.
Thích
1
Thêm vào Yêu thích
Bình luận