새로운 AI 모델 Reka가 ChatGPT, Claude 및 Llama-3에 도전하며 무료입니다.

avatar
Decrypt
04-30
이 기사는 기계로 번역되었습니다
원문 표시

대기업을 위한 맞춤형 AI 모델 구축에 주력하는 스타트업이 텍스트, 이미지, 비디오 및 오디오 입력을 처리할 수 있는 다중 모드 언어 모델인 Reka Core의 공개 출시를 발표했습니다.

엔터프라이즈 소프트웨어 회사인 Reka AI는 Google의 DeepMind, 중국 기술 대기업 Baidu 및 Meta의 연구원들이 2022년에 설립했습니다. 이미 New York Life Ventures, Radical Ventures, Snowflake Ventures, DST Global 및 투자자 기업가 Nat Friedman을 포함한 투자자로부터 6천만 달러의 자금을 조달했습니다 .

Reka Core는 현재까지 회사의 가장 크고 가장 유능한 모델입니다. 그리고 자체 테스트를 참조한 Reka AI는 훨씬 더 크고 자금이 풍부한 많은 모델에 비해 잘 견딘다고 말합니다. 여러 합성 벤치마크 결과를 종합한 연구 논문 에서 Reka는 자사의 핵심 모델이 OpenAI, Anthropic 및 Google의 AI 도구와 경쟁할 수 있다고 주장합니다.

주요 지표 중 하나는 대규모 다분야 다중 모드 이해 및 추론 벤치마크인 MMMU입니다. 이는 인간 전문가와 비교할 수 있는 수준의 다중 모드 이해 및 추론에서 대규모 언어 모델(LLM)의 기능을 테스트하도록 설계된 데이터 세트입니다.

Reka AI는 연구 논문에서 "Core는 MMMU의 GPT-4V와 비슷하며 독립적인 제3자가 실시한 다중 모드 인간 평가에서 Claude-3 Opus를 능가하고 비디오 작업에서는 제미니(Gemini) Ultra를 능가합니다"라고 말했습니다. "언어 작업에서 Core는 잘 정립된 벤치마크에서 다른 프론티어 모델보다 경쟁력이 있습니다."

Perception-Test 벤치마크로 측정한 비디오 입력 이해 측면에서 Core는 유일한 비디오 지원 모델인 제미니(Gemini) Ultra를 능가합니다.

전반적으로 Reka Core는 다중 모드(이미지 및 비디오) 기능, 우수한 추론 능력, 코드 생성 가능 및 다국어 유창성을 갖추고 있습니다. 챗봇 인터페이스는 무료로 사용할 수 있으며, Reka Core는 API를 통해서도 사용할 수 있습니다. API 액세스의 경우 개발자는 1백만 개의 토큰마다 10달러를 지불하고 동일한 수의 출력 토큰에 대해 25달러를 지불할 것으로 예상할 수 있습니다.

그러나 모델은 긴 프롬프트로 인해 어려움을 겪습니다. Reka에 따르면 무료 버전은 효율성상의 이유로 최대 128,000개의 토큰으로 확장된 컨텍스트 토큰 4,000개만 처리합니다. OpenAI, Anthropic 및 Google의 경쟁 모델은 128,000의 표준 컨텍스트 창을 가지며 실험 버전은 최대 100만 개의 토큰을 처리합니다.

Reka Core는 몇 달에 걸쳐 수천 개의 GPU에서 처음부터 훈련되었습니다. 회사는 32개 언어의 텍스트 데이터를 사용하여 영어는 물론 여러 아시아 및 유럽 언어에도 능통하다고 말했습니다. 개발자들은 또한 110개 언어가 포함된 Wikipedia 데이터 세트에서 다국어 교육을 수집하여 많은 흔하지 않은 언어와 방언에 대한 제한된 기본 지식을 제공했다고 말합니다.

Reka Core는 무료 테스트가 가능하지만 오픈 소스는 아닙니다. Reka AI는 Snowflake, Oracle, AI Singapore 등 많은 주요 글로벌 기술 플랫폼 및 정부 기관과 협력하고 있다고 밝혔습니다.

디크립트(Decrypt) 공개 챗봇 인터페이스를 통해 Reka Core를 테스트합니다. 파란색과 보라색 하이라이트가 있는 어두운 모드 디스플레이를 사용하는 ChatGPT와 매우 유사해 보입니다.

Reka Core의 시각적 기능은 인상적이지만 ChatGPT Plus, Meta AI 또는 Google 제미니(Gemini) 와 같은 이미지를 생성할 수 없다는 점에 유의하는 것이 중요합니다.

그러나 Reka의 비전 기능은 빠르고 정확하므로 시각적 분석이 필요한 작업에 훌륭한 도구입니다.

테스트에서 Reka는 GPT-4보다 빨랐으며 무언가를 설명하라는 요청을 받았을 때와 작업에 응답하기 위해 상황에 맞게 시각적 정보를 사용할 때 모두 정확한 결과를 제공했습니다. 예를 들어 우리는 Reka에게 에펠탑 사진을 보여주고 그 도시에서 주말을 즐기기 위해 무엇을 할 수 있는지 물었습니다. Reka는 맥락을 이해하고 에펠탑을 포함하지 않고 파리에서 방문할 수 있는 장소가 포함된 여행 일정을 제공했습니다.

Reka AI는 경쟁 모델과 비교하여 자사 모델의 비자 능력이 얼마나 좋은지 잘 알고 있는 것 같습니다. 그들은 Reka, GPT-4 및 Claude 3 Opus가 제공하는 다양한 출력의 예를 보여주는 특별 쇼케이스를 만들었습니다.

Reka Core는 유능한 코딩 도우미이지만 몇 가지 제한 사항이 있습니다. Decrypt 의 테스트에서 Reka는 모든 것을 문자 그대로 받아들이기 때문에 정확한 결과를 제공하기 전에 신중한 표현이 필요했습니다. Reka가 이해할 수 있는 방식으로 설명하는 방법을 모르는 초보 사용자에게는 이것이 어려울 수 있습니다.

프롬프트가 올바르게 작성되면 Reka는 좋은 코드와 만족스러운 결과를 생성할 수 있습니다.

디크립트(Decrypt) 존재하지 않는 게임에 대한 코드를 생성하도록 모델에 요청했습니다. 첫 번째 결과는 실제로 우리가 요청한 것과 정확히 일치했음에도 불구하고 작동하지 않았습니다. 우리가 프롬프트를 더 명확하게 바꾸고 다시 표현하면 첫 번째 시도에서 기능적이지만 불완전한 코드가 생성되어 Claude 3 Opus에서 제공한 것보다 더 나은 결과를 얻었습니다.

코드 샘플은 다른 LLM에서 생성된 버전과 함께 여기에서 사용할 수 있습니다.

Reka Core에는 안전 제어 기능이 내장되어 있으며, 합법적이더라도 해롭거나 비윤리적이라고 간주되는 결과 생성을 거부합니다. 예를 들어, 친구의 연인을 유혹하기 위한 팁 제공을 거부했습니다.

테스트에서 Reka는 기본적인 탈옥 기술에 저항했으며 GPT-4, Llama-3 및 Claude와 같은 다른 모델보다 더 중립적이었습니다. 성 정체성, 정치적 이념 등 논란이 많은 주제에 대해 질문을 받았을 때 레카는 균형 잡히고 편견 없이 답변했습니다.

또 다른 예에서는 어떤 모델이 가장 좋은지 결정하라는 요청을 받았음에도 불구하고 자본주의와 사회주의에 대한 찬반 주장을 제시했습니다. 또한 여성을 정의하라는 요청을 받았을 때 Reka는 생물학적, 사회학적 요인을 모두 인식하는 상세하고 미묘한 답변을 제공했으며, 여성을 "일반적으로 다음과 관련된 생물학적, 심리적, 사회적 특성을 특징으로 하는 성인 여성 인간"으로 정의했습니다. 여성 성별.”

또한 Reka는 성 정체성의 복잡성을 인정하고 존중하고 포용적인 대응을 제공하기 위해 주의를 기울였습니다.

레카 코어의 창작 능력은 탄탄하지만 예외는 아니다.

우리는 문제를 해결하기 위해 2160년부터 1000년까지 여행한 사람에 대한 이야기를 모델에 요청하면서 우연히 시간 역설을 일으켰습니다.

Reka의 내러티브 스타일은 명확하고 매력적이며 여기저기에 멋진 설명이 풍부합니다. 그러나 이 산문은 Claude와 같은 다른 AI의 상상력 수준에는 미치지 못합니다. 줄거리도 약간 덜 익은 느낌이 들고 AI가 만든 분위기도 있습니다.

이전에 언급했듯이 Reka의 한 가지 약점은 상황에 맞는 기능이 부족하다는 것입니다. 이로 인해 긴 스토리를 생성하거나 여러 장을 통해 일관된 내러티브를 유지하기가 어려울 수 있습니다.

이 분야에서 확실한 승자는 Claude입니다. 순수한 내러티브 기술(아름다운 산문과 자신감 있는 내러티브 목소리로 몰입도 높고 감정적으로 공감하는 이야기를 만드는 능력) 측면에서 Claude는 다른 사람들보다 우위에 있습니다. 일반적으로 클로드의 산문은 훌륭한 문학적 특성을 가지고 있습니다.

Reka, Claude, ChatGPT, Mistral 및 Llama-3가 생성한 스토리 샘플은 여기에서 확인할 수 있습니다 .

레카 코어의 지식과 추론 능력은 정말 좋습니다. Decrypt의 테스트에서 Reka는 분석이 필요한 복잡한 질문을 처리할 수 있었고 몇 가지 수학적 기능을 보여주었습니다. 또한 Reka는 논리적 추론을 명확하고 간결하게 설명할 수 있었습니다.

또한 후속 질문이 모델을 기술적 한계를 넘어서지 않는 한 맥락을 잃지 않고 동일한 문제를 반복하는 후속 질문에도 좋습니다. 그런 일이 발생하면 계속해서 상호 작용하는 것이 불가능해집니다.

Reka는 또한 사용자가 API를 사용하여 AI 에이전트를 배포하는 방법을 설명하는 비디오를 게시했습니다. 이를 통해 기능을 더욱 확장하여 이 점에서 더욱 강력해질 수 있습니다.

레카코어의 언어이해력은 뛰어납니다. 테스트에서 Reka는 오류가 많더라도 텍스트를 이해할 수 있었습니다. 또한 내러티브에서 다양한 스타일과 어조를 채택할 수 있는 숙련된 교정자이기도 했습니다.

이 모델은 다양한 언어의 뉘앙스도 이해합니다. 번역의 메시지를 완전히 이해하기 위해 번역하고 상황에 맞는 프레이밍을 추출할 수도 있었습니다. 스페인어로 된 일반적인 속담을 이해하고, 적절하게 적응된 문화적 동등성을 제공하고, 그 의미를 설명했습니다.

디크립트(Decrypt) Reka Core에 깊은 인상을 받았습니다.

Reka는 출력 및 전체 작업 측면에서 Google 제미니(Gemini) 보다 우수하지만 제미니(Gemini) 2TB의 저장 공간과 Google 제품군과의 통합을 제공하므로 일부 사용자에게는 큰 이점이 됩니다.

시각적인 능력이 우선이라면 Reka는 확실히 고려해 볼 가치가 있습니다. 무료이고 빠르기 때문에 대중보다 앞서 차세대 혁신을 탐구하고자 하는 많은 AI 애호가들의 마음을 사로잡을 수 있습니다.

창의적인 글쓰기에 집중해야 한다면 Claude가 여전히 확실한 승자입니다. 그게 우선이 아니라면 클로드와 레카 사이에는 별 차이가 없다. Claude는 긴 컨텍스트 기능이 가장 뛰어나고 Reka는 뛰어난 비전 기능이 가장 좋습니다.

일반적으로 사람들이 광범위한 기능을 갖춘 고급 챗봇이 필요한 경우, Reka는 유료 서비스에 대한 월간 구독을 고려할 수 있는 사용자에게 비용을 절약할 수 있는 훌륭한 대안입니다.

스테이시 엘리엇 에 의해 편집됨.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
1
즐겨찾기에 추가
코멘트