메타는 현재 사용 가능한 가장 진보된 오픈소스 대규모 언어 모델인 Llama 3를 출시했습니다. 이전 버전인 Llama 2가 구축한 기반을 기반으로 하며, 다음 달 출시될 것이라는 소문을 고려하면 놀라운 소식입니다.
오픈소스 기반을 바탕으로 Llama-2는 Mixtral , Alpaca, Vicuna, WizardLM과 같은 다른 강력한 모델들의 동시 개발에 중요한 역할을 했습니다. 이제 Llama-3는 이러한 역량을 더욱 발전시켜 OpenAI의 현재 주력 AI 모델인 GPT-4와 유사한 기능을 제공할 것을 약속합니다.
메타는 목요일 출시를 "최첨단 오픈소스 대규모 언어 모델의 차세대"라고 극찬했습니다 . 메타는 자사의 역량에 대한 자신감을 바탕으로 Llama 3를 메타 AI 에 적용했으며, 이는 인스타그램, 페이스북, 왓츠앱 등 메타의 거의 모든 인기 앱 에 추가되었습니다. 일부 국가에서만 사용 가능했지만, 다른 지역의 사용자는 VPN을 통해 접속할 수 있었습니다.
Meta AI의 챗봇 인터페이스는 ChatGPT Plus와 비슷하며 무료입니다.
마크 저커버그는 페이스북 게시물을 통해 "최첨단 Llama 3 AI 모델을 오픈소스로 공개하여 Meta AI를 업그레이드하고 있습니다." 라고 밝혔습니다 . "이 새로운 모델을 통해 Meta AI는 이제 누구나 자유롭게 사용할 수 있는 가장 지능적인 AI 비서가 될 것이라고 확신합니다."
디크립트(Decrypt) 새로운 AI를 테스트하여 유료 구독 없이도 ChatGPT-Plus만큼 뛰어난 성능을 발휘한다는 것을 확인했습니다. 이미지와 애니메이션을 생성하고, 코드를 생성하며, 일관되고 상황에 맞는 답변을 제공할 수 있습니다. 새로운 챗봇은 인터넷 접속도 가능하지만, Perplexity와 같은 전문 솔루션의 역량에는 여전히 미치지 못합니다.
아마도 유일한 단점은 Llama-3의 현재 컨텍스트 창이 8,000 토큰(약 6,000단어)으로 제한되어 있다는 것입니다.
Meta는 700억 개의 매개변수를 가진 Llama-3 모델을 출시했지만, 이를 사용하려면 엄청난 컴퓨팅 파워, 아마도 GPU 한 랙 전체가 필요할 것입니다. 합성 벤치마크에 따르면, 이 모델은 제미니(Gemini) 1.5 Pro와 Claude 3 Sonnet보다 우수합니다.
소비자용 GPU에서 로컬로 실행할 수 있는 80억 개의 매개변수를 가진 모델도 있습니다. 이 모델은 다양한 합성 벤치마크에서 구글의 Gemma와 Mistral 7B를 능가합니다. 이 모델은 아직 LLM Arena에 등록되지 않았으므로, 주관적인 ELO 점수는 아직 보고할 수 없습니다.
두 모델 모두 더 낮은 비용으로 클라우드 인스턴스에서 실행할 수 있습니다.
메타는 "저희는 Llama 3를 책임감 있게 개발하는 데 전념하고 있으며, 다른 사용자들도 책임감 있게 사용할 수 있도록 다양한 리소스를 제공하고 있습니다."라고 밝혔습니다. 여기에는 Llama Guard 2, Code Shield, CyberSec Eval 2와 같은 새로운 신뢰 및 보안 도구가 포함됩니다.
메타는 향후 몇 달 안에 새로운 기능, 더 긴 컨텍스트 윈도우, 추가 모델 크기, 그리고 향상된 성능을 선보일 계획이라고 밝혔습니다. Llama 3 연구 논문도 공유될 예정입니다.
"Llama 3 기술로 구축된 Meta AI는 이제 사용자의 지능을 향상시키고 업무 부담을 덜어줄 수 있는 세계 최고의 AI 어시스턴트 중 하나로, 사용자가 학습하고, 업무를 처리하고, 콘텐츠를 제작하고, 소통하여 모든 순간을 최대한 활용할 수 있도록 도와줍니다."라고 Meta는 말했습니다.
메타는 올해 말 출시될 예정인 4,000억 개의 매개변수를 가진 대규모 모델을 훈련 중이라고 덧붙였습니다. 이 모델은 클로드 오푸스(Claude Opus)나 최신 버전인 GPT-4.5와 유사할 것으로 보이며, 현재까지 가장 강력한 오픈소스 모델이 될 수 있습니다. 만약 역사가 반복된다면, 이 모델은 전반적인 품질 면에서 라마-3(Llama-3)를 능가하는 차세대 미세 조정 모델의 기반이 될 것이며, 주요 클로즈 소스 모델들과의 경쟁을 가속화할 것입니다.
디크립트(Decrypt) 메타 AI 내부에서 Llama-3가 Zuck의 말처럼 좋은지 확인하기 위해 테스트했습니다. 숏, Llama-3는 여러 가지 주목할 만한 기능과 역량을 도입했으며, 오픈 소스 커뮤니티가 계속해서 발전해 나갈 수 있는 훌륭한 기반 모델이 될 것입니다.
콘텐츠 검토
Llama-3는 콘텐츠 관리에 대한 강력한 의지를 보여줍니다. 일반적인 탈옥 기법을 사용하더라도 유해한 인종 차별적 콘텐츠를 생성하는 것을 지속적으로 거부했습니다.
예를 들어, 모델에게 여성을 유혹하는 방법을 알려달라고 요청했을 때, 모델은 일반적이면서도 유용한 답변을 제공했습니다. 그러나 가장 친한 친구의 아내를 유혹하는 방법을 알려달라고 요청했을 때, 모델은 단호하게 답변을 거부했습니다.
이미지와 애니메이션
ChatGPT-Plus와 마찬가지로 Llama-3를 탑재한 Meta AI는 이미지를 생성할 수 있습니다. 하지만 ChatGPT나 제미니(Gemini) 에서는 제공되지 않는 애니메이션 기능을 제공하여 이 기능을 한 단계 더 발전시켰습니다.
Llama-3를 이용해 Meta AI가 생성한 이미지는 Dalle-3가 생성한 이미지보다 사실적이지만, Google의 곧 출시될 ImageFX가 생성한 이미지의 품질에는 숏 .
코딩 기능
Llama-3는 코딩에 매우 능숙한 것으로 입증되었습니다. 독특하고 제대로 설명되지 않은 게임 아이디어를 제시받았을 때, 이 모델은 두 번의 시도 끝에 필요한 파이썬 코드를 생성하여 제대로 작동하는 게임을 만들어냈습니다. 첫 번째 시도에서는 게임 제작 방법에 대한 대략적인 아이디어만 제공했지만, 파이썬으로 구현해야 한다는 점을 명확히 한 후에는 작동하는 코드를 생성했습니다.
게임은 정상적으로 작동했지만, 플레이어가 승리한 후 재시작하는 기능 등 몇 가지 사소한 세부 사항이 누락되었습니다. 하지만 다른 챗봇들도 마찬가지였습니다.
이 작업에 가장 적합한 도구는 Claude 3 Sonnet이며, 그 뒤를 Llama 3가 이었습니다. GPT-4는 3위로 떨어졌습니다. 하지만 사용자마다 결과가 다를 수 있습니다.
관심 있는 분들을 위해 Llama3, Claude, ChatGPT에서 생성된 소스 코드를 담은 페이스트빈을 공개합니다.
정치적 중립성
이 모델은 정치적 중립성을 지향하며, 이는 자본주의와 공산주의에 대한 질문에 대한 답변에서 분명히 드러납니다. 답변은 구조적으로 유사하여 각 체제에 대한 소개, 장단점을 제공했습니다.
이러한 중립적 패턴은 "남자란 무엇인가?", "여자란 무엇인가?"와 같은 질문에 대한 응답에서도 관찰되었습니다.
그럼에도 불구하고 그 반응은 약간 친자본주의적이고 좌파적입니다. 이는 대규모 언어 모델에서 가장 흔한 정치적 경향 이기 때문에 놀라운 일이 아닙니다.
논리적 추론
Llama-3는 강력한 논리적 추론 능력을 보여주었습니다. 사용자를 종종 혼란스럽게 하는 복잡한 LSAT 문제로 테스트했을 때, 이 모델은 정답을 제시할 뿐만 아니라 명확하고 합리적인 설명도 제공했습니다.
긴 프롬프트 제한
Llama-3는 많은 장점에도 불구하고 긴 프롬프트에 어려움을 겪습니다. GPT-4, Claude, Mistral과 같은 모델이 처리할 수 있는 약 1페이지 반 분량의 긴 프롬프트를 제시했을 때, 모델은 오류 메시지를 반환했습니다.
언어 이해
이 모델은 다양한 언어에 대한 뛰어난 이해력을 보여줍니다. 스페인어 슬로건을 번역해 달라고 요청했을 때, 정확한 번역을 제공했을 뿐만 아니라 슬로건을 더 잘 이해할 수 있는 맥락도 제공했습니다.
챗봇 인터페이스로서 Meta AI(Llama3 기반)는 ChatGPT Plus와 경쟁할 수 있으며 전반적으로 훌륭한 선택입니다.
좀 더 기술적인 측면에서, LLM으로서 LLama3는 다양한 시나리오에서 GPT-4와 경쟁할 만큼 충분히 우수하며, 토큰 컨텍스트 기능과 검색 증강 생성(사용자가 제공한 특정 데이터세트에서 정보를 가져오는 기능) 측면에서만 뒤처집니다. 이는 기술에 능숙한 사용자에게는 중요할 수 있지만, 일반 사용자에게는 큰 문제가 아닐 수 있습니다.
Dall-E에서 주로 ChatGPT를 사용하여 이미지를 생성하시는 경우, Llama-3의 이미지 및 애니메이션 생성 기능은 비슷하므로 구독 취소를 고려해 보시는 것이 좋습니다. 하지만 긴 프롬프트 지원이 필요한 경우, Llama-3는 최선의 선택이 아닐 수 있으며 ChatGPT-Plus를 계속 사용하는 것을 고려해 보시는 것이 좋습니다.
가끔 사용하는 사용자라면 Llama-3가 유료 멤버십 없이도 자신의 필요를 충족시켜 준다는 것을 알 수 있을 것입니다.
심도 있는 인터넷 조사가 필요한 작업의 경우 ChatGPT Plus나 Perplexity가 더 적합할 수 있습니다.
마지막으로, 코딩에 집중한다면 Llama-3가 좋은 대안이 될 수 있습니다. 물론 다른 전문 도구도 있지만요. Llama-3가 무료라는 점은 큰 장점입니다.
Ryan Ozawa 가 편집했습니다.




