유럽의 OpenAI, ChatGPT 기능을 모두 복사했습니다.
Mistral AI 대규모 모델 플랫폼 Le Chat에 Canvas, 온라인 검색, PDF 업로드 등 ChatGPT와 동일한 기능이 추가되었으며, 모두 무료!
3대 주류 대규모 모델 제품의 기능을 이제 한 곳에서 이용할 수 있습니다.
또한 유명 그래픽 모델 플럭스(Flux)와 협력을 공식 발표했으며, Le Chat 플랫폼에서 온라인 이미지 생성 기능을 무료로 제공합니다.
간단한 테스트 결과, 검색, 문서 요약, 그래픽 등 새로운 기능이 모두 중국어를 지원합니다.
Mistral의 CEO Arthur Mensch는 이번 새로운 Le Chat 버전이 이정표라고 말했으며, 이는 해당 플랫폼이 "더 성숙한 동물"이 되었음을 의미합니다.
ChatGPT와 동일한 기능을 무료로 사용
Mistral의 공식 플랫폼 Le Chat(프랑스어로 "고양이"를 의미)에서 ChatGPT와 동일한 기능을 무료로 제공합니다.
Mistral 공식 발표 자료에 따르면, o1과 음성 대화를 제외한 대부분의 기능이 준비되어 있습니다.
이에는 OpenAI의 최신 고급 인터페이스 Canvas도 포함되어 있는데, 현재 ChatGPT에서는 회원 전용 기능입니다.
Le Chat의 Canvas에서는 대화에서 직접 추출할 필요 없이 생성된 문서를 별도로 표시할 수 있습니다.
코드 작성 기능도 제공되며, 실시간 미리보기와 부분 코드 수정이 가능합니다.
또한 온라인 검색 기능이 있어, ChatGPT와 마찬가지로 질문에 따라 온라인 검색을 수행하고 출처 정보와 함께 요약을 제공하며, 속도도 매우 빠릅니다.
또한 현재 Le Chat는 복잡한 PDF 문서와 이미지를 처리하고 분석하며 요약할 수 있습니다. 이에는 표, 차트, 텍스트, 수식, 방정식 등의 내용이 포함됩니다.
다음 예시에서 Le Chat는 1935년 아인슈타인 등이 작성한 유명한 양자 얽힘 논문의 정보를 추출, 요약, 의미 이해를 수행했습니다.
이미지 분석 외에도 최신 Le Chat는 텍스트를 이미지로 생성하는 기능을 지원합니다. 그러나 Mistral은 자체 모델을 개발하지 않고 플럭스(Flux)와 협력하여 해당 모델을 활용하고 있습니다.
또한 대화 중에 지능형 에이전트를 생성하고 @하여 일부 작업을 수행할 수 있지만, 현재 생성 페이지는 프랑스어로만 제공됩니다.
그러나 Mistral이 현재 공개한 모델에는 음성 대화 기능이 없어, ChatGPT의 고급 음성 대화 기능은 Le Chat에 없습니다. 또한 데스크톱 클라이언트도 없습니다.
따라서 Mistral의 이번 조치는 ChatGPT 기능을 따라잡으려는 것으로 여겨지지만, 아직 완전히 따라잡지는 못했습니다. 다만 무료라는 점에서 장점이 있습니다.
대규모 멀티모달 모델 출시
Le Chat의 이미지 분석 기능은 오늘 함께 출시된 대규모 멀티모달 모델 Pixtral Large가 제공합니다.
이 모델은 1240억 개의 매개변수를 가지고 있으며, 1230억 개의 매개변수를 가진 디코더와 10억 개의 매개변수를 가진 시각 인코더로 구성되어 있습니다. 이전에 Mistral은 120억 개 매개변수의 소형 모델을 출시했습니다.
문맥 창 크기는 128k로, 최소 30장의 고해상도 이미지를 한 번에 처리할 수 있습니다.
Pixtral Large는 다국어 OCR 인식 및 추론 기능을 지원합니다.
또한 차트를 이해하고 그 안의 추세를 분석할 수 있습니다.
한편 Mistral의 CEO Arthur Mensch는 Pixtral Large 모델 개발 과정에서 전면 응용 프로그램을 고려했다고 설명했습니다.
Mistral의 성장 경험에 비추어 볼 때, 좋은 AI 경험을 만들려면 모델과 제품 인터페이스의 협력 설계가 필요하다는 것을 알게 되었습니다.
Pixtral은 이러한 좋은 사례입니다. 모델 개발 과정에서 전면 응용 프로그램을 충분히 고려했습니다.
모델 성능 측면에서 Mistral은 Pixtral Large가 현재 최고 수준의 시각 모델이라고 주장합니다.
MMMU, MathVista, ChartQA 등 6개 다양한 데이터셋에서 Pixtral Large는 제미니-1.5 Pro와 GPT-4o와 비슷하거나 더 나은 성과를 거두었으며, 클로드-3.5 소네트에 비해 월등한 우위를 보였고, 오픈소스 모델 중에서는 Llama-3.2 90B를 크게 앞섰습니다.
또한 Mistral 팀은 GPT-4o를 평가자로 사용하여 자체 개발한 MM-MT-Bench 벤치마크로 테스트했는데, 그 결과 Pixtral Large가 다른 모델들, 심지어 심판과 선수 역할을 모두 하는 GPT-4o도 앞섰습니다.
이에 대해 일부 네티즌들은 Pixtral의 성과를 보고 벤치마크가 곧 업데이트될 것이라고 말했습니다.
그러나 레딧에서 일부 사람들은 Pixtral이 실제로 최고 수준에 도달하지 못했다고 지적했습니다.
Mistral은 Pixtral과 소수의 모델만 비교했으며, 오픈소스 모델 중에서는 Llama-3.2 90B만 비교했습니다.
그러나 실제로 여러 데이터셋에서 Qwen2-VL(최대 720억 개 매개변수)의 성능이 Pixtral보다 더 뛰어났고, 일부 데이터셋에서는 Molmo(시애틀의 비영리 연
그리고 어떤 사람이 실험해 보았다고 하는데, 그가 테스트한 일본어가 포함된 이미지에서 Pixtral Large의 인식 능력이 Qwen의 7B 버전보다 좋지 않다고 합니다.
그렇다면 Mistral의 새로운 제품이 과연 잘 작동할까요?
참고 링크:
[1]https://mistral.ai/news/mistral-chat/
[2]https://mistral.ai/news/pixtral-large/
[3]https://www.reddit.com/r/LocalLLaMA/comments/1gu7cm8/mistral_large_2411_and_pixtral_large_reLease_18th/
본 기사는 WeChat 공식 계정 "量子位"에서 발췌되었으며, 36Kr의 허가를 받아 게재되었습니다.






