Google DeepMind 는 제미니(Gemini) 2.5를 지금까지 출시한 "가장 지능적인 AI 모델"이라고 극찬했습니다.
최신 세대의 첫 번째 모델은 제미니(Gemini) 2.5 Pro의 실험 버전인데, DeepMind에 따르면 광범위한 벤치마크에서 최첨단 결과를 달성했다고 합니다.
Google DeepMind의 CTO인 코레이 카부쿠오글루에 따르면, 제미니(Gemini) 2.5 모델은 "생각하는 모델"입니다. 이는 반응을 생성하기 전에 생각을 통해 추론하는 능력을 의미하며, 이는 향상된 성능과 향상된 정확도로 이어집니다.
"추론" 능력은 단순한 분류와 예측을 넘어선다고 Kavukcuoglu는 설명합니다. 여기에는 시스템이 정보를 분석하고, 논리적 결론을 도출하고, 맥락과 뉘앙스를 통합하고, 궁극적으로 정보에 입각한 결정을 내리는 능력이 포함됩니다.
DeepMind는 강화 학습 및 사고의 사슬 촉진과 같은 기술을 사용하여 AI의 지능과 추론 능력을 향상시키는 방법을 한동안 탐구해 왔습니다. 이러한 기초 작업은 최근 첫 번째 사고 모델인 제미니(Gemini) 2.0 Flash Thinking을 도입하는 데 이르렀습니다.
Kavukcuoglu는 "이제 제미니(Gemini) 2.5를 통해"라고 말하며, "상당히 향상된 기본 모델과 개선된 사후 훈련을 결합하여 새로운 수준의 성능을 달성했습니다."라고 덧붙였습니다.
Google은 이러한 사고 능력을 모든 향후 모델에 직접 통합하여 더 복잡한 문제를 해결하고 더욱 유능하고 상황을 인식하는 에이전트를 지원할 수 있게 할 계획입니다.
제미니(Gemini) 2.5 Pro가 LMArena 리더보드 1위를 확보했습니다.
제미니(Gemini) 2.5 Pro Experimental은 복잡한 작업을 처리하기 위한 DeepMind의 가장 진보된 모델로 자리매김했습니다. 글을 쓰는 시점에서 인간의 선호도를 평가하는 주요 지표인 LMArena 리더보드에서 상당한 차이로 1위를 차지하여 고품질 스타일을 갖춘 매우 유능한 모델을 보여주었습니다.

제미니(Gemini) 2.5는 수학, 과학, 코딩 및 추론에 능숙합니다.
제미니(Gemini) 2.5 Pro는 고급 추론을 요구하는 다양한 벤치마크 에서 최첨단 성능을 입증했습니다.
특히, GPQA 및 AIME 2025와 같은 수학 및 과학 벤치마크에서 선두를 달리고 있으며, 다수결 투표와 같이 비용을 증가시키는 시험 시간 기술에 의존하지 않습니다. 또한 주제 전문가가 인간의 지식과 추론의 경계를 평가하기 위해 설계한 데이터 세트인 Humanity's Last Exam에서 최첨단 점수인 18.8%를 달성했습니다.
DeepMind는 코딩 성능에 큰 중점을 두었으며, 제미니(Gemini) 2.5는 파이프라인이 더욱 개선되어 이전 버전인 2.0에 비해 상당히 발전했습니다. 2.5 Pro는 시각적으로 매력적인 웹 애플리케이션과 에이전트 코드 애플리케이션을 만드는 데 탁월하며, 코드 변환 및 편집 기능도 뛰어납니다.
에이전트 코드 평가의 산업 표준인 SWE-Bench Verified에서 제미니(Gemini) 2.5 Pro는 사용자 지정 에이전트 설정을 사용하여 63.8%의 점수를 달성했습니다. 이 모델의 추론 기능은 단일 줄 프롬프트에서 실행 가능한 코드를 생성하여 비디오 게임을 만들 수도 있습니다.
이전 모델의 장점을 바탕으로 구축
제미니(Gemini) 2.5는 기본 멀티모달리티와 긴 컨텍스트 창을 포함하여 이전 제미니(Gemini) 모델의 핵심 강점을 기반으로 구축되었습니다. 2.5 Pro는 100만 토큰 컨텍스트 창으로 출시되었으며, 곧 200만 토큰으로 확장할 계획입니다. 이를 통해 모델은 방대한 데이터 세트를 이해하고 텍스트, 오디오, 이미지, 비디오, 심지어 전체 코드 저장소에 이르기까지 다양한 정보 소스의 복잡한 문제를 처리할 수 있습니다.
개발자와 기업은 이제 Google AI Studio에서 제미니(Gemini) 2.5 Pro를 실험할 수 있습니다. 제미니(Gemini) Advanced 사용자는 데스크톱 및 모바일 플랫폼의 모델 드롭다운을 통해 액세스할 수도 있습니다. 이 모델은 앞으로 몇 주 안에 Vertex AI 에 출시될 예정입니다.
Google DeepMind는 사용자에게 피드백을 제공하도록 권장하며, 이는 Gemini의 기능을 더욱 향상시키는 데 사용됩니다.
(사진: 안시타 나이르 )
또한 참조: DeepSeek V3-0324는 오픈 소스 최초로 비추론 AI 모델을 능가합니다.

업계 리더로부터 AI와 빅데이터에 대해 더 자세히 알아보고 싶으신가요? 캘리포니아 암스테르담과 런던에서 열리는 AI & Big Data Expo를 확인해 보세요. 이 포괄적인 이벤트는 Intelligent Automation Conference , BlockX , Digital Transformation Week , Cyber Security & Cloud Expo 를 포함한 다른 주요 이벤트와 함께 진행됩니다.
여기에서 TechForge가 제공하는 다른 기업 기술 이벤트와 웨비나를 확인해 보세요.
제미니(Gemini) 2.5: 구글이 지금까지 만들어낸 '가장 지능적인' AI 모델이 AI 뉴스 에 처음 게재되었습니다.



