저자: 스탠포드 HAI (스탠포드 인공지능 연구소)
편집자: Felix, PANews
스탠포드 HAI는 최근 456페이지 분량의 "2025 인공지능 지수 보고서"를 발표했습니다. AI 동향에서 얻은 주요 내용은 다음과 같습니다.
1. AI는 상상보다 훨씬 더 강력해지고 있습니다.
새로운 벤치마크인 MMMU, GPQA, SWE-bench에서는 AI 성능이 상당히 향상되었습니다. 점수는 각각 18.8%, 48.9%, 67.3% 증가했습니다. 벤치마크를 넘어, AI 시스템은 고품질 비디오 생성에 있어 상당한 진전을 이루었으며, 어떤 경우에는 대규모 언어 모델(LLM)이 시간 제한이 있는 프로그래밍 작업에서 인간을 능가하기도 했습니다.
메모:
MMMU는 대학 수준에서 다학제적 다중 모드 이해 및 추론을 위한 새롭고 신중하게 설계된 벤치마크로, 광범위한 작업에 대한 기본 모델의 전문가 수준의 다중 모드 이해 역량을 평가하는 것을 목표로 합니다.
GPQA는 다양한 분야의 전문가가 작성한 448개의 고품질의 어려운 객관식 문제를 포함하는 까다로운 데이터 세트입니다. 해당 분야에서 박사학위를 취득했거나 취득 중인 전문가는 65%의 정확도만 달성한 반면, 고도로 숙련된 비전문가 검증자는 평균 30분 이상을 소비하고 인터넷에 무제한으로 접속했음에도 불구하고 34%의 정확도만 달성했습니다.
SWE-bench는 GitHub에서 수집된 실제 소프트웨어 문제에 대한 대규모 언어 모델(LLM)의 성능을 평가하기 위한 벤치마크입니다.

2. AI는 더 효율적이고, 접근성이 뛰어나며, 저렴합니다.
매개변수가 적고 규모가 작은 AI 모델이 점점 더 강력해지고 있습니다. 불과 2년 만에 매개변수의 수는 약 100배나 줄어들었지만, 여전히 대규모 다중 작업 언어 이해(MMLU) 테스트에서 60% 이상의 성적을 거두었습니다.
오픈소스와 클로즈드소스 모델 간의 격차도 줄어들고 있으며, 일부 벤치마크에서는 성능 격차가 8%에서 1.7%로 줄었습니다.

게다가 2022년 11월부터 2024년 10월까지 GPT-3.5 수준에 도달한 시스템의 추론 비용은 280배 이상 감소했습니다. 하드웨어 수준에서 비용은 매년 30%씩 감소하고 있으며, 에너지 효율성은 매년 40%씩 향상되고 있습니다.
첨단 AI에 대한 기준이 빠르게 낮아지고 있습니다. DeepSeek와 같은 희소 모델 개발은 말할 것도 없고, 전문가 혼합(MoE) 구조에서 사용자의 질의에 답하기 위해 관련 매개변수만 활성화되어 전체적인 효율성을 높입니다.
실제로, 더 작지만 더 강력한 AI 모델이 계속해서 등장함에 따라 AI 모델 학습에 대한 요구 사항은 감소할 것이며, 비용 효율적인 분산 학습이 향후 10년 내에 주류가 될 것으로 예상됩니다. 현재 다양한 이론적 프레임 기반으로 관련 연구를 수행하는 몇몇 주요 프로젝트가 진행 중입니다.
3. AI는 일상생활에 점점 더 통합되고 있습니다.
2023년 미국 식품의약국(FDA)은 AI 지원 의료 기기를 223개 승인했는데, 이는 2015년의 6개보다 크게 증가한 수치입니다. 도로에서 자율주행 자동차는 더 이상 실험이 아닙니다. 미국 최대 사업자 중 하나인 Waymo는 매주 15만 대 이상의 자율주행 주행을 제공하고 있으며, Baidu의 Apollo Go 무인 택시 차량은 현재 중국 여러 도시에서 운행 중입니다.

4. AI에 대한 기업 투자가 크게 증가하여 기록적인 투자와 도입이 촉진되었습니다.
비즈니스에서 AI를 도입하는 추세도 가속화되고 있습니다. 2024년에는 기업의 78%가 AI를 사용할 것으로 예상되는데, 이는 전년 대비 55% 증가한 수치입니다. 동시에, AI가 생산성을 높이고 노동력 전반의 기술 격차를 해소하는 데 도움이 될 수 있다는 것을 확인하는 연구 결과가 점점 늘어나고 있습니다.
실제로 AI로 인해 고객 기대치가 기하급수적으로 높아지면서 기존 솔루션이 하룻밤 사이에 쓸모없게 되고 기존 기업은 적응할 기회가 없어지면서 제품-시장 적합성 충돌이 더 자주 발생할 것입니다.
5. 전 세계적으로 AI에 대한 정서 상승 있음에도 불구하고 아시아인들은 AI에 대해 더 낙관적입니다.
중국(83%), 인도네시아(80%), 태국(77%) 등의 국가에서는 대다수가 AI 제품과 서비스의 이점이 위험보다 크다고 생각합니다. 이와 대조적으로 캐나다(40%), 미국(39%), 네덜란드(36%)와 같은 지역에서는 정서 훨씬 낮았습니다.
그러나 이러한 태도는 변화하고 있습니다. 2022년 이후 독일(10% 증가), 프랑스(10% 증가), 캐나다(8% 증가), 영국(8% 증가), 미국(4% 증가) 등 이전에 정서 이었던 여러 국가에서 낙관론이 크게 증가했습니다.

6. 인공지능이 과학 연구에 미치는 영향력이 커지고 있으며, 과학 발전의 중요한 원동력이 되고 있다.
AI의 중요성이 커지고 있다는 것은 주요 과학상에 반영되어 있습니다. 딥 러닝(물리학) 연구와 단백질 접힘(화학)에 대한 응용 연구에 대해 노벨상 두 개가 수여되었고, 튜링상은 강화 학습에 대한 획기적인 공헌을 기리는 상이었습니다.
분명 AI는 기하급수적이고 예상치 못한 속도로 발전하고 있으며, 이는 대부분 사람들에게 매우 중요합니다. 따라서 AI 안전이 점점 더 중요해지고 있습니다. AI는 위조를 더 쉽게 만드는 반면, 암호화는 위조를 더 어렵게 만듭니다. 우리는 블록체인의 기본적인 속성(검증 가능성과 투명성)을 활용해 이 분야에서 실용적인 솔루션을 구축할 수 있는 암호화 프로젝트를 기대합니다.





