avatar
Sakana AI
19,138명의 트위터 팔로워
팔로우하기
We are a Tokyo-based R&D company on a quest to create a new kind of foundational AI model based on nature-inspired intelligence. https://sakana.ai/careers
포스팅
avatar
Sakana AI
01-19
스레드
RePo 소개: 컨텍스트 재배치를 지원하는 언어 모델 웹사이트: pub.sakana.ai/repo 논문: arxiv.org/abs/2512.14391 표준 언어 모델은 정보를 고정된 토큰 인덱스라는 구조적 신호만을 사용하여 엄격한 선형 시퀀스로 처리합니다. 따라서 물리적 근접성을 의미적 관련성으로 간주해야 합니다. 인지 부하 이론에 따르면 이는 비효율적입니다. 인간이 핵심 정보가 잡음에 묻혀 있을 때 어려움을 겪는 것처럼, 모델도 심층적인 추론에 집중하는 대신 정돈되지 않은 입력을 관리하는 데 제한된 용량을 낭비합니다. RePo는 모델이 컨텍스트를 능동적으로 재구성할 수 있도록 함으로써 이러한 병목 현상을 해결합니다. 고정된 인덱스를 사용하는 대신, RePo 모듈은 콘텐츠 관련성을 기반으로 위치를 할당하는 방법을 학습합니다. 이를 통해 모델은 관련성이 높은 멀리 있는 정보를 동적으로 가까이 끌어당기고 잡음을 멀리 밀어내어, 문제 구조에 맞게 주의 기하학을 효과적으로 재구성할 수 있습니다. 이러한 유연성은 견고성을 크게 향상시킵니다. RePo는 잡음이 많은 컨텍스트, 구조화된 데이터 및 장거리 종속성에서 표준 인코딩보다 우수한 성능을 보이면서도 전반적인 성능은 경쟁력 있는 수준을 유지합니다. 이는 입력 순서를 수동적으로 수용하는 대신 자체 작업 메모리를 지능적으로 관리하는 모델로 나아가는 한 걸음을 의미합니다.
-- 끝 --