데이터를 자동으로 검색하고, 분석 보고서를 작성하고, 전문적인 재무 차트를 생성할 수 있는 AI 금융 분석가가 등장했습니다!
최근 중국 인민대학교 가오링 인공지능대학은 실제 금융 투자 연구 시나리오를 위한 멀티모달 연구 보고서 생성 시스템 인 Yulan-FinSight를 제안했습니다.
FinSight는 사용자의 연구 요구를 대면 작업을 자동으로 분할하고, 인터넷 및 금융 데이터베이스에서 주가, 재무 보고서, 뉴스 등 다양한 소스의 이질적인 데이터를 수집하여 "개발 역사", "핵심 업무 아키텍처", "경쟁 환경"과 같은 장으로 구성된 10,000단어 분량의 그래픽 보고서를 생성할 수 있습니다.
△
이 시스템은 AFAC 2025 금융 정보 혁신 경진대회 챌린지 그룹 에서 1,289개 팀 중 1위를 차지했으며, 여러 평가에서 GPT-5 w/Search, OpenAI Deep Research 및 Gemini-2.5-Pro Deep Research를 능가하여 인간 전문가에 버금가는 금융 분석 및 문서 작성 능력을 입증했습니다.
자세한 내용은 아래를 참조하십시오.
범용 인공지능은 왜 제대로 된 금융 연구 보고서를 작성하지 못하는 걸까요?
연구원들은 핵심 문제는 모델이 "글을 쓸 수 없다"는 것이 아니라, 금융 산업의 연구 보고서가 고도로 구조화되고 논리적으로 엄밀하며 시각적으로 매력적인 전문가 수준의 작업으로 여러 프로세스를 포함한다는 점이라고 생각합니다.
일반적인 질문 답변, 검색 또는 텍스트 생성 작업과 비교했을 때, 금융 투자 연구는 데이터 통합 기능, 분석 깊이 및 표현 형식에 대한 더 높은 요구 사항을 제시합니다.
구체적으로, 기존의 범용 AI 시스템은 주로 세 가지 과제에 직면해 있습니다.
1. 전문 지식과 데이터 간의 단절:
범용 검색 시스템은 주가 및 재무제표와 같은 정형화된 금융 데이터와 뉴스 및 공시와 같은 비정형 정보를 효과적으로 통합하는 데 어려움을 겪습니다. 통합된 데이터 표현 방식과 다중 에이전트 협업 분석 메커니즘의 부재로 인해 이러한 시스템은 종종 단일 정보 소스에 대해 피상적인 처리만 수행하여 체계적인 금융 통찰력을 도출하기 어렵습니다.
2. 전문가 수준의 시각화 기능 부족:
금융 연구 보고서는 방대한 정보를 전달하기 위해 차트에 크게 의존하지만, 기존 모델은 정적인 이미지나 단순한 선 그래프만 생성할 수 있어 다차원 비교나 사건 주석과 같은 전문적인 금융 시각화 요구 사항을 충족하기 어렵습니다. 또한, 텍스트와 차트 간의 데이터 일관성 제약이 미흡하여 관련 없는 텍스트와 차트가 함께 표시되거나, 모순되거나 상충되는 정보가 나타나는 문제가 있습니다.
3. "반복적 연구" 역량 부족:
대부분의 시스템은 여전히 "먼저 검색하고 나중에 생성"하는 고정된 프로세스를 사용하며, 일단 연구 경로가 결정되면 조정하기 어렵습니다.
반면, 인간 분석가는 중간 결과를 바탕으로 연구 초점을 조정하는 경향이 있으며, 이처럼 중간 결과에 따라 전략을 역동적으로 조정하는 능력은 기존의 일반 인공지능 시스템이 일반적으로 부족한 부분입니다.
FinSight의 핵심 아이디어: 금융 분석가처럼 일하세요
이러한 한계를 극복하기 위해 FinSight는 단순히 "모델을 쌓아 올리는" 방식이 아니라, 인지 프로세스에서 출발하여 인간 금융 전문가의 업무 방식을 시뮬레이션하고 세 가지 핵심 기술 혁신을 제안했습니다.
핵심 아키텍처: 코드 기반, 가변 메모리 지능형 에이전트 아키텍처
△
FinSight는 핵심에 CAVM (Code-Driven Variable-Memory )이라는 혁신적인 멀티 에이전트 아키텍처를 사용합니다.
그림에서 볼 수 있듯이, 기존 에이전트 아키텍처는 여전히 본질적으로 대화형 메모리 패러다임에 의해 제한됩니다. 이 패러다임은 메시지나 작업 진행 상황과 같은 이력을 상태 전달자로 사용합니다. 이러한 패러다임은 작업 복잡성과 처리 시간이 증가함에 따라 표현력과 제어 가능성 측면에서 구조적 병목 현상을 드러내기 쉽습니다.
CAVM은 이러한 패러다임을 코드 기반 변수 메모리 공간으로 재구성합니다. 이 시스템은 더 이상 자연어 대화를 협업 매체로 사용하지 않고, 데이터, 도구 및 중간 추론 결과를 읽고 쓸 수 있는 프로그램 변수에 매핑합니다. 여러 코드 에이전트가 이 변수 공간을 공유하여 협업 추론을 완료합니다.
CAVM은 "메모리"를 메시지 시퀀스에서 작동 가능한 변수 구조로 승격시킴으로써 복잡한 작업을 명시적으로 모델링하고, 지속적으로 수정하고, 모듈 결합할 수 있도록 하여 장기적인 다중 프로세스 전문가 수준 추론에 필요한 구조적 지원을 제공합니다.
△
이 설계에서는 데이터, 도구 및 에이전트가 프로그래밍 가능한 변수 공간으로 균일하게 추상화됩니다.
재무제표, 시장 데이터 및 뉴스 텍스트를 데이터 변수로 사용
검색, 분석 및 그래프 작성 기능은 도구 변수로 사용됩니다.
서로 다른 기능을 가진 에이전트들은 파이썬 코드를 통해 스케줄링되고 협업합니다.
이러한 "코드 중심" 설계는 시스템이 대규모의 이기종 금융 데이터를 효율적으로 처리하고 복잡한 다중 프로세스 작업 협업을 지원할 수 있도록 합니다.
시각적 혁신: 반복적 시각적 향상 메커니즘
금융 차트 생성에서 흔히 발생하는 전문성과 신뢰성 문제를 해결하기 위해 연구자들은 차트 작성 과정을 반복적으로 최적화되는 시각적 생성 문제로 모델링하는 반복적 시각 강화 메커니즘(Iterative Vision-Enhanced Mechanism)을 제안했습니다.
△
이 메커니즘은 행위자-비평가 협업 패러다임을 채택합니다.
텍스트 모델은 액터(Actor) 역할을 하며 컴파일 및 실행 가능한 드로잉 코드를 생성하는 책임을 맡고, 코드 생성 및 논리 제어 측면에서 자체적인 장점을 최대한 활용합니다. 반면 시각 언어 모델은 크리틱(Critic) 역할을 하며 이미지를 시각적 관점에서 직접 검사하여 데이터 무결성 및 전반적인 미적 요소와 같은 측면에 대한 피드백을 제공합니다.
이 설계의 핵심은 상호 보완적인 강점 에 있습니다. 언어 모델은 인코딩과 사고에는 탁월하지만 현실적인 시각적 피드백을 얻는 데 어려움을 겪습니다. 시각 모델은 강력한 지각 및 변별 능력을 갖추고 있지만 복잡한 코드를 생성하는 데는 한계가 있습니다.
두 단계를 분리하여 폐쇄 루프에 배치함으로써, 시스템은 테스트 시간 동안 여러 차례의 "생성-평가-수정" 과정을 통해 지속적으로 자체 최적화를 수행하므로, 그림 품질은 반복 횟수가 증가함에 따라 자연스럽게 향상됩니다.
△
궁극적으로 이 시스템은 그림에서 보는 바와 같이 이중 축 정렬, 이벤트 주석 및 복잡한 구조를 포함하는 전문적인 재무 차트를 안정적으로 생성할 수 있으며, 기존에 한 번에 생성되던 정적인 결과를 테스트 시간 내에 확장 가능한 프로세스로 전환합니다.
2단계 글쓰기 프레임: 먼저 분석하고, 그 다음 글을 쓴다.
FinSight는 글쓰기 단계에서 한 번에 완벽한 장문의 연구 보고서를 작성하려고 시도하는 대신, 연구 보고서 작성 과정을 "분석-통합" 이라는 두 단계 프로세스로 재구성합니다.
△
먼저, 시스템은 "분석 사슬(Chain-of-Analysis, CoA)" 세트를 생성합니다. 각 분석 사슬은 특정 하위 작업(예: 회사 연혁, 재무 분석, 경쟁사 분석, 리스크 요소 등)에 해당하며, 이를 통해 특정 범위 내에서 증거 수집, 핵심 판단 및 주요 결론 추출을 완료합니다.
이 단계는 연구 보고서가 종종 서로 연관된 여러 하위 문제로 구성되기 때문에 필수적입니다. 긴 논문을 처음부터 끝까지 직접 작성할 경우 모든 분석의 정확성과 깊이를 보장하기 어렵습니다.
이후 시스템은 이러한 CoA를 "골격"으로 사용하여 전역 수준에서 흩어진 통찰력을 정리하고, 개요를 생성하고, 각 장을 하나씩 작성합니다. 이때 장 구조와 논증의 일관성을 보장하면서 텍스트 설명, 데이터 인용 및 차트 표현을 정렬하고, 최종적으로 논리적으로 일관된 장문의 보고서로 종합합니다.
"먼저 분석하고 나서 글을 쓰는" 이 전략은 긴 글에서 흔히 발생하는 논리적 허점을 효과적으로 방지하여, 2만 단어가 넘는 보고서라도 구조적으로 명확하고 심도 있는 논증을 담을 수 있도록 해줍니다.
저자들은 장문의 연구 보고서에서 사실의 정확성을 더욱 확보하고 텍스트와 그래픽 간의 일관성을 유지하기 위해 작성 단계에서 생성적 검색 메커니즘을 도입했습니다.
기존의 "먼저 검색한 다음 생성하는" 후처리 방식과는 달리, 이 방법은 검색 과정을 글쓰기 자체에 통합합니다. 특정 단락을 생성할 때, 모델은 현재 분석 과정과 글쓰기 맥락을 기반으로 데이터와 이미지에 대한 인덱스 식별자를 동적으로 생성한 다음, 후처리를 통해 이를 균일하게 통합합니다.
이러한 방식으로 인용의 정확성과 텍스트와 이미지 간의 일관성이 최대한 보장됩니다.
△
이러한 방식으로 FinSight는 장문의 보고서 작성 과정에서 텍스트 내용, 데이터 소스 및 시각화 결과를 지속적으로 정렬하여 사실 불일치나 텍스트와 그래픽 간의 단절과 같은 일반적인 문제를 방지할 수 있습니다. 결과적으로 보고서의 길이가 계속 늘어나더라도 전체적인 논리와 증거의 연결 고리의 안정성과 일관성을 유지할 수 있습니다.
실험 결과: 기존 심층 연구 시스템을 완전히 능가함
저자들은 기업 및 산업 연구를 모두 포괄하는 고품질 벤치마크를 기반으로 FinSight에 대한 체계적인 평가를 수행했습니다.
결과에 따르면 FinSight는 사실 정확도, 분석 깊이, 표현 품질이라는 세 가지 핵심 지표 모두에서 Gemini-2.5-Pro Deep Research 및 OpenAI Deep Research를 크게 능가하며 종합 점수 8.09점을 달성했습니다.
시각화 측면에서 FinSight는 반복적인 시각적 향상 메커니즘 덕분에 9.00 점이라는 높은 점수를 획득하여 비교 시스템을 크게 능가했으며, 전문적인 금융 차트를 생성하는 능력이 효과적으로 향상되었음을 입증했습니다.
반복적인 그래프 분석 결과 또한 마찬가지로 인상적입니다.
긴 텍스트 생성 시나리오에서 시스템이 생성하는 연구 보고서는 평균 길이가 20,000단어가 넘고 50개 이상의 차트와 구조화된 데이터 참조를 포함하며, 보고서 길이가 늘어나더라도 품질 저하 없이 안정적으로 유지됩니다.
또한 FinSight는 AFAC 2025 금융 정보 혁신 경진대회에서 기업 및 대학 소속 1,289개 참가팀 중 4번째 도전 과제 그룹 문제에서 1위를 차지하며 실제 시나리오에서의 실용성과 견고성을 더욱 입증했습니다.
연구원들은 FinSight가 단순한 금융 도구가 아니라, 매우 복잡한 수직적 분야에서 에이전트 아키텍처의 잠재력을 보여주는 사례라고 믿습니다.
데이터, 도구, 지능형 에이전트를 통합하고 시각 및 글쓰기의 다단계 폐쇄 루프를 도입함으로써, 이 AI 시스템은 금융 투자 연구와 같이 전문가의 전문성이 요구되는 시나리오에서 최초로 인간에 가까운 분석가 능력을 입증했습니다.
이 패러다임의 중요성은 금융 분야를 넘어 더 넓은 범위에 걸쳐 있습니다.
이는 전문 지식, 장기적인 추론, 다중 모드 표현에 크게 의존하는 "전문가 집약적" 시나리오에서 AI 시스템이 더 이상 단순한 정보 수집기가 아니라 인간 전문가와 유사한 역할을 수행하기 시작했음을 나타냅니다.
이 과정은 문제를 세분화하고, 가설을 검증하고, 결론을 수정하고, 궁극적으로 완전하고 추적 가능한 결과를 도출하는 것을 포함합니다.
이러한 관점에서 FinSight는 출발점과 더 가깝습니다 .
에이전트 아키텍처가 지속적으로 발전함에 따라 과학 연구 분석, 법률 판단, 의료 의사 결정과 같은 복잡한 분야에서 전문가 수준의 AI 에이전트를 중심으로 한 새로운 생산성 시대가 점차 도래할 수 있을 것입니다.
논문 및 프로젝트 저자: 중국 인민 대학교, 인공 지능 Gaoling School: Jiajie Jin, Yuyao Zhang, Yimeng Xu, Hongjin Qian, Yutao Zhu, Zhicheng Dou
논문 링크: https://arxiv.org/abs/2510.16844
코드 링크: https://github.com/RUC-NLPIR/FinSight
이 글은 FinSight 팀이 작성하고 36Kr의 허가를 받아 WeChat 공식 계정 "Quantum Bit" 에 게시한 글입니다.




