Moonshot AI의 Kimi Work는 300개의 AI 에이전트를 데스크톱에서 사용할 수 있도록 지원합니다.

이 기사는 기계로 번역되었습니다
원문 표시

문샷 AI(Moonshot AI)가 macOS와 Windows용 데스크톱 에이전트인 키미 워크(Kimi Work)를 출시했습니다. 키미 워크는 사용자의 컴퓨터에 설치되어 파일을 읽고, 웹 브라우저를 제어하며, 예약된 시간에 작업을 실행합니다. 중국의 AI 유망 스타트업 중 하나인 베이징 소재 문샷 AI는 이번 주 키미 워크를 발표하고 무료 다운로드를 제공했으며, 현재 내부 테스트를 진행 중입니다.

한 달 전에 출시된 이 회사의 WebBridge 확장 프로그램은 이미 상담원이 사용자의 실제 Chrome 또는 Edge 세션을 로컬에서 제어할 수 있도록 해 주었습니다. Kimi Work는 이러한 아이디어를 발전시켜 완전한 데스크톱 제품으로 만들었습니다.

핵심은 간단합니다. 오늘날 대부분의 AI 제공업체가 내놓는 AI 도구는 클라우드에 있습니다. 사용자가 명령을 보내면 어딘가에 서버가 가동되고, 샌드박스 환경의 브라우저가 데이터를 처리한 후 결과를 얻습니다. 하지만 Kimi Work는 정반대의 방식으로 작동합니다.

Kimi Work는 컴퓨터에 설치되는 로컬 앱이므로 로컬 파일에 접근하여 컴퓨터와 상호 작용할 수 있습니다. PDF 파일을 편집하고, 바탕화면을 정리하고, 브라우저에서 주식 데이터를 가져오고, HTML 보고서를 작성하여 이메일로 전송하는 이더리움 클래식(ETC) 작업을 수행할 수 있습니다.

실제로 이는 OpenClaw나 Hermes가 시도하는 것과 유사하지만, Kimi 생태계에 완벽하게 개발 및 통합되어 있으며 다른 대안에서는 제공하지 않는 특별한 기능을 갖추고 있습니다.

그중 하나가 에이전트 스웜(Swarm)(Agent Swarm)인데, 이를 통해 Kimi Work는 최대 300개의 하위 에이전트를 병렬로 실행하여 각 에이전트가 작업의 서로 다른 부분을 처리할 수 있습니다.

또한 WebBridge와 통합되어 Chrome 개발자 도구 프로토콜(개발자가 디버깅에 사용하는 것과 동일한 인터페이스)을 통해 에이전트가 실제 브라우저를 제어할 수 있도록 합니다. 로그인 세션과 쿠키는 사용자의 컴퓨터에 그대로 유지됩니다.

내장된 Cron 엔진은 일별, 시간별 또는 조건부 트리거에 따라 작업을 예약하며, 야간 작업을 위한 "컴퓨터 절전 모드 해제" 토글 기능도 제공합니다. 또한 로컬 파일 레이어를 통해 에이전트는 마운트된 폴더를 읽고 백그라운드에서 Python을 실행할 수 있습니다.

이 앱에는 A주, 홍콩 주식, 미국 주식에 대한 시장 데이터가 기본으로 통합되어 제공되므로 API 설정이 필요하지 않습니다. 완성된 분석 결과는 PowerPoint 또는 Excel 파일로 바로 변환할 수 있습니다.

내부적으로 Kimi Work는 Kimi K2.6 에서 실행된다고 일부 관계자들이 전했습니다. (저희는 아직 직접 테스트해보지 못했습니다 .) K2.6은 약 1조 개의 매개변수를 가진 전문가 혼합 모델로, 4월 20일에 공개된 문샷 프로젝트입니다. 전문가 혼합 모델은 특정 시점에 전체 매개변수 중 일부만 활성화하는 아키텍처입니다. K2.6은 토큰당 약 320억 개의 매개변수를 활성화하고 25만 6천 개의 토큰 컨텍스트 윈도우를 유지합니다. (참고로, 토큰은 AI가 처리할 수 있는 최소 정보 단위이며, 매개변수는 모델이 가진 모든 지식과 특성을 저장하는 수치 값입니다.)

컨텍스트 창이 중요합니다. 이는 에이전트가 시작했던 내용을 잊지 않고 길고 여러 단계로 이루어진 워크플로 전반에 걸쳐 엄청난 양의 정보를 기억할 수 있음을 의미합니다.

Kimi의 AI 모델로서의 품질에 대해 의심이 든다면, 인기 있는 AI 코드 편집기인 Cursor가 Kimi를 기반으로 자체적인 대규모 언어 코딩 특화 모델인 "Composer 2"를 개선했다는 점을 고려해 보십시오.

Kimi Work에서 "로컬"이란 AI 모델이 실행되는 위치가 아니라 작업이 발생하는 위치, 즉 사용자의 컴퓨터를 의미합니다. K2.6 모델의 추론은 파일 읽기, 브라우저 클릭, Python 실행 등이 로컬에서 이루어지더라도 클라우드에 있는 Moonshot API를 통해 처리될 수 있습니다.

완전한 온디바이스 추론을 원한다면, 가중치는 수정된 MIT 라이선스 하에 Hugging Face에서 사용할 수 있습니다. 하지만 수조 개의 매개변수를 가진 모델을 구현하려면 대부분의 가정 사용자가 보유하지 않은 고성능 하드웨어가 필요합니다.

개인정보 보호 문제는 "로컬은 안전하다"라는 단순한 공식보다 훨씬 복잡합니다. WebBridge는 사용자가 실제로 로그인한 브라우저를 구동하기 때문에 은행 계좌, 이메일, 회사 내부 도구 등에 접근할 수 있습니다. UC 리버사이드 연구진은 지난 5월 AI 에이전트가 자신의 행동이 위험한지 인식하지 못한 채 작업을 수행하는 경우가 많다고 경고했는데 , 이를 "맹목적인 목표 지향성"이라고 명명했습니다.

Moonshot에는 파일 수정이나 코드 실행 전에 사용자의 승인을 요구하는 "작업 전 승인" 모드가 포함되어 있습니다. 이는 기본적으로 활성화해 두는 것이 좋지만, 100% 안전하다고는 할 수 없습니다.

데스크톱 에이전트 경쟁이 빠르게 치열해지고 있습니다. Anthropic의 Claude는 2024년 말부터 데스크톱 컴퓨터에서 완벽하게 작동하도록 지원해 왔습니다. OpenAI는 2026년 4월 macOS용 Codex 백그라운드 컴퓨터 사용 기능을 출시하여 데스크톱 세션에서 에이전트를 병렬로 실행할 수 있도록 했습니다. Project Mariner에서 파생된 Google의 제미니(Gemini) 컴퓨터 사용 기능은 브라우저 워크플로에 초점을 맞추고 있습니다. Microsoft의 Copilot Studio는 2026년 5월 컴퓨터 사용 기능을 추가했으며, 기업 자동화를 목표로 OpenAI와 Anthropic의 모델을 모두 활용합니다.

하지만 사용자들은 단일 공급업체에 얽매이기보다는 유연성을 원하는 것 같습니다. 바로 이 지점에서 OpenClaw, Hermes, NanoClaw와 같은 도구들이 등장합니다. 이러한 도구들은 기본적으로 API를 통해 모든 LLM을 사용하여 AI 에이전트를 구성할 수 있는 로컬 플랫폼입니다.

Kimi Work의 차별점은 로컬 우선 설계와 300개 에이전트로 구성된 스웜(Swarm) 결합했다는 점입니다. 대부분의 경쟁 제품은 실제 로그인 세션에 접근할 수 없는 클라우드 샌드박스에서 모든 작업을 실행하거나, 조정된 병렬 에이전트 없이 데스크톱 제어만 제공합니다. Kimi Work는 이 두 가지 모두를 제공합니다. 다만, 노트북을 닫으면 작업이 중지된다는 단점이 있습니다. Moonshot의 클라우드 제품인 Kimi Claw는 사용자의 컴퓨터와 관계없이 24시간 내내 실행됩니다.

이 앱은 무료로 다운로드할 수 있습니다. 유용한 에이전트 기능은 유료 플랜에서 이용 가능합니다. Moonshot의 Moderato 플랜은 월 19달러부터 시작하며 K2.6, 심층 분석, Kimi 코드 이용 권한을 포함합니다.

제한된 수의 하위 에이전트를 사용하는 에이전트 스웜(Swarm) Allegretto(월 39달러)에서 이용할 수 있으며, 최대 300명의 에이전트를 사용하는 전문 워크 스웜(Swarm) 및 최고 수준의 트래픽 처리가 필요한 사용자는 Allegro(월 99달러) 또는 Vivace(월 199달러) 요금제를 이용 해야 합니다.

macOS(애플 실리콘) 및 Windows용 다운로드는 kimi.com에서 가능하며, 내부 테스트 단계이므로 전체 출시 전에 일부 기능이 변경될 수 있습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트