AI 에이전트의 "GPT 모멘트", 마누스는 AI 서클 전체를 깨웠다
이 기사는 기계로 번역되었습니다
원문 표시
GM(Good Morning) 2025년은 AI 에이전트의 원년입니다. 이 말은 3월 6일 새벽 북경 시간에 입증되었습니다.
"DeepSeek 이후, 또 다른 기술계의 밤샘이 있었습니다."라고 많은 사용자들이 소셜 미디어에서 평했습니다.
모든 사람들이 밤새 기다렸던 것은 바로 Monica.im에서 개발한 세계 최초의 AI 에이전트 제품 "Manus"의 사용 초대장이었습니다.
팀에 따르면 "Manus"는 완전히 자율적인 AI 에이전트로, 복잡하고 변화무쌍한 다양한 과제를 해결할 수 있습니다. 기존 AI 어시스턴트와 달리 Manus는 단순히 제안이나 답변을 제공하는 것이 아니라 완성된 과제 결과물을 직접 제공할 수 있습니다.
Manus의 소개 영상은 단 4분 밖에 되지 않지만 그 위력은 엄청납니다. 라틴어로 "손"을 의미하는 Manus의 이름처럼, 지식은 단순히 머릿속에 있는 것이 아니라 실제로 실행할 수 있어야 합니다. 이것이 에이전트와 AI 봇(채팅 봇) 제품의 본질적인 진화입니다.
Manus의 강점은 무엇일까요? 가장 직관적인 것은 공식 웹사이트의 시연 및 사용자들이 자발적으로 보여준 사용 사례를 통해 확인할 수 있습니다. 극客公园에서 정리한 내용은 다음과 같습니다:
여행 계획: 여행 정보를 통합할 뿐만 아니라 사용자에게 맞춤형 여행 핸드북을 제작합니다. 예를 들어 4월 일본 여행을 위해 개인화된 여행 제안과 상세 핸드북을 제공합니다.
주식 분석: 심층적인 주식 분석을 수행하고 시각적으로 매력적인 대시보드를 통해 종합적인 주식 통찰을 제공합니다. 예를 들어 테슬라 주식에 대한 심층 분석과 시각화 대시보드를 생성합니다.
교육 콘텐츠 제작: 중학교 교사를 위해 운동량 정리 등 복잡한 개념을 설명하는 동영상 시연 자료를 제작하여 교사의 효과적인 수업을 지원합니다.
보험 정책 비교: 명확한 보험 정책 비교표를 작성하고 최적의 의사결정 제안을 제공하여 사용자가 가장 적합한 보험 상품을 선택할 수 있도록 지원합니다.
공급업체 조달: 네트워크 전반에 걸쳐 심층 조사를 수행하여 사용자 요구에 가장 적합한 공급업체를 찾아 공정한 대리인으로서 서비스를 제공합니다.
재무 보고서 분석: 시장 감정 변화를 포착하여 특정 기업(예: 아마존)에 대한 지난 4분기의 시장 감정 분석을 제공합니다.
스타트업 목록 정리: 관련 웹사이트를 방문하여 자격 요건에 부합하는 기업을 식별하고 표로 정리합니다. 예를 들어 YC W25 배치의 모든 B2B 기업 목록을 정리합니다.
온라인 상점 운영 분석: 아마존 상점 판매 데이터를 분석하여 실행 가능한 통찰력, 상세한 시각화 및 맞춤형 전략을 제공하여 판매 성과 향상을 지원합니다.
에이전트가 긴 사고 과정과 도구 호출을 통해 완벽하고 전문적인 결과물을 출력할 때, 사용자들은 "정말 인간을 돕게 되었다"고 감탄하기 시작합니다.
공식 웹사이트 정보에 따르면 GAIA 벤치마크(범용 AI 어시스턴트의 실제 세계 문제 해결 능력 평가)에서 Manus는 모든 난이도 수준에서 새로운 최첨단(SOTA) 성과를 달성했습니다.
한 문장으로 요약하면 - Manus는 당신의 디지털 세계에서 문자 그대로의 "대리인"이 되고자 하는 것이며, 그것을 실현했습니다.
이처럼 새벽에 출시된 Manus는 모든 AI 업계 사람들을 깨웠습니다!GM(Good Morning) 不仅如此,在 Manus 官网还展示了十多个 Manus 能够使用的场景:直接使用 Manus 帮你整理行程、个性化推荐旅游路线,还能让它学习使用各种复杂工具,来流程化的完成日常工作。
在这个过程中,真正让 Manus 展现出与往常工具不同的,是它的自主规划,来确保执行任务的能力。
自主学习的能力也让 Manus 的工作能力提升逻辑更像是真正的人类——即使现阶段,它可能还无法在某一个特定领域做到专家级别的精通,但已经能看到巨大的潜力。
随着自主学习能力的加入,AI Agent 的泛用性得到了巨大的提升,在用户对 Manus 的实际测试中,你甚至可以做到直接对它描述一个视频画面中的相关内容,Manus 最终能够直接根据对应的信息,跨越平台内容对于搜索引擎的限制,精准找到某个 이오스(EOS) 短视频的链接。
由于目前版本的 Manus 完全基于云端异步运行,因此实际上 Manus 的能力并不被你所使用的端侧平台形态或算力等因素限制——用户甚至可以做到在向 Manus 下达指令之后,暂时关闭电脑,当 Manus 执行完成活动结果后,会自动通知你结果。
这个操作逻辑同样非常眼熟——就像一个人下班以后,在微信上喊实习生「文件整理好发我」。只不过,现在,这个实习生是真的可以 7x24 小时的响应你了,并且不用担心他会「整顿职场」。
02 多代理+自查,跑通 AI Agent 流
从上面这些案例,其实不难看出 Manus 真正的杀手锏,并非 Computer Use 中已经出现过的「AI Agent」概念,而是它「模拟人类方式工作方式」的能力。
比起「运行计算」,Manus 的工作逻辑更像是「思考并执行命令」。它并没有做到哪些人类当前真正无法做到的事;这也就是为什么一些已经体验过当前版本 Manus 的用户,将它形容为「一个实习生」。
在 Manus 官网,展示着众多 Manus 能够完成的任务,其中就有一个案例,展示了在 B2B 业务中,如何使用 Manus。快速精准的将你的订货需求,与全球供应商实现精准匹配。
在类似需求的常规产品中,在平台内整合全球供应链企业信息,来帮助用户完成供货商/需求方匹配这件事,是业内通行的逻辑。但这件事在 Manus 的案例中,你能看到完全不同的实现方式。
Manus AI 使用一套名为「Multiple Agent」的架构,运行在独立的虚拟机中。通过规划代理、执行代理、验证代理的分工协作机制,。来大幅提升对复杂任务的处理效率,并通过并行计算缩短响应时间。
在这个架构中,每个代理可能基于独立的语言模型或强化学习模型,彼此通过 API 或消息队列通信。同时每个任务也都在沙盒中运行,避免干扰其他任务,同时支持云端扩展。每个独立模型都能模仿人类处理任务的流程,比如先思考和规划,理解复杂指令并拆解为可执行的步骤,再调用合适的工具。
换言之,通过 Manus 的这套多代理架构,它更像是由多个助理,通过协助的方式,分别完成检索资源、对接、验证信息是否有效等工作,来帮你完成整个工作流程——这实际上不仅像是你招了一个「实习生」,更像是直接当上了一个微缩版的「部门主管」。
在 B2B 业务这个案例中,Manus 通过网页爬虫以及代码编写、执行能力,Manus 会自动在互联网这片汪洋大海中检索,根据你自己的需求,对潜在供应商从产品质量、价格、交货能力等方面,为你匹配到最合适的货源。不仅可以将结论以图表的方式直观呈现在你眼前。还能对这些数据进一步给出更加详细的操作建议。
Manus 完成 B2B 场景下的需求,或许比单一平台的内建工具更好用 | 图片来源:极客公园
至于 Monica 团队到底如何、用何种技术实现的视频效果,根据消息,团队或将在北京时间 3 月 6 日为大家揭晓。
03「缝合」的极致,就是炸裂
Manus 背后的 Monica.im,到底是家什么公司?
Monica 是一款 All-in-One 的 AI 助手,产品形态从浏览器插件、慢慢拓展至了 App、网页端。主流的使用场景是,当用户在浏览器中点开它的小图标,就能直接使用其接入的各大主流模型。通过对细分场景用户需求的准确理解,Monica 摘到了大模型「低垂的果实」。
其创始人肖弘(昵称小红,英文名 Red)是一位年轻的连续创业者,1992 年生,毕业于华中科技大学。2015 年,他毕业后创业,早期创业不算顺利(如校园社交、二手集市)。2016 年,他创业微信公众号运营者提供编辑与数据分析工具,获得了百万用户、并完成了盈利,最终产品于 2020 年出售给了某独角兽公司。
等到 2022 年大模型浪潮后,他正式创立 Monica,专注海外市场,通过独立开发者产品 ChatGPT for Google,产品快速完成了冷启动。
2024 年,在 GPT-4o、Claude 3.5、OpenAI o1 系列上线的第一时间,Monica 让用户可以获得最新 SOTA 模型。随着接入模型的新进展,Monica 推出的专业搜索、DIY Bot、Artifacts 写小程序、记忆等功能也受到用户喜爱。而 Monica 在 YouTube、Twitter、Gmail、The Information 等不同功能的网页里呈现出不同的交互形态和功能,以适配特定场景的用户需求,更新了数百个网页的个性化 AI 体验。
2024 年,Monica 用户数量翻番,达 1000 万。同时,其保持着可观的盈利,在海外同类产品中,位居头部。
Monica 的强劲表现验证了一件事:
套壳到极致,既是 TPF、也是 PMF,最后都通往用户价值。
Monica 首页 | 图片来源:Monica
Manus 或许延续了 Monica 团队这种思路——肖弘接受媒体人张小珺的访谈时表示,产品不能只有聊天机器人一种形态,Agent 会是新增的形态、需要新的产品去承接。
他从 AI 编程产品 cursor 和 Devin 中获得了灵感。据极客公园了解,前者主要是 copilot 模式、后者则是 autopilot 模式,后者更符合人性需求。Agent 也应该像 Devin 一样,面向大众人群、真正由 ai 主导进行执行。但过去的问题是,模型不够聪明。
但基于模型已有能力去做场景的封装服务,或许正是 Monica 团队的优势。肖弘说,目前 Agent 产品团队并不多,因为它需要很多复合能力,比如说团队要搞过 chatbot、AI 编程、浏览器相关(因为都在浏览器上跑)、而且对模型的边界要有不错的感知——今天发展到什么水平,接下来会发展到什么样的水平等等。
「同时拥有这些能力的公司没那么多,而有这些能力的公司,可能手头正在干一个很具体的业务,但我们恰好有同学刚好有时间一起把这件事情做出来。」他说。
为什么是 Monica 做出来了,他总结道,「第一,我觉得我们是比较幸运的。第二,某种程度上,如果今天大家都去做 reasoning 了,可能是不是又多出了一些时间给创业公司?模型预计能力外溢还能走多远?」
他认为,目前 Agent 还在早期阶段。一是目前 Agent 还在规划阶段,还没到物理世界的执行;二是大模型的能力还在往上发展,一切还不可预料。
「我肯定不知道 Agent,是可以被用这样的方式被出来的,它是一个未知的事情。」他说。GM(Good Morning) 可能未必是最终的 AI 이오스(EOS), 但它无疑在 DeeoSeek 爆火之后, 再次将人们对 AI 的 정서 拉升了一个 업무 级。
출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트
공유


