오픈AI가 광고 수익화와 인공 일반 지능(AGI)의 이상에 대해 여전히 논쟁 중인 동안, 애플과 구글은 이미 뒤에서 "측면 공격"을 통해 기술을 빼앗을 계획을 세우고 있다.
애플은 1월 24일, 시리 탄생 이후 가장 획기적인 행보를 공식 발표했습니다. 바로 과거 경쟁사였던 구글과의 긴밀한 협력에 10억 달러를 투자하여 맞춤형 제미니 엔진으로 시리를 완전히 개편하는 것입니다. 이번 업그레이드를 통해 시리의 처리 능력은 1,500억에서 1조 2천억으로 향상되어, 다단계 심층 대화와 앱 간 연동이 가능한 진정한 지능형 AI 에이전트로 거듭날 것입니다.
이번 새로운 연합은 AI 비서 경쟁에 새로운 차원을 열었습니다. 시리의 근본적인 개편은 끝이 아니라 모바일 AI의 최종 전쟁의 진정한 출발점이며, 애플, 구글, 그리고 국내 기업들 간의 직접적인 대결의 서막을 열었습니다. 이번에는 국내 기업들이 글로벌 기술 대기업들과 동등한 출발선에 섰을 뿐만 아니라, 더 빠르게 질주하여 결승선을 먼저 통과할 기회를 얻게 되었습니다.
애플의 "AI 튜터링": 돈의 힘은 결코 유행에서 벗어나지 않을 것이다
애플의 AI 전략은 한 문장으로 요약할 수 있다. "부자가 되는 건 좋은 일이다."
GPT-4.1은 최대 100만 토큰(약 75만 단어)의 컨텍스트 창을 지원합니다. 이는 사용자의 선호도와 이전 대화를 정확하게 기억하며 길고 심도 있고 논리적으로 일관된 대화를 나눌 수 있음을 의미합니다.
GPT-4나 클로드 같은 최신 지능형 에이전트와 비교했을 때, 지난 몇 년간 구형 시리의 가장 큰 약점은 자연어 이해 및 작업 실행 능력이 부족하다는 점이었습니다. 여러 의도가 포함된 복잡한 명령을 처리하지 못할 뿐더러, 여러 차례에 걸친 대화의 맥락을 이해하는 것은 더욱 어려웠습니다.
이처럼 엄청난 격차를 처음부터 메우려면 천문학적인 연구 개발 비용이 들 뿐만 아니라, 더 중요한 것은 소중한 기회를 놓치게 된다는 점입니다. 따라서 애플은 "돈으로 시간을 버는" 가장 실용적인 전략을 선택하여 세계 최고 수준의 제미니 대형 모델을 자사 시스템에 통합하는 데 10억 달러를 투자했습니다.
하지만 애플은 시리의 "지능"을 대형 모델로 보완하면서 단순히 제미니 프로젝트를 위한 확성기로 활용하지 않았습니다. 오히려 개인정보 보호와 보안에 집중하여 "생태계 장벽"을 더욱 강화하고 폐쇄적인 생태계를 통해 기술 개발을 가속화했습니다.
사용자 개인정보 보호에 대한 주요 우려를 대면애플은 새로운 시리가 보유할 수 있는 장기 사용자 메모리의 범위를 엄격하게 제한하고, 로컬 데이터 처리 및 접근 제어를 강화하는 데 중점을 두겠다고 약속했습니다. 제미니는 애플의 프라이빗 클라우드에서 완전히 실행되며, 사용자 요청에는 태그가 지정되고, 구글은 특정 데이터에 접근하거나 학습에 사용하지 않고 모델 추론 기능을 제공하는 기술 제공업체 역할만 수행합니다.
생성형 AI가 계속해서 발전하고 진화함에 따라, 영화 "마이너리티 리포트"나 드라마 "트라이얼 바이 파이어"에서부터 AI 얼굴 바꾸기 사기, 삼성 직원들의 ChatGPT 사용으로 인한 기밀 정보 유출과 같은 실제 사례에 이르기까지, 개인정보 보호에 대한 논란과 성찰은 끊이지 않고 있다는 점을 이해하는 것이 중요합니다.
사용자 개인정보를 강력하게 보호하는 이러한 다층적인 협력은 애플이 "개인정보 수호자"로서 쌓아온 이미지를 완벽하게 뒷받침합니다. 데이터 보안에 대한 우려가 커지는 가운데, 이러한 전략의 가치는 더욱 분명해지고 있습니다.
업그레이드된 시리의 또 다른 주요 장점은 강력한 AI 기능이 애플의 원활한 다중 시나리오 생태계와 깊이 통합되었다는 점입니다. 협력 계약에 따라 업그레이드된 시리는 iOS, macOS, watchOS를 포함한 애플의 모든 운영 체제와 전례 없는 수준의 통합을 달성할 것입니다.
애플이 시장 지배력을 유지하는 핵심 강점은 "하드웨어 + 서비스"라는 폐쇄적인 생태계를 통해 사용자를 자사의 거대한 생태계에 묶어두는 데 있습니다. 제미니(Gemini)의 추가로 휴대폰, 컴퓨터, 애플 워치 사용자는 더욱 일관되고 원활한 스마트 경험을 누릴 수 있게 되어 iOS 생태계의 "고객 유지력"이 크게 향상될 것입니다.
사용자 개인정보 보호부터 포괄적인 생태계 업그레이드에 이르기까지, 이미 '사용자 충성도 1위' 운영체제인 iOS는 제미니의 도움으로 AI에 추월당하지 않을 것이라는 자신감을 다시 한번 얻었습니다.
애플의 최근 재무 보고서에 따르면 글로벌 매출, 순이익, 아이폰 판매량 등 여러 부문에서 역대 신고점 기록했다는 점에 주목할 필요가 있습니다. 이번 분기 애플의 중화권 매출은 255억 달러에 달해 38% 급증했으며, '애플 세금'으로 불리는 서비스 업무 역대 신고점 최고치인 77%의 매출총이익률을 달성하며 애플의 새로운 현금 창출원으로 부상했습니다.
애플, 알리바바, 텐센트는 효율성과 규정 준수를 모두 우선시하며 A2A(대리점 대 에이전트) 모델을 선도하고 있습니다.
하지만 애플의 겉보기에 완벽해 보이는 전략적 계획 속에는 거의 피할 수 없는 문제, 바로 중국 시장이 숨겨져 있습니다.
데이터 보안 규정 및 인터넷 규제 정책의 차이로 인해 구글의 모든 서비스는 오랫동안 중국 본토에서 이용할 수 없었습니다. 따라서 중국 본토 버전의 아이폰, 맥 및 기타 기기에 탑재될 새로운 시리는 구글에서 제공하는 제미니 모델의 전체 버전을 직접 호출하는 것이 아니라, "자체 개발 모델 + 국내 제조업체의 적용"이라는 절충안을 채택할 가능성이 높습니다.
해외 사용자들은 이미 앱 간 원클릭 티켓 예매, 지능형 여행 계획, 자동 사진 정리 등 새로운 시리의 편리함을 누리고 있지만, 국내 사용자들은 기능이 축소되고 성능이 제한된 '약화된' 시리를 대면 가능성이 높습니다.
사용자 경험의 엄청난 격차는 영리한 국내 휴대폰 제조업체들에게 절호의 기회를 열어주었습니다.
모바일 AI 시대에 AI 비서의 품질을 판단하는 핵심 기준은 더 이상 얼마나 아름다운 시를 쓸 수 있느냐가 아니라, 얼마나 "사용자의 손을 자유롭게 해 줄 수 있는지", 그리고 더 중요하게는 개인정보를 침해하지 않고 얼마나 안전하게 실생활 작업을 완료할 수 있느냐입니다.
이와 관련하여 일부 국내 기업들은 이미 선견지명과 실행력을 보여주고 있습니다. 그들이 연구하고 있는 것은 애플과 구글이 채택한 접근 방식과 일치하며 업계에서 미래 방향으로 널리 인식되고 있는 에이전트 간(A2A) 모델입니다.
A2A 모델의 핵심 아이디어는 AI 어시스턴트가 "종합 배차 담당자" 역할을 하도록 하는 것입니다. 각 앱은 핵심 기능을 독립적이고 표준화된 "하위 지능형 에이전트"로 캡슐화합니다. 사용자가 명령을 내리면 메인 AI 에이전트는 의도를 파악하고 작업을 세분화한 후 , 통합된 권한 있는 API 인터페이스를 통해 해당 앱의 하위 지능형 에이전트에 작업 지시를 전달하여 협업을 통해 작업을 완료하도록 합니다.
알리바바의 '첸원(Qianwen)'은 A2A 모델을 심층적으로 탐구하기 시작했습니다. 사용자는 대화 상자에 필요한 사항만 입력하면 첸원은 그 필요에 담긴 다양한 의도를 즉시 파악할 수 있습니다. 그런 다음 '플리기(Fliggy)'를 통해 항공권과 호텔을 검색 및 예약하고, '가오더 지도(Gaode Map)'를 호출하여 여행 경로를 계획하며, 나아가 '타오바오(Taobao)'와 연동하여 사용자에게 필요한 상품을 추천하고 구매까지 도와줍니다.
전체 과정은 매끄럽고 정확했으며, 알리바바 생태계의 안전하고 통제 가능한 프레임 안에서 완료되었습니다.
이 모델의 장점은 명확한 이중 권한 부여 메커니즘을 구축한다는 데 있습니다. 사용자는 AI 비서가 어떤 앱 기능을 호출할 수 있는지 명시적으로 승인해야 하며, 앱 개발자 또한 API 인터페이스를 통해 외부에서 호출할 수 있는 기능, 호출 빈도 및 데이터 범위를 명확하게 정의해야 합니다.
모든 AI 작업은 추적 가능하며 권한과 책임 측면에서 명확하게 정의되어 있습니다. 또한 앱 스토어 모델보다 훨씬 더 시너지 효과를 내는 공생 생태계를 구축하여 앱 개발자에게 새로운 유입 경로와 비즈니스 모델을 제공합니다.
2025년 3분기 실적 발표에서 텐센트의 마틴 라우 사장은 위챗에도 AI 에이전트를 출시할 것이라고 밝혔습니다. 텐센트의 광범위한 생태계를 활용하여 위챗 에이전트가 시장에 출시되면 디디, 통청과 같은 수많은 위챗 미니 프로그램과 서비스를 관리할 수 있게 되어 소셜 상호작용과 여행, 지역 서비스에 이르기까지 원스톱 통합 서비스를 제공할 수 있을 것으로 예상됩니다.
하지만 모든 업체가 AI폰 개발에 있어 안전하지만 인내심이 필요한 A2A 방식을 택한 것은 아닙니다. 일부 제조사는 AI가 직접 "화면을 읽는" 시스템 수준의 GUI 방식을 모색하기도 했습니다.
바이트댄스가 ZTE 및 메이주와 협력하여 출시한 두바오(Doubao) 폰과 같은 제조사들이 내세우는 "시각적 통합" 개념은 시스템의 기초 수준에서 매우 높은 권한을 획득하여 AI가 마치 사람처럼 화면의 텍스트와 이미지를 "읽고", 사람의 손가락을 "모방"하여 클릭, 스와이프, 입력 등을 수행함으로써 휴대폰의 모든 앱을 조작할 수 있도록 하는 것입니다.
이 접근 방식은 앱 개발자와의 길고 복잡한 소통, 조정 및 인터페이스 적응 과정을 생략할 수 있으며, 이론적으로 기존의 모든 앱과 호환되므로 사용자는 "한 문장으로 모든 것을 해결하는" 멋진 효과를 빠르게 경험할 수 있습니다.
하지만 이러한 "속도"는 사용자 개인 정보 보호 및 보안을 희생해야 얻을 수 있습니다. AI 비서가 "화면을 읽어야" 할 때, 사용자의 채팅 기록, 결제 비밀번호 입력란, 개인 사진 등 화면에 표시되는 모든 콘텐츠가 아무런 제약 없이 AI 비서에게 노출됩니다.
제조업체들은 데이터가 클라우드에서 처리되지 않거나 로컬에서 처리될 것이라고 약속하지만, 불투명한 기술적 블랙박스 앞에서는 그러한 약속이 설득력이 떨어집니다. 바로 이러한 이유로 두바오폰 출시 직후 업계 내에서 논란과 반발이 일어났고, 주요 은행들의 금융 앱들은 즉시 이러한 모의 거래를 차단하기 위한 기술적 조치를 취했습니다.
결국 책임감 있는 플랫폼이라면 권한 없는 제3자가 애플리케이션 인터페이스에서 임의로 행동하는 것을 허용하지 않을 것입니다.
애플과 구글의 이번 협력은 강력한 빅데이터 모델 기능을 도입하는 것이 규칙을 무시하거나 개인정보를 침해하는 것을 의미하지 않는다는 것을 모든 휴대폰 제조업체에 보여줍니다. AI 생태계는 존중, 협력, 그리고 상호 이익을 기반으로 구축되어야 합니다. 이는 사용자 자산 보안 및 개인정보 보호와 동시에 빅데이터 모델 개발사와 휴대폰 제조업체 간의 힘겨루기이기도 합니다.
GPT의 선도적인 장점이 현재 상업 영역에서 뚜렷하게 드러나지는 않지만, 모바일 AI 비서 지원 기능은 AI 시대의 "슈퍼 관문"이 될 가능성이 매우 높습니다.
GPT 유형 제품의 핵심 시나리오는 코딩, 보고서 작성, 창작 활동과 같이 대규모 모델 기반의 복잡한 추론 능력을 요구하는 심층적인 사고 활동입니다. 그러나 궁극적으로 이러한 제품들은 여전히 일상생활에 통합되기 어려운 "차가운 비인간적인 도구"에 불과합니다. 이와 대조적으로 모바일 어시스턴트는 사용자의 심리적 요구에 더 가깝고, "즉각적인 응답"이라는 효율성과 "사용자를 가장 잘 이해하려는" 사려 깊음이 핵심 경쟁력입니다.
애플이 "최고의 기기"를 구매하기 위해 10억 달러를 투자했다는 이야기는 미래의 AI 경쟁이 단일 기업의 "공룡기업"이 아니라 "모델의 역량 + 생태계 통합 + 사용자 신뢰"의 종합적인 경쟁이 될 것임을 시사합니다.
기능이 제한된 시리 버전이 출시되기를 기다릴 것이 아니라, 중국 휴대폰 제조업체들은 알리바바, 텐센트, 메이투안과 같이 지역 생활 환경을 좌우하는 인터넷 거대 기업들과 긴밀히 협력하고, 안전하고 표준화된 A2A 모델을 통해 국내 휴대폰 음성 비서와 통합하여 진정으로 "중국 사용자를 이해하는" 초고성능 AI 비서를 구축하는 데 앞장서야 합니다.
그때가 되면 결제, 소셜 네트워킹, 여행 및 기타 애플리케이션 기능을 통합하여 원스톱 서비스 루프를 구축하고 애플의 생태계 장벽 및 GPT의 전반적인 기능 대면 경쟁할 수 있을 것입니다.
이 글은 위챗 공식 계정 "밍시 예왕" 의 글이며, 작성자는 뤄쑤이고, 36Kr의 허가를 받아 게재되었습니다.





