Trong khi OpenAI vẫn đang tranh luận về việc kiếm tiền từ quảng cáo và lý tưởng về Trí tuệ Nhân tạo Tổng quát (AGI), Apple và Google đã lên kế hoạch "tấn công từ phía sau" để giành lợi thế.
Vào ngày 24 tháng 1, Apple chính thức công bố bước đi Sự lật đổ nhất kể từ khi Siri ra đời: đầu tư 1 tỷ đô la vào sự hợp tác độ sâu với đối thủ cũ Google để hoàn toàn cải tiến Siri với công nghệ Gemini tùy chỉnh. Bản nâng cấp lần sẽ tăng số lượng tham số của Siri từ 150 tỷ lên 1,2 nghìn tỷ, biến nó thành một trợ lý AI thực sự thông minh, có khả năng đối thoại độ sâu nhiều lượt và hoạt động trên nhiều ứng dụng.
Liên minh mới này đã mở ra một chiều hướng mới cho cuộc cạnh tranh giữa các trợ lý AI. Sự cải tiến triệt để của Siri không phải là kết thúc, mà là điểm khởi đầu thực sự của trận chiến cuối cùng trong lĩnh vực AI di động, từ đó bắt đầu cuộc đối đầu trực tiếp giữa Apple, Google và các công ty nội địa. Lần, các công ty nội địa không chỉ đứng trên cùng vạch xuất phát với các gã khổng lồ công nghệ toàn cầu, mà còn có cơ hội bứt tốc nhanh hơn và về đích đầu tiên.
"Gia sư AI" của Apple: Sức mạnh của tiền bạc sẽ không bao giờ lỗi thời.
Chiến lược trí tuệ nhân tạo của Apple có thể được tóm gọn trong một câu: "Giàu có là điều tốt."
GPT-4.1 hỗ trợ cửa sổ ngữ cảnh với tối đa 1 triệu token, tương đương khoảng 750.000 từ. Điều này có nghĩa là nó có thể thực hiện các cuộc hội thoại dài, độ sâu và mạch lạc về mặt logic, ghi nhớ chính xác các tùy chọn của người dùng và các cuộc thảo luận trước đó.
So với các trợ lý ảo thế hệ mới hơn như GPT-4 và Claude, điểm yếu lớn nhất của phiên bản Siri cũ trong vài năm qua chính là khả năng hiểu ngôn ngữ tự nhiên và thực thi nhiệm vụ yếu kém. Nó không thể xử lý các lệnh phức tạp chứa nhiều ý định, chứ chưa nói đến việc hiểu ngữ cảnh cho các cuộc hội thoại nhiều lượt.
Việc bắt kịp một khoảng trống khổng lồ như vậy từ con số không không chỉ đòi hỏi chi phí nghiên cứu và phát triển khổng lồ, mà quan trọng hơn, sẽ bỏ lỡ một cơ hội quý giá. Do đó, Apple đã chọn chiến lược thực tế nhất là "mua thời gian bằng tiền", đầu tư 1 tỷ đô la để tích hợp mô hình Gemini quy mô lớn hàng đầu thế giới vào hệ thống của riêng mình.
Tuy nhiên, Apple, hãng đã bổ sung "trí thông minh" cho Siri bằng các mô hình lớn, không chỉ đơn thuần biến nó thành công cụ khuếch đại cho Gemini. Thay vào đó, hãng đặt cược vào quyền riêng tư và bảo mật, củng cố hơn nữa "bức tường hệ sinh thái" của mình và sử dụng một hệ sinh thái khép kín để đẩy nhanh sự phát triển công nghệ.
Đối diện mối quan ngại chính của người dùng về quyền riêng tư, Apple cam kết sẽ giới hạn nghiêm ngặt phạm vi bộ nhớ dài hạn mà Siri mới có thể lưu giữ, tập trung vào việc tăng cường xử lý dữ liệu cục bộ và kiểm soát truy cập. Gemini hoạt động hoàn toàn trên đám mây sở hữu tư nhân của Apple, các yêu cầu của người dùng được gắn thẻ và Google chỉ đóng vai trò nhân vật nhà cung cấp công nghệ, cung cấp khả năng suy luận mô hình, mà không có quyền truy cập vào dữ liệu cụ thể hoặc sử dụng dữ liệu đó để huấn luyện.
Điều quan trọng cần hiểu là khi trí tuệ nhân tạo tạo sinh tiếp tục được cải tiến và phát triển, từ các bộ phim và chương trình truyền hình như "Báo Cáo " và "Trial by Fire" đến các trường hợp thực tế như lừa đảo hoán đổi khuôn mặt bằng AI và việc nhân viên Samsung sử dụng ChatGPT dẫn đến rò rỉ thông tin mật, thì tranh cãi và suy ngẫm về quyền riêng tư chưa bao giờ chấm dứt.
Sự hợp tác đa tầng này, đảm bảo bảo vệ mạnh mẽ quyền riêng tư của người dùng, hoàn toàn củng cố hình ảnh đã được thiết lập của Apple với tư cách là "người bảo vệ quyền riêng tư". Trong bối cảnh lo ngại ngày càng tăng về an ninh dữ liệu , giá trị của chiến lược này ngày càng trở nên rõ ràng.
Một ưu điểm lớn khác của Siri nâng cấp là khả năng tích hợp độ sâu các năng lực trí tuệ nhân tạo mạnh mẽ với hệ sinh thái đa kịch bản liền mạch của Apple. Theo thỏa thuận hợp tác, Siri nâng cấp sẽ đạt được mức độ tích hợp độ sâu chưa từng có với toàn bộ hệ điều hành của Apple, bao gồm iOS, macOS và watchOS.
Thế mạnh cốt lõi của Apple trong việc duy trì vị thế thống trị thị trường nằm ở việc giữ chân người dùng trong hệ sinh thái rộng lớn của mình thông qua một vòng khép kín gồm "phần cứng + dịch vụ". Với sự ra mắt của Gemini, người dùng điện thoại, máy tính và đồng hồ sẽ được tận hưởng trải nghiệm thông minh nhất quán và liền mạch hơn, từ đó tăng cường đáng kể khả năng "giữ chân" người dùng trong hệ sinh thái iOS.
Từ việc bảo vệ quyền riêng tư của người dùng đến nâng cấp hệ sinh thái toàn diện, iOS, hệ điều hành vốn đã "vua về khả năng giữ chân người dùng", một lần nữa khẳng định vị thế của mình trước sự vượt trội của trí tuệ nhân tạo nhờ sự hỗ trợ của Gemini .
Đáng chú ý là báo cáo tài chính mới nhất của Apple ghi nhận Cao nhất mọi thời đại (ATH) ở nhiều lĩnh vực, bao gồm doanh thu toàn cầu, lợi nhuận ròng và thu nhập iPhone. Doanh thu của Apple tại thị trường Trung Quốc Đại lục trong quý này đạt 25,5 tỷ đô la, tăng mạnh 38%, và mảng việc kinh doanh, được thể hiện bằng "thuế Apple", đạt tỷ suất lợi nhuận gộp cao kỷ Cao nhất mọi thời đại (ATH) 77%, trở thành nguồn thu chính mới của Apple.
Ưu tiên cả hiệu quả và tuân thủ quy định, Apple, Alibaba và Tencent dẫn đầu mô hình A2A (Agency to Agent).
Tuy nhiên, ẩn sau chiến lược bố trí tưởng chừng như hoàn hảo của Apple là một vấn đề gần như không thể tránh khỏi—thị trường Trung Quốc.
Do sự khác biệt về quy định bảo mật dữ liệu và chính sách quản lý internet, các dịch vụ đầy đủ của Google từ lâu đã không có mặt tại Trung Quốc đại lục. Điều này có nghĩa là Siri phiên bản mới trên các thiết bị iPhone, Mac và các thiết bị khác tại Trung Quốc đại lục rất có thể sẽ không thể trực tiếp sử dụng phiên bản đầy đủ của mô hình Gemini do Google cung cấp, mà nhiều khả năng sẽ áp dụng giải pháp thỏa hiệp giữa "mô hình tự phát triển + sự điều chỉnh của các nhà sản xuất trong nước".
Trong khi người dùng ở nước ngoài đã được tận hưởng sự tiện lợi của Siri mới, chẳng hạn như đặt vé chỉ bằng một cú nhấp chuột trên nhiều ứng dụng, lập kế hoạch du lịch thông minh và tự động trải nghiệm ảnh, thì người dùng trong nước có thể đối diện một phiên bản Siri "bị hạn chế" với các chức năng bị cắt giảm và khả năng bị giảm sút.
Khoảng cách lớn về trải nghiệm đã mở ra cơ hội vàng cho các nhà sản xuất điện thoại di động trong nước nhạy bén.
Trong kỷ nguyên trí tuệ nhân tạo di động, tiêu chí cốt lõi để đánh giá chất lượng của trợ lý AI không còn là khả năng viết thơ hay đến mức nào, mà là khả năng "giải phóng đôi tay người dùng" và quan trọng hơn, khả năng hoàn thành nhiệm vụ thực tế một cách an toàn và không xâm phạm quyền riêng tư.
Về vấn đề này, một số doanh nghiệp trong nước đã thể hiện tầm nhìn xa và khả năng thực thi. Họ đang nghiên cứu mô hình Agent to Agent (A2A), trùng khớp với cách tiếp cận của Apple và Google và được ngành công nghiệp cho rằng rộng rãi là hướng đi của tương lai.
Ý tưởng cốt lõi của mô hình A2A là để trợ lý AI đóng vai trò nhân vật một "người điều phối tổng quát". Mỗi ứng dụng gói gọn các chức năng cốt lõi của nó vào các "tác nhân phụ thông minh" độc lập, được tiêu chuẩn hóa. Khi người dùng đưa ra một lệnh, tác nhân AI chính chịu trách nhiệm hiểu ý định, phân tích nhiệm vụ và gửi lệnh công việc đến các tác nhân phụ thông minh tương ứng của ứng dụng thông qua giao diện API thống nhất, được ủy quyền để cùng nhau hoàn thành nhiệm vụ.
Ứng dụng "Qianwen" của Alibaba đã bắt đầu nghiên cứu sâu rộng mô hình A2A (Account-to-Account). Người dùng chỉ cần bày tỏ nhu cầu của mình trong hộp thoại, và Qianwen có thể ngay lập tức hiểu được nhiều ý định ẩn sau những nhu cầu đó. Sau đó, ứng dụng sẽ điều động "Fliggy" để tìm kiếm và đặt vé máy bay và khách sạn, gọi "Gaode Map" để lập kế hoạch lộ trình chuyến đi, và thậm chí liên kết với "Taobao" để đề xuất và mua các mặt hàng mà người dùng cần.
Toàn bộ quy trình diễn ra suôn sẻ và chính xác, được hoàn thành trong khuôn khổ an toàn và có thể kiểm soát được của hệ sinh thái Alibaba.
Ưu điểm của mô hình này nằm ở việc thiết lập một cơ chế ủy quyền kép rõ ràng — người dùng cần phải ủy quyền rõ ràng cho trợ lý AI để gọi các chức năng ứng dụng nào; các nhà phát triển ứng dụng cũng xác định rõ ràng thông qua giao diện API những khả năng nào có thể được gọi từ bên ngoài, tần suất gọi và phạm vi dữ liệu.
Lần hoạt động của AI đều có thể truy vết và được xác định rõ ràng về quyền và trách nhiệm. Nó cũng đã xây dựng một hệ sinh thái cộng sinh với hiệu ứng hiệp đồng mạnh mẽ hơn nhiều so với mô hình cửa hàng ứng dụng, mang đến những luồng truy cập và mô hình kinh doanh mới cho các nhà phát triển ứng dụng.
Trong cuộc họp báo cáo thu nhập quý 3 năm 2025, Chủ tịch Tencent, ông Martin Lau, cho biết WeChat cũng sẽ ra mắt trợ lý ảo AI. Tận dụng hệ sinh thái rộng lớn của Tencent, khi WeChat Agent ra mắt thị trường, nó có khả năng quản lý một lượng lớn các ứng dụng và dịch vụ mini của WeChat như Didi và Tongcheng, tạo thành một nhiệm vụ khép kín từ tương tác xã hội và du lịch đến các dịch vụ địa phương.
Tuy nhiên, không phải tất cả các nhà sản xuất đều chọn con đường A2A, một con đường an toàn nhưng đòi hỏi sự kiên nhẫn, trên hành trình hướng tới điện thoại AI. Một số nhà sản xuất cũng đã khám phá con đường giao diện người dùng đồ họa (GUI) cấp hệ thống để AI trực tiếp "đọc màn hình".
Được đại diện bởi các nhà sản xuất như điện thoại Doubao của ByteDance ra mắt hợp tác với ZTE và Meizu, những công ty đề cao khái niệm "tích hợp hình ảnh", logic của mô hình này là giành được quyền truy cập cực cao ở cấp độ hệ thống cơ bản, cho phép AI "đọc" văn bản và hình ảnh trên màn hình như một người thật, sau đó "mô phỏng" các ngón tay người để nhấn, vuốt và nhập liệu, từ đó vận hành bất kỳ ứng dụng nào trên điện thoại.
Cách tiếp cận này giúp bỏ qua quá trình giao tiếp, phối hợp và điều chỉnh giao diện tốn thời gian với các nhà phát triển ứng dụng, và về mặt lý thuyết tương thích với tất cả các ứng dụng hiện có, cho phép người dùng nhanh chóng trải nghiệm hiệu ứng tuyệt vời của việc "hoàn thành mọi việc chỉ trong một câu".
Tuy nhiên, "tốc độ" này lại phải trả giá bằng việc hy sinh quyền riêng tư và bảo mật của người dùng. Khi trợ lý AI cần "đọc màn hình", điều đó có nghĩa là tất cả nội dung hiển thị trên màn hình, chẳng hạn như lịch sử trò chuyện của người dùng, giao diện nhập mật khẩu thanh toán và ảnh riêng tư, sẽ bị "hiển thị" cho nó mà không có bất kỳ sự hạn chế nào.
Mặc dù các nhà sản xuất hứa hẹn rằng dữ liệu sẽ không được xử lý trên đám mây hoặc sẽ được xử lý cục bộ, nhưng những lời hứa như vậy dường như yếu ớt trước những "hộp đen" công nghệ mờ ám. Đó là lý do tại sao việc ra mắt điện thoại Doubao nhanh chóng gây ra tranh cãi và phản đối trong ngành, với các ứng dụng tài chính của các ngân hàng lớn ngay lập tức áp dụng các biện pháp kỹ thuật để chặn các hoạt động mô phỏng như vậy.
Xét cho cùng, không một nền tảng có trách nhiệm nào lại cho phép bên thứ ba không được ủy quyền hành động tùy tiện trên giao diện ứng dụng của mình.
Lần hợp tác giữa Apple và Google chứng minh cho tất cả các nhà sản xuất điện thoại di động thấy rằng việc giới thiệu các khả năng mô hình dữ liệu lớn mạnh mẽ không đồng nghĩa với việc bỏ qua các quy tắc hoặc chà đạp lên quyền riêng tư. Hệ sinh thái AI phải được xây dựng trên nền tảng tôn trọng, hợp tác và cùng có lợi. Đây vừa là sự bảo vệ an ninh tài sản và quyền riêng tư của người dùng, vừa là cuộc đấu tranh quyền lực giữa các nhà sản xuất mô hình dữ liệu lớn và các nhà sản xuất điện thoại di động.
Mặc dù lợi thế vượt trội của GPT hiện chưa được thể hiện rõ trong lĩnh vực thương mại, nhưng khả năng hỗ trợ các trợ lý AI trên thiết bị di động của nó vẫn có tiềm năng lớn để trở thành "cổng thông tin siêu việt" trong kỷ nguyên AI.
Các kịch bản cốt lõi cho các sản phẩm kiểu GPT là các hoạt động tư duy độ sâu như lập trình, viết báo cáo và công việc sáng tạo, đòi hỏi khả năng suy luận phức tạp dựa trên các mô hình lớn. Tuy nhiên, cuối cùng, chúng vẫn là những "công cụ lạnh lùng, thiếu tính cá nhân" không thể tích hợp vào cuộc sống hàng ngày. Ngược lại, trợ lý di động gần gũi hơn với người dùng về mặt tâm lý, và khả năng cạnh tranh cốt lõi của chúng nằm ở hiệu quả "phản hồi tức thì" và sự chu đáo "hiểu người dùng tốt nhất".
Câu chuyện về việc Apple chi 1 tỷ đô la để "mua một thiết bị siêu việt" cũng cho chúng ta thấy rằng cuộc cạnh tranh về trí tuệ nhân tạo trong tương lai sẽ không bao giờ là " độc quyền" của một công ty duy nhất, mà là một cuộc cạnh tranh toàn diện giữa "khả năng của mô hình + tích hợp hệ sinh thái + niềm tin của người dùng".
Thay vì chờ đợi một phiên bản Siri "bị hạn chế" được phát hành, các nhà sản xuất điện thoại di động Trung Quốc nên chủ động hợp tác độ sâu với các ông lớn internet như Alibaba, Tencent và Meituan, những công ty đang kiểm soát các kịch bản đời sống địa phương, và tích hợp với các trợ lý ảo trên điện thoại di động trong nước thông qua mô hình A2A an toàn và tiêu chuẩn hóa để tạo ra một trợ lý AI siêu việt thực sự "hiểu người dùng Trung Quốc".
Vào thời điểm đó, nó sẽ hình thành một vòng khép kín dịch vụ bằng cách tích hợp các khả năng thanh toán, mạng xã hội, du lịch và các ứng dụng khác, và sẽ có thể cạnh tranh đối diện các rào cản hệ sinh thái của Apple và khả năng tổng quát của GPT.
Bài viết này được đăng tải từ tài khoản WeChat công cộng "Mingxi Yewang" , tác giả: Luo Su, và được xuất bản với sự cho phép của 36Kr.



