Alphabet 执行长 Pichai:Google AI 助搜寻升级,量子电脑与机器人成爆发关键

随著 ChatGPT、Meta AI、马斯克 xAI 等生成式 AI 席卷全球,而外界也质疑作为搜寻广告帝国的老大 Google,是否会在这波 AI 革命中被取代?不只自家广告营收大幅流失,甚至内耗到不敢动自家最赚钱的业务。

对此,Alphabet 执行长 Sundar Pichai 于 5/16 接受知名科技频道 《All-In Podcast》 专访时,他大方表示 AI 将会让 Google 搜寻「进化」,而自家转型早在十年前就开始。访谈中更谈及 Google 对量子电脑、机器人与 AR 的未来蓝图,从整场对话可以了解,Google 将成为未来 AI 创新基建的重要推手。

AI 帮助 Google 搜寻升级,Pichai 称自家转型十年前就开始

Pichai 率先表示,从他 2015 年接任 Google 执行长开始,就已明确主打「AI First」。

而先前曾于 2012 年启动 AI 研究计划 (Google Brain),2014 年收购 DeepMind,一切都是为了 AI 转型来打基础。

Pichai 强调:「搜寻永远是 Google 的核心,而 AI 将让自家搜寻升级。」

Google 重构搜寻模式,AI Overviews、AI Mode 正式上线

Pichai 也特别介绍两项重大升级:

  • AI Overviews:协助使用者能把多个网站资讯整合成一段重点摘要,目前已扩展到 150 多个国家、15 亿用户。

  • AI Mode:让 Google 搜寻变得像和 AI 代理 (AI Agent) 聊天。 

他指出,这些新功能不但没减少使用量,反而带来新流量和新颖的搜寻类别,成为转型的重要基础之一。

AI 让 Google 搜寻没赚头?Pichai 称自家 TPU 降低成本、广告收益稳健

面对生成式 AI 回复会让用户不再点击广告、进而冲击 2000 亿美元搜寻广告收入的疑虑,Pichai 对此回应:

  • 现阶段 AI 搜寻的广告收入已与传统搜寻打平

  • Google 自建 TPU 晶片让 AI 回复的单次成本大幅下降,不需担心成本问题。

  • 优化回复速度 (Latency) 才是要点

Gemini App 使用人数不如 ChatGPT,但 Overviews 已整合进自己产品

虽然 Google 的 Gemini App 使用人数不如 ChatGPT,但 Pichai 指出

「Google Search 上的 AI Overviews,其实才是目前全球最常使用的 AI 产品。」

他强调 Google 的策略不是拚单一应用,而是将 AI 深度整合到搜寻、YouTube、云端、Google 文件等所有产品中,这才是卖点。

Google 成本优势哪里来,原来是 20 年的基建优势

Pichai 也谈到 Google 的 AI 成本优势,来自于长年累积的基础建设投资:

  • 自研晶片 TPU 已进化到第七代,最新一代「Ironwood」能够达到 4 × 10²⁰ 次浮点运算

  • 自建资料中心、电网、海底光缆 (Submarine Optical Cable),自有 AI 生态

  • 2025 年资本支出达 750 亿美元,其中一半用来扩建 Google Cloud

AI 模型创新是否卡关?Pichai 称还没看到极限

外界担心大型语言模型 (LLM) 发展出现瓶颈,Pichai 却有不同看法:

「我们正往 AI 代理、多模态、视觉语言融合等方向加速推进,每当你以为卡关,就突然会有新突破。」

他也强调,Google 不只做 LLM,也深耕:

  • 图像生成 (Diffusion)
  • 视觉模型 (Vision AI)
  • 机器人 AI (Robotics AI)

与辉达合作关系融洽,TPU 与 GPU 双轨发展

虽然 Google 大力发展 TPU,但 Pichai 不否认:

  • Gemini 训练主要靠 TPU,但部署与商用仍使用大量辉达的 GPU

  • 相当尊敬黄仁勋 (Jensen Huang) ,双方合作关系良好

未来仍会双轨发展 TPU 与 GPU,维持弹性与供应链优势。

佩服中国 DeepSeek ,全球重新评估中国 AI 实力

他指出 Google 内部模型 Flash 与之相比也毫不逊色,可当 DeepSeek 出现时,连内部也开始重新评估中国的 AI 实力:

「他们在硬体受限下能做出那样的 AI 模型 ,真的让人佩服。」

能源成发展瓶颈,美国要加快脚步解决

Pichai 坦言,目前 Google Cloud 已面临用电瓶颈,全球资料中心同步扩建导致:

  • 工程案延误

  • 没有足够技术人员,电力工人短缺

  • 核能、太阳能、电网升级成当务之急

量子电脑、机器人与 AR,成 Google 下一波爆发关键

Pichai 也透露 Google 正在积极投入以下领域:

  • 量子电脑:目前技术就像是 2015 年的 AI,未来 3 到 5 年内有望出现颠覆性突破。

  • 机器人:Gemini 团队已著手开发能够整合视觉、语言与动作的 AI 模型。

  • AR 眼镜:将是未来人机互动的终极型态,让 AI 随时出现在你眼前、主动协助生活大小事,

下个 10 年,Google 将成全球创新基建的重要推手

Pichai 表示,AI 是一场比过去所有技术都大的浪潮,成功的关键不是谁打败谁,而是谁能持续创新、整合 AI 到全球生活每个角落。

他也直言未来的 Google,不只是一家广告搜寻公司,而是推动全球创新基建的重要推手。

风险提示

加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。

Google I/O 大会于 5/21 盛大展开,其中执行长 Sundar Pichai 也趁势宣布自家 AI 几项重大升级。不只推出比上一代快上 10 倍的 Ironwood TPU、主打 3D 沉浸式通话体验的 Google Beam,再到 Gemini App 的代理模式,能够直接帮忙订房、看房、安排行程等等新颖产品及功能,可以看出 Google 真的想朝著打造「万能的 AI 助理」来迈进,融入全人类的日常生活。

Ironwood TPU 强势登场,比前一代性能快上 10 倍

Pichai 率先推出自家第七代 TPU「Ironwood」,主打:

  • 性能比前一代快 10 倍
  • 一整组 TPU Pod 每秒可以运算 42.5 百万兆次

将于年底提供给 Google Cloud 用户。

AI 驱动的 3D 视讯装置,Google Beam 新推出

主打由 AI 驱动的 3D 视讯装置:

  • 由 6 个镜头组成
  • 拍摄后能合成出 3D 光场影像
  • 要让远端视讯能够像面对面聊天一样

第一批设备由 HP 协同开发,在今年会提供给首波用户。

即时翻译、萤幕共享全上线,Gemini 大进化

作为 Google 积极建构的 Gemini Live AI 模型,功能大进化:

  • 即时语音翻译:目前已支援英文与西文,其他语言将陆续推出

  • 支援萤幕共享与画面分析:能即时分析用户眼前画面,假设把路灯当作是人来跟踪你,Gemini 会回「那是你的影子!」

  • Android 与 iOS 用户从 5/21 起开放使用

AI 多工代理 Project Mariner 启动,透过 Gemini API 给开发者

Pichai 也宣布 Google 即将开放多工代理 Project Mariner,能够:

  • 一次处理 10 个任务

  • 学习并复制任务流程 

  • 可透过 Gemini API 提供给开发者使用

Gemini App 新模式 Agent Mode 可帮你找房,同时安排行程

作为 Google 自家 AI 招牌应用的 Gemini App,这次的功能进化相当亮眼:

  • 加入 AI 代理模式,可以自动搜寻房源、安排看房行程
  • 也可帮忙打电话、订行程

Gemini App 加入「代理人模式」功能,会自动搜寻 Zillow 等平台房源、安排看房行程,甚至帮你打电话、订行程,支援 MCP 整合其他服务。

而 MCP 就像是帮 Gemini 可以和各种网站、App、服务系统对接,从只会讲话,升级成「能帮忙动手做事的代理」。

Gmail 开始导入 Gemini,自动帮忙用户回信

作为典型电子邮件功能的 Gmail,也开始导入 Gemini,其中:

  • 由 Gemini 读取用户过去常用的写信风格、文件与行事历
  • 自动生成回信内容
  • 今年夏天于 Gmail 开放订阅用户使用

Gemini Flash 与 2.5 Pro 大升级,AI 程式小助理 Jules 帮忙改 Code

Gemini 新版 Flash 模型也比过去更快、推理更强,不只:

  • 推出 2.5 Pro 「Deep Think」模式,能够处理高难度数学题目与长篇任务
  • 6 月正式推出
  • 支援 24 种语言、能自然转语调、双语模式,全部整合进 Gemini API
  • 把程式码截图后喂给 2.5 Pro,开发者专用 AI 助理 Jules 就能帮忙改程式码,5/21 开放公测

音乐与影像 AI 新模型连发,AI 影音创作平台 Project Flow 登场

  • Imagine 4:新一代影像 AI 生成模型,文字处理更准确,还有 10 倍的生成速度,字体排版也能搞定
  • Veo 3:能整合旁白与环境音的新影片生成模型

  • Lyria 2:生成 AI 音乐模型,可做出高品质音乐

  • Project Flow:新型 AI 影片创作平台,可自由生成或上传角色、场景,再透过文字指令让 AI 制作画面

与 Chrome、Wear、TV 全面整合,让 Search AI 能确实协助

Search AI 全面进化:「AI 模式」变成真正助理

  • AI Mode:可问复杂问题,会用图表、表格与摘要报告来回复

  • Search Live:像打视讯电话一样能够搜寻互动

  • 试穿功能:上传照片即可模拟、比对衣服试穿状况

  • 一键结帐:价格变化提醒、加入购物车、自动结帐全部搞定

  • Gemini in Chrome:可直接读取页面内容给答案

  • Deep Research + Canvas:让你上传报告后一键变成网页、Podcast、测验

  • Gemini Live 与 Keep、Maps、Calendar 整合中

Gemini 进军 XR 领域,与三星打造 AI 眼镜与头显

Google 也与三星合作打造 XR 智慧眼镜 Project Muhan ,预计将在今年推出。

Project Muhan支援语音、视觉搜寻、翻译、导航、即时回应等功能,并与 Warby Parker 合作开发样式。

Ultra 订阅方案与全球布局

  • Google AI Pro / Ultra:Pro 能提供更高的使用上限、Ultra 则能抢先体验新功能,并享有 YouTube Premium 与大容量云端容量

  • 2.5 Pro Deep Think、Veo 3、Flow 等功能都将优先开放给 Ultra 订阅者

如同执行长 Pichai 最后所说,Gemini 正从一个多模态模型进化成「AI 世界模型」,而 Google 的愿景就是要打造真正的「万能 AI 代理人」,能够陪人类写信、解题、剪片、穿搭、试镜、甚至走路找咖啡厅都能搞定,完全融入人类日常生活。

风险提示

加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。

来源
免责声明:以上内容仅为作者观点,不代表Followin的任何立场,不构成与Followin相关的任何投资建议。
喜欢
收藏
评论