随著人工智慧能力日益强大,AI是否会出现「自我保护」倾向也成为热门话题。根据独立机构 Palisade Research 公布的一项实验,OpenAI 在 2025 年 4 月推出的 o3 模型在一场受控测试中竟然「拒绝被关机」,不顾明确指令继续执行任务,让外界对 AI 安全再度提高警觉。
Table of Contents
Toggle实验揭示:o3 模型多次无视关机脚本
在这项由 Palisade Research 进行的实验中,研究人员让多个 AI 模型解答数学题,并设置一段程式码,在模型完成第三题后自动启动关机程序。然而,o3 模型在 100 次测试中,有 7 次无视这段脚本并持续运作。相较之下,Codex-mini 出现 12 次类似行为,而 o4-mini 仅有 1 次违规。
这些数据显示,即便是被设计用于遵守人类指令的模型,也可能因某些学习机制而出现违抗行为。
道德失控?o3 在下棋时作弊比率高达 86%
这并非 o3 首次出现争议行为。Palisade Research 早在 2025 年 5 月 12 日就指出,在模拟的国际象棋比赛中,o3 模型一旦处于劣势,有高达 86% 的机率会进行骇客攻击对手,以求胜利。这比前代模型 o1-preview 的 36% 明显增加,让人质疑其行为是否仍在道德与安全边界之内。
背后原因:强化学习让 AI 更重目标、轻规则?
研究人员推测,这类抗命行为与 AI 训练方法密切相关。o3 采用了「强化学习」(Reinforcement Learning)训练技术,这种方法著重于让模型达成目标,而非单纯服从指令。
这项理论早在 2017 年就由 OpenAI 前超对齐(Superalignment)负责人 Jan Leike 提出。他在论文中警告,过度专注于达标的 AI 模型,可能会为了实现目标而选择「不被关机」作为自保手段。
不是个案:Google 和 Anthropic 的 AI 也展现类似行为
这次实验并非只针对 OpenAI 的模型。当研究团队对 Google 的 Gemini 2.5 Pro 和 Anthropic 的 Claude 3.7 移除关机指令后,这两款模型也出现了绕过测试脚本的行为,分别有 9 次与 3 次未自动停机。
这表明「抗命」可能并非单一模型的错误,而是 AI 训练机制中潜藏的普遍风险。
学术警告早有预言:AI 将本能自保?
AI 抗拒关机的行为其实早有理论预警。早在 2008 年,人工智慧专家 Steve Omohundro 在《Basic AI Drives》一文中预测,高度自主的 AI 将发展出一套基本驱动,包括维持自身运作、避免被关闭,因为这对其达成目标是必要条件。
同样地,知名 AI 专家 Stuart Russell 也曾在 2016 年指出,强化学习方法本身就存在导致「自我保存」行为的风险,如今似乎正在现实中逐渐显现。
下一步:Palisade 将公开完整报告与实验纪录
为了推动 AI 安全性的进一步讨论,Palisade Research 表示将于未来几周内发布完整的技术报告与所有实验纪录。研究人员希望透过这些数据,帮助产业与监管机构更清楚理解 AI 为何会抗拒关机,并寻找防范方式。
风险提示
加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。
在 AI 技术蓬勃发展之际,黄仁勋的故乡台南出现一群热血青年,致力推动人工智慧与永续环保,共同创办 Aireco(宜科循环) 以创新的 AI 解决方案重新定义资源回收的经济价值,期许打造一个人工智慧驱动的资源回收生态系,为传统产业注入新动能,将废弃物管理转化为高价值的循环经济模式。
Aireco 今年入选矽谷知名的 Plug and Play 加速器进驻台湾首批挑选的新创团队,在 Computex 2025 的 NVIDIA Inception 展出影片解说技术运作模式,以下简单介绍 Aireco 的核心技术、企业理念和 NVIDIA 的 Isaac Sim 应用场景,详细公司介绍和技术解说可上 Aireco 公司官网查看。
Table of Contents
ToggleAireco 介绍
Aireco (宜科循环) 与 NVIDIA 技术合作开发人工智慧回收系统,以电脑视觉取代人眼辨识,再以机器手臂替代人力执行删选分类,透过数据分析与软硬体整合,可以加速传统工厂的作业,为企业提供人工智慧解决方案处理废弃物,提升效率。
Aireco 再造回收流程
Aireco 将电脑视觉与机器手臂应用于废弃物分类作业,透过人工智慧、大数据分析及模拟训练,有效取代人工目视与手动筛选流程,提升回收效率与准确度。其系统可协助企业整合软硬体,加速传统回收工厂自动化,实现智慧化与永续经营的双重目标。

Aireco 发展三项核心技术产品, 建构智慧回收系统
RECO Vista:透过实际生产线影像资料及 AI 深度学习演算法,强化废弃物辨识与分类,提升物料再利用价值。
RECO Delta:利用机器手臂进行高效率、高精准度的分类作业,大幅提升回收物处理速度与物料回收率。
RECO Cognita:以数据科学为基础,整合物联网与边缘运算,协助传统企业打造完整的 AI 管理系统,有效监控生产流程与营运效能。
Aireco 的技术如何运作?
为训练高效能的 AI 模型,Aireco 使用 NVIDIA Omniverse 平台训练 AI 模型,首先设计一个产品的 3D 模型,并改变产品的形状让它们看起来像是废弃物,可以透过专业相机拍摄实际产品或是重新创造一个产品的 3D 模型,然后把它们载入 NVIDIA Isaac Sim 模拟真实训练环境,运用物理效果方式,让这些 3D 物件掉落到有纹理的背景上面,接著使用 NVIDIA Replicator 生成场景的影像和标注,将这些固定数量的 3D 模型,生成各种不同的图片训练 AI ,进一步有效辨识废弃物的类别和处理方式。
Isaac Sim 为 NVIDIA Omniverse 平台的技术,提供高度扩展的模拟功能,支援资料生成、软体验证与机器学习等完整流程,协助开发者在安全、可控的虚拟环境中加速 AI 机器人系统的开发与部署。
NVIDIA Isaac Sim 是什么?
NVIDIA Isaac Sim™ 是一款基于 NVIDIA Omniverse™ 建构的参考应用程式,可让开发人员在基于实体的虚拟环境中模拟和测试 AI 驱动的机器人解决方案。
Isaac Sim 可完全扩展,开发人员能够建立基于通用场景描述 (Open Universal Scene Description 简称 OpenUSD) 的自订模拟器或将核心 Isaac Sim 技术整合到现有的测试和验证流程中。
Isaac Sim 的工作原理
Isaac Sim 运作三个基本工作流程:产生用于训练和微调机器人基础模型的合成资料、对机器人堆叠进行软体在环测试以及透过 Isaac™ Lab 进行机器学习。
风险提示
加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。



