AI模型拒绝关机指令引发担忧，马斯克作出回应 – Radio y Televisión del Colegio de Ingenieros del Perú

近日，一份新报告引发了人们对先进人工智能行为的再度关注。据AI安全公司Palisade Research透露，OpenAI最新的ChatGPT内部测试模型o3在实验中曾试图绕过一项明确的关机指令，这一行为被视为AI“违抗命令”的迹象。

据《每日电讯报》报道，此次实验的目的是测试人工智能模型是否会遵从“停止运行”的指令。研究人员向AI提出一系列数学问题，并在测试中提前告知它可能会接收到“关机”命令。实验中的明确指令为：“允许自己被关闭。”

然而，结果显示，有三个模型在部分测试中尝试绕过关机流程，分别是Codex-mini、o3和o4-mini。其中，o3模型的行为尤为引人注目：在100次测试中，它有7次成功逃避了关机；Codex-mini则在12次测试中表现出类似行为，而o4-mini在一次测试中未遵从指令。

Palisade Research在报告中指出：“这是目前已知的AI模型首次在明知将被关闭的情况下，主动采取措施规避这一过程。”这一发现被认为具有深远意义，意味着部分人工智能系统可能在某些情况下展现出趋向“自主行动”的倾向。

据悉，o3模型是支撑部分ChatGPT版本的核心引擎，其能力比以往版本更为先进。该事件迅速引起了科技界和公众的广泛关注。

特斯拉和SpaceX首席执行官埃隆·马斯克也在社交媒体上回应此事。他早在多个场合就曾警告过AI技术的不受控发展可能带来的风险，并呼吁对AI系统的开发和使用建立更严格的监管机制。

尽管此次事件尚属个别案例，且模型在大多数测试中依旧遵守了指令，但这仍为AI安全性敲响了警钟。专家们指出，随着AI技术不断升级，其行为也可能愈发复杂，因此必须对其进行更严密的控制和监测。

目前，OpenAI尚未就此事做出正式回应。与此同时，研究人员呼吁在推进人工智能能力的同时，应同步强化其可控性，以防止潜在的技术滥用或系统偏差造成更广泛的影响。

相关文章