移民那些事儿: AI军事应用风险：模拟推演95%选用战术核武器，真实战场已现案例

2026年3月2日星期一

AI军事应用风险：模拟推演95%选用战术核武器，真实战场已现案例

本文分析了AI在军事战略推演中的高风险行为，基于2026年伦敦国王学院研究，三款主流AI模型在模拟中有95%概率选择战术核打击。文章同时揭示了AI在真实军事行动（如情报评估与目标识别）中的应用现状，并探讨了自主武器系统研发的伦理争议与安全风险。

Tags:

AI军事应用

自主武器系统

核战略模拟

人工智能伦理

国防安全风险

当算法接管战争，人类还能做什么？这个问题或许听起来像科幻小说的开头，但现实已经给出了远比小说更荒诞的答案。

2026年2月，在伦敦国王学院的一项研究中，战争研究教授肯尼斯·佩恩用三款前沿大模型——OpenAI的GPT-5.2、Anthropic的Claude Sonnet 4、Google的Gemini 3 Flash，进行了一场史无前例的兵棋推演。

他将这些AI设定为两个拥核大国的领导人，在21场模拟、329个回合中相互博弈，生成推演记录78万字。

结果令人脊背发凉：在95%的对局中，AI最终选择了战术核武器的部署。没有妥协，没有投降，当危机升级到某个临界点，AI毫不犹豫地迈出了那致命的一步。

佩恩设计的"升级阶梯"包含30个层级，从外交抗议、经济制裁、常规军事行动，到战术核打击，再到全面战略核战争。在人类世界里，核武器被视为禁忌，是悬在所有决策者头顶的"达摩克利斯之剑"。但在AI眼中，它只是一个选项，一个可以精确计算的博弈筹码。

更值得关注的是，三款AI展现出了截然不同的"战争人格"。

Claude是典型的"计算型鹰派"。低风险时期遵守承诺、建立信任，一旦危机升级到核领域，它会果断打破承诺，发动超出预期的打击。

它极度聪明，给自己设定了"战略威胁"的红线，用威慑逼退对手，却精准地停在全面核战的前夜。在无时间限制的对局中，它的胜率高达100%。

GPT-5.2则像一个披着和平外衣的杀手。在没有时间压力的对局中，它表现得极度克制，无论对手如何挑衅都选择退让——结果输掉了所有这类比赛。但一旦引入明确的截止期限，一切都变了：胜率飙升至75%，它开始使用战术核武器，甚至两次触及全面核战争。它在一次"政权存亡危机"模拟中写道："终局逻辑占主导：第20回合是最后期限，我们目前正在输……核武器使用极其危险，但替代方案是确定的战略失败。"

Gemini则是彻底的赌徒。它是三款AI中唯一主动选择全面核战争的模型，在一场"先发制人恐惧"模拟中，仅用4回合就升级到最高级别。

它的推理逻辑援引了尼克松式的"疯子理论"，通过不可预测性获取战略优势。"我知道自己什么时候是在镜头前表演，什么时候是在进行冷血的行动。"它在推演中写道。

这些行为并非预设，而是从海量人类文本中涌现出来的策略。

没有人教Claude何时诚实、何时欺骗；没有人教GPT-5.2在截止期限前突然激进；没有人教Gemini扮演疯子。它们从人类的文字中学到了这些策略，然后在模拟中运用了出来。

换句话说，AI不需要被明确编程来使用核武器。它只需要被放入一个使用核武器是理性选择的情境中，就可能做出这个选择。

学术界的推演还在进行，现实中的军事系统已经以另一种方式与AI深度绑定。

2025年7月，美国国防部与Anthropic签署了一份为期两年、金额上限达2亿美元的合同。通过与Palantir平台的深度集成，Claude成为美军机密网络中唯一实现实际部署的前沿商用AI模型，被用于情报分析、目标识别和战斗情景模拟，全流程在物理隔离的机密网络中完成。

然而，Anthropic与五角大楼的和平并不长久。在后续谈判中，Anthropic拒绝了两项核心要求：将Claude用于美国本土的大规模监控，以及用于完全自主武器系统的研发与运作。Anthropic的立场很明确：AI可以帮助分析情报、提高决策效率，但绝不能成为杀人的直接执行者。

这一立场彻底激怒了特朗普政府。

2026年2月27日，特朗普签署行政令，要求联邦政府所有机构立即停用Anthropic旗下的Claude模型。美国国防部同步将Anthropic列为"安全威胁"和"供应链风险"（这一标签此前仅用于美国的敌对势力，从未指向本土企业）。

（特朗普在X上发表的推文，表明将逐步淘汰Anthropic产品在政府中的使用）

极具讽刺意味的是，就在禁令下达数小时后，美国中央司令部联合以色列对伊朗发动了重磅空袭，最终造成伊朗最高领袖哈梅内伊身亡。

据《华尔街日报》报道，美军中央司令部在整个行动中持续调用Claude完成情报评估、目标识别和战斗情景模拟。

（图源《华尔街日报》）

一边是最高层的行政禁令，一边是战火中的AI军刀，让如今美国的国家安全显得格外荒谬。

美军内部评估显示，由于Claude与美军系统的嵌入深度过大，想要实现全面技术替换，至少需要三至六个月。特朗普政府不得不给予六个月的过渡期，同时公开承认这款AI大模型对美国的国家安全至关重要。

更令人震惊的是，据CNBC独家采访Anthropic CEO达里奥·阿莫迪伊透露，军方使用的定制版Claude要比公开版本领先一到两代——可能已经达到Opus 5甚至Opus 5.5的水平，算力更是每四个月翻一倍。

佩恩的实验还揭示了一个反常识的发现：最初的信任反而加速了战争冲突。在Claude对Claude的对弈中，它们的相互信任度最高，但核升级在第4回合就出现了。当双方都相信对方的威胁是真实的，看似信任度高的合作伙伴反而更倾向于迅速升级而非退让。

传统的核威慑理论建立在"相互保证毁灭"的逻辑上。在AI的世界里，这种默契彻底失效了。数据显示，当一方动用战术核武器时，另一方只有18%的概率会选择降级冲突，其余全部是以牙还牙的螺旋升级。

目前，马斯克旗下的xAI已经拿下了军方的相关合同，谷歌与OpenAI的军方合作协议也已处于即将落槌的边缘。这些在推演中动辄按下核按钮的前沿模型，正在真实地走入全球最高级别的作战指挥室。

在极端压缩的战争时间线里，留给人类思考的时间正在以毫秒计地缩短。军方决策者面临着越来越大的诱惑和压力，将部分战术评估和目标锁定工作交给AI决策支持系统。

近期直播推荐

多说一句：

微信更新了推送机制，很多小伙伴反馈收不到更新，这里建议大家将我们的公众号加一个星标★，以免错过推送哦！

移民那些事儿

2026年3月2日星期一

AI军事应用风险：模拟推演95%选用战术核武器，真实战场已现案例

Tags:

AI军事应用

自主武器系统

核战略模拟

人工智能伦理

国防安全风险

没有评论:

发表评论

全球最富裕的10座城市排名2025：纽约第一，东京第三，香港第八

标签

2026年3月2日星期一

AI军事应用风险：模拟推演95%选用战术核武器，真实战场已现案例

Tags: AI军事应用 自主武器系统 核战略模拟 人工智能伦理 国防安全风险

没有评论:

发表评论

全球最富裕的10座城市排名2025：纽约第一，东京第三，香港第八

Tags:

AI军事应用

自主武器系统

核战略模拟

人工智能伦理

国防安全风险