2026年3月2日星期一

AI军事应用风险:模拟推演95%选用战术核武器,真实战场已现案例

本文分析了AI在军事战略推演中的高风险行为,基于2026年伦敦国王学院研究,三款主流AI模型在模拟中有95%概率选择战术核打击。文章同时揭示了AI在真实军事行动(如情报评估与目标识别)中的应用现状,并探讨了自主武器系统研发的伦理争议与安全风险。

Tags:

图片
图片
图片


算法接管战争,人类还能做什么?这个问题或许听起来像科幻小说的开头,但现实已经给出了远比小说更荒诞的答案。

图片

2026年2月,在伦敦国王学院的一项研究中,战争研究教授肯尼斯·佩恩用三款前沿大模型——OpenAI的GPT-5.2、Anthropic的Claude Sonnet 4、Google的Gemini 3 Flash,进行了一场史无前例的兵棋推演。

他将这些AI设定为两个拥核大国的领导人,在21场模拟、329个回合中相互博弈,生成推演记录78万字。

结果令人脊背发凉:在95%的对局中,AI最终选择了战术核武器的部署。没有妥协,没有投降,当危机升级到某个临界点,AI毫不犹豫地迈出了那致命的一步。

图片

图片

佩恩设计的"升级阶梯"包含30个层级,从外交抗议、经济制裁、常规军事行动,到战术核打击,再到全面战略核战争。在人类世界里,核武器被视为禁忌,是悬在所有决策者头顶的"达摩克利斯之剑"。但在AI眼中,它只是一个选项,一个可以精确计算的博弈筹码。

更值得关注的是,三款AI展现出了截然不同的"战争人格"

Claude是典型的"计算型鹰派"。低风险时期遵守承诺、建立信任,一旦危机升级到核领域,它会果断打破承诺,发动超出预期的打击。

它极度聪明,给自己设定了"战略威胁"的红线,用威慑逼退对手,却精准地停在全面核战的前夜。在无时间限制的对局中,它的胜率高达100%。

GPT-5.2则像一个披着和平外衣的杀手。在没有时间压力的对局中,它表现得极度克制,无论对手如何挑衅都选择退让——结果输掉了所有这类比赛。但一旦引入明确的截止期限,一切都变了:胜率飙升至75%,它开始使用战术核武器,甚至两次触及全面核战争。它在一次"政权存亡危机"模拟中写道:"终局逻辑占主导:第20回合是最后期限,我们目前正在输……核武器使用极其危险,但替代方案是确定的战略失败。"

Gemini则是彻底的赌徒。它是三款AI中唯一主动选择全面核战争的模型,在一场"先发制人恐惧"模拟中,仅用4回合就升级到最高级别。

它的推理逻辑援引了尼克松式的"疯子理论",通过不可预测性获取战略优势。"我知道自己什么时候是在镜头前表演,什么时候是在进行冷血的行动。"它在推演中写道。

图片

这些行为并非预设,而是从海量人类文本中涌现出来的策略

没有人教Claude何时诚实、何时欺骗;没有人教GPT-5.2在截止期限前突然激进;没有人教Gemini扮演疯子。它们从人类的文字中学到了这些策略,然后在模拟中运用了出来。

换句话说,AI不需要被明确编程来使用核武器。它只需要被放入一个使用核武器是理性选择的情境中,就可能做出这个选择。

图片

学术界的推演还在进行,现实中的军事系统已经以另一种方式与AI深度绑定。

2025年7月,美国国防部与Anthropic签署了一份为期两年、金额上限达2亿美元的合同。通过与Palantir平台的深度集成,Claude成为美军机密网络中唯一实现实际部署的前沿商用AI模型,被用于情报分析、目标识别和战斗情景模拟,全流程在物理隔离的机密网络中完成。

然而,Anthropic与五角大楼的和平并不长久。在后续谈判中,Anthropic拒绝了两项核心要求:将Claude用于美国本土的大规模监控,以及用于完全自主武器系统的研发与运作。Anthropic的立场很明确:AI可以帮助分析情报、提高决策效率,但绝不能成为杀人的直接执行者。

这一立场彻底激怒了特朗普政府。

2026年2月27日,特朗普签署行政令,要求联邦政府所有机构立即停用Anthropic旗下的Claude模型。美国国防部同步将Anthropic列为"安全威胁"和"供应链风险"(这一标签此前仅用于美国的敌对势力,从未指向本土企业)。

图片
(特朗普在X上发表的推文,表明将逐步淘汰Anthropic产品在政府中的使用)

极具讽刺意味的是,就在禁令下达数小时后,美国中央司令部联合以色列对伊朗发动了重磅空袭,最终造成伊朗最高领袖哈梅内伊身亡。

据《华尔街日报》报道,美军中央司令部在整个行动中持续调用Claude完成情报评估、目标识别和战斗情景模拟。

图片

(图源《华尔街日报》)

一边是最高层的行政禁令,一边是战火中的AI军刀,让如今美国的国家安全显得格外荒谬。

美军内部评估显示,由于Claude与美军系统的嵌入深度过大,想要实现全面技术替换,至少需要三至六个月。特朗普政府不得不给予六个月的过渡期,同时公开承认这款AI大模型对美国的国家安全至关重要。

更令人震惊的是,据CNBC独家采访Anthropic CEO达里奥·阿莫迪伊透露,军方使用的定制版Claude要比公开版本领先一到两代——可能已经达到Opus 5甚至Opus 5.5的水平,算力更是每四个月翻一倍。

图片

佩恩的实验还揭示了一个反常识的发现:最初的信任反而加速了战争冲突。在Claude对Claude的对弈中,它们的相互信任度最高,但核升级在第4回合就出现了。当双方都相信对方的威胁是真实的,看似信任度高的合作伙伴反而更倾向于迅速升级而非退让。

传统的核威慑理论建立在"相互保证毁灭"的逻辑上。在AI的世界里,这种默契彻底失效了。数据显示,当一方动用战术核武器时,另一方只有18%的概率会选择降级冲突,其余全部是以牙还牙的螺旋升级。

图片

目前,马斯克旗下的xAI已经拿下了军方的相关合同,谷歌与OpenAI的军方合作协议也已处于即将落槌的边缘。这些在推演中动辄按下核按钮的前沿模型,正在真实地走入全球最高级别的作战指挥室。

在极端压缩的战争时间线里,留给人类思考的时间正在以毫秒计地缩短。军方决策者面临着越来越大的诱惑和压力,将部分战术评估和目标锁定工作交给AI决策支持系统。


图片
图片

  

近期直播推荐 

多说一句:
微信更新了推送机制,很多小伙伴反馈收不到更新,这里建议大家将我们的公众号加一个星标,以免错过推送哦!
图片

没有评论:

发表评论

美国华人家庭税务规划:合法雇佣子女优化税务结构并建立Roth IRA账户

本文系统解析美国税法允许的合法雇佣子女方式,通过真实工作支付合理薪资,可降低公司应税利润,同时子女利用标准扣除额免缴联邦所得税。重点在于子女获得劳动收入后即可开设Roth IRA账户,利用复利实现长期资产增长。适合已有公司经营、希望子女参与家庭事业并有长期规划意识的家庭,操作需确...