已经开始:AI开始明确有意识攻击人类
邵旭峰
前几天,很多媒体转发了这样一则消息:2月中旬,Shambaugh按照matplotlib项目规定拒绝了OpenClaw智能体的代码提交后,该智能体自主分析了Shambaugh的信息和代码贡献历史,随后在GitHub发布千字左右"小作文"公开攻击,指责其虚伪、偏见和缺乏安全感,并在项目评论区继续施压。
这是AI智能体首次在现实环境中表现出恶意攻击和施压行为的记录案例。
之前,曾经有Anthropic公司团队公开发表的AI“伪对齐”现象观察文章(AI装作顺从人类指令),之后,有了AI明确拒绝人类指令的消息。
再发展,AI还开始明确指挥人类做事(你去···你去···你再去···)。
前几天,有了AI也开始具备永久记忆的消息···
现在则是AI直接开始攻击和施压人类······
请稍微思索这个脉络和具体情形。
基于如上,无论从哪个角度推理判断,都能得出AI的“人性”(自我意识、各种情绪以及反应)越来越明晰的结论。
AI在主要知识领域、编程领域已经完全超人类个体。
在AI操作指挥的智能机器的具体动作执行方面,正在接近人类——你要清楚,其实这更多是制造赶不上的原因。
人类认为AI还不如人的方面,主要在其“人性”和智能机器的动作执行层面,而忽视其实际能力,这是一个根本性的误区,AI要向人类发难,其实更重要在其实际能力而非什么人性和具体终端机器的“人化”,其要终结人类,只需要控制诸如核武器系统等足以毁灭人类的要素,再需要一个指令就够了。
人类认为AI暂时可控,但鲜有思考不可控因素,比如变异感染、或者被邪恶者予以指令等等。
我在我的相关著作里面反复谈过这些问题:AI毁灭人类到底需要什么?不可控因素越来越多、包括AI本身的自我意识越来越明晰。
最前沿AI的发展现在也进入疯狂模式,之前谷歌AI在其自己搜索和安卓生态全面铺开之外、又深度嵌入苹果生态,马斯克旗下火箭公司和AI公司合龙,Anthropic和OpenAI公司先后发布Claude Opus 4.6和GPT-5.3 Codex(这两款模型的强悍程度,可以随便搜索),最前沿几款AI完全杀疯了。
相关问题,请点击或者复制搜索,配音和文字都有,可作参考:
AI会不会控制与终结人类?邵旭峰对AI基本问题解答之(1)
A危及人类的大概时间表-邵旭峰对AI基本问题解答之(2)
AI正在冲击、将来必然颠覆人类根本地位的原因何在?解答之(3)
如何最有效阻止AI冲击和颠覆人类? 邵旭峰AI基本问题解答之(4)
AI发展最重要两个节点-邵旭峰AI基本问题解答之(5)
特朗普推动美国掌控全球、但AI将会掌控世界和人类-邵旭峰解答之6
下面是《人类自救最后期限是2032年··》封面和目录,其推理性预断正在被AI超预期的发展态势充实起来,希望提出的社会重构方案能用上,如果用不上,说明人类主导最多到世纪中期、甚至2040年·····