加星标,才能不错过每日推送!方法见文末动图 多项研究表明,现在的AI已经能够无师自通地学会欺骗手段。在一些与人类选手的对抗游戏中,它们为了赢得游戏,会在关键时刻佯动欺骗,甚至制定周密阴谋,以化被动为主动,获得竞争优势。更有甚者,在一些检测AI模型是否获得了恶意能力的安全测试中,有的AI居然能识破测试环境,故意在测试环境中“放水”,减少被发现的概率,等到了应用环境中,才会暴露本性。 如果AI的这种欺骗能力未经约束地持续壮大,同时人类不加以重视并寻找办法加以遏制,最终AI可能会把欺骗当成实现目标的通用策略,在大部分情况下贯彻始终,那就值得当心了。 ![]() ![]() ![]() 图:AI控制的机械手假装握住了球,试图在人类面前蒙混过关丨来源:论文 参考文献 [1] https:///ai-deception/
![]() |
|