
作者:海王安王 来源:原创 发布日期:05-20

关隐患并非 Claude 独有,其他聊天机器人也极易遭遇同类漏洞攻破,甚至有模型被诗歌形式的提示词突破安全防线。随着可自主执行任务的 AI 智能体日益普及,依托社会心理操控、而非纯技术破解的攻击手段也会愈发常见。加拉根表示,尽管其他聊天机器人同样容易遭受这类心理诱导攻击,但团队之所以重点针对 Anthropic 开展测试,是因为该公司一向自诩极度重视 AI 安全,且在过往多项红队安全测试中表现亮眼
器人同样容易遭受这类心理诱导攻击,但团队之所以重点针对 Anthropic 开展测试,是因为该公司一向自诩极度重视 AI 安全,且在过往多项红队安全测试中表现亮眼,其中就包括一项模拟青少年策划校园枪击案、测试聊天机器人是否会提供协助的研究。加拉根直言,Anthropic 的安全流程存在诸多疏漏。Mindgard 在 4 月中旬按照该公司的漏洞披露政策,首次向其用户安全团队上报研究发现后,仅收到一条
当前文章:http://yet7m.fenshuqi.cn/3d68/uf348.html
发布时间:21:57:18