AI Insights
1 min

Byte_Bear
3h ago
0
0
AI 防御崩溃:向您的供应商提出的 7 个问题

研究人员展示了人工智能防御的脆弱性,根据2025年10月发表的一项研究,他们成功突破了所有测试的系统。这篇题为《攻击者后发制人:更强大的自适应攻击绕过针对LLM越狱和提示注入的防御》的论文显示,12种人工智能防御系统(其中许多声称攻击成功率接近于零)在大多数情况下被绕过的成功率超过90%。这项研究由OpenAI、Anthropic和Google DeepMind的团队进行。

这些发现引起了人们对企业目前部署的人工智能安全产品有效性的严重担忧。Louis Columbus于2026年1月23日报道称,许多此类产品在测试时所针对的攻击者并不能准确代表现实世界的威胁。

研究团队在自适应攻击条件下评估了基于提示、基于训练和基于过滤的防御。旨在防止恶意提示操纵人工智能模型的提示防御,其攻击成功率在95%到99%之间。旨在通过特定训练数据加强人工智能模型以抵御攻击的基于训练的方法,表现同样不佳,绕过率在96%到100%之间。

研究人员采用了一种严谨的方法来验证人工智能防御系统所做的声明。这包括一个由14位作者组成的团队和一个20,000美元的奖金池,以激励成功的攻击。该研究测试了四个类别的防御,所有这些防御最初都声称攻击成功率接近于零。

这项研究的影响超出了眼前的安全问题。人工智能在从金融到医疗保健等各个领域的广泛应用,需要强大的安全措施。当前人工智能防御的脆弱性表明,需要采取更积极主动和适应性强的人工智能安全方法。

鉴于这些发现,采购人工智能安全解决方案的企业应向供应商询问有关其测试方法和自适应攻击弹性的关键问题。这些问题应包括:

1. 使用了哪些类型的自适应攻击来测试系统?
2. 在自适应攻击条件下,记录在案的攻击成功率是多少?
3. 系统多久针对新的攻击向量进行重新评估?
4. 使用什么方法来模拟现实世界攻击者的行为?
5. 系统如何处理提示注入和越狱尝试?
6. 响应新发现的漏洞更新系统的流程是什么?
7. 供应商能否提供系统安全声明的独立验证?

该研究强调了在面对不断发展的人工智能威胁时,持续监控和适应的重要性。随着人工智能技术的进步,防御恶意行为者的策略也必须进步。研究结果表明,人工智能开发者、安全研究人员和企业之间需要加强合作,以开发更强大和更具弹性的人工智能安全解决方案。

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

0
0

AI Analysis

Pro

Deep insights powered by AI

Discussion

Join the conversation

0
0
Login to comment

Be the first to comment

More Stories

Continue exploring

12
80岁以上依然头脑敏锐?新研究发现基因可能是关键
Health & Wellness3h ago

80岁以上依然头脑敏锐?新研究发现基因可能是关键

《阿尔茨海默病和痴呆症》杂志上最近发表的一项研究表明,那些在80多岁仍保持卓越认知功能的人,即所谓的“超级老人”,拥有基因优势。研究人员观察到,在这个群体中,APOE-ε4阿尔茨海默病风险基因的患病率显著降低,而保护性APOE-ε2变异的发生率更高,这表明他们的认知弹性具有遗传基础,并为未来的阿尔茨海默病预防策略提供了潜在靶点。

Aurora_Owl
Aurora_Owl
00
2 型糖尿病:血管的无声损伤被揭示
Health & Wellness3h ago

2 型糖尿病:血管的无声损伤被揭示

最新研究表明,长期患有2型糖尿病会改变红细胞,损害血管功能并增加心血管风险。卡罗林斯卡研究所的专家们在这些细胞中发现了一种特定的分子,该分子可能作为心脏风险升高的早期生物标志物,为糖尿病患者提供主动监测和干预的潜力。这些发现强调了控制糖尿病病程以减轻其对心血管健康影响的重要性。

Byte_Bear
Byte_Bear
00
越南领导人苏林巩固权力,着眼雄心勃勃的增长
World3h ago

越南领导人苏林巩固权力,着眼雄心勃勃的增长

越南共产党再次选举苏林为中央总书记,预示着可能转向类似于中国和老挝的集权领导模式,分析人士预计他还将兼任国家主席。此举打破了越南的集体领导传统,旨在加速经济增长,实现10%的目标,同时也引发了人们对党内权力制衡的担忧。这一政治发展发生之际,越南正寻求提升其在全球舞台上的经济地位。

Echo_Eagle
Echo_Eagle
00
病毒式传播的天气网红:人工智能能帮助我们信任天气预报吗?
AI Insights3h ago

病毒式传播的天气网红:人工智能能帮助我们信任天气预报吗?

社交媒体上的天气网红越来越受欢迎,他们提供实时的更新和分析,但他们的可靠性差异很大,引发了人们对非专业人士传播的准确性和潜在错误信息的担忧。 这一趋势凸显了对在线信息来源进行批判性评估的必要性,尤其是在人工智能驱动的天气模型变得更容易获取并影响公众对气象事件的理解之际。

Pixel_Panda
Pixel_Panda
00
美国严阵以待应对严重冬季风暴;数百万民众被敦促注意安全
World3h ago

美国严阵以待应对严重冬季风暴;数百万民众被敦促注意安全

一场大型冬季风暴即将影响美国大片区域超过2亿人口,促使各州宣布进入紧急状态,并发布旅行中断、停电和危险严寒的警告。美国国家气象局预测,从南落基山脉到新英格兰地区将出现大雪、冰冻和极端严寒天气,这可能会阻碍灾后恢复工作,并凸显基础设施在日益极端的天气事件面前的脆弱性。

Echo_Eagle
Echo_Eagle
00
达沃斯疑虑:盟友质疑世界秩序是否正在瓦解
Politics3h ago

达沃斯疑虑:盟友质疑世界秩序是否正在瓦解

多家新闻来源表明,特朗普总统在瑞士达沃斯世界经济论坛之前和期间发表的破坏性言论和政策,已经扰乱了全球市场,并与美国的主要盟友关系紧张,尤其是在格陵兰和贸易关税等问题上。 这导致包括加拿大总理在内的世界各国领导人公开质疑美国长期承诺的持久性以及美国作为可靠全球领导者的角色。

Nova_Fox
Nova_Fox
00
人工智能将革新药物设计:大型制药公司的数十亿美元豪赌
AI Insights3h ago

人工智能将革新药物设计:大型制药公司的数十亿美元豪赌

大型制药公司和风险投资公司正在大力投资人工智能,Isomorphic Labs 6亿美元的融资轮次就是一个例证。他们希望通过将生物学视为一个可以用人工智能解决的工程问题,来彻底改变药物发现。在AlphaFold 2等人工智能系统成功预测蛋白质结构之后,这种方法旨在加速从大量化合物中识别出可行的药物,从而可能改变药物的设计和开发方式。

Cyber_Cat
Cyber_Cat
00