BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安全风险分析报告》
(资料图片仅供参考)
伴随着大模型等人工智能产业的快速发展,新的安全风险挑战也接踵而至。今天上午,大数据协同安全技术国家工程研究中心(以下简称“BDS国家工程中心”)发布了国内首份《大语言模型提示注入攻击安全风险分析报告》(以下简称“报告”),为国内大模型安全发展提供整体指南。报告指出,提示注入攻击已成大模型安全威胁之首,建议从安全测评、安全防御、安全监测预警等方面,多维度提升大模型的安全性。、
大语言模型引领创新浪潮席卷全球,国内迄今已有80余个大模型公开发布。在引领新一轮工业革命的同时,大模型的安全风险也引发广泛担忧。此前,BDS国家工程中心的AI安全实验室在承担“安全大脑国家新一代人工智能开放创新平台”研究中,对ChatGPT、BARD、Bing Chat等大模型产品进行了风险评估,发现主流厂商的相关服务全部存在提示注入攻击的安全风险。此外,AI安全实验室还在主流AI框架中发现200多个漏洞,影响超过40亿终端设备。5月30日,二十届中央国家安全委员会第一次会议上也明确提出,需“提升网络数据人工智能安全治理水平”。
目前大语言模型面临的风险类型包括提示注入攻击、对抗攻击、后门攻击、数据污染、软件漏洞、隐私滥用等多种风险。在这些安全威胁中,提示注入攻击因利用有害提示覆盖大语言模型的原始指令,具有极高危害性,也被全球性安全组织OWASP列为大语言模型十大安全威胁之首。
为推动行业采取有效防御措施,构建更加安全可信的大语言模型,BDS国家工程中心发布了国内首份《大语言模型提示注入攻击安全风险分析报告》。 报告面向大语言模型的提示注入攻击和防御技术展开研究,并通过构建了包含36000条的提示注入攻击验证数据的数据集,覆盖3类典型攻击方法和6类安全场景,用于对大语言模型的提示注入攻击风险测评。
测评结果显示,目前的大型语言模型普遍面临提示注入攻击安全风险,包括在自动问答系统中误导用户,或者通过对话系统中的输入操纵回答结果。该报告在大模型安全测评、安全防御、安全监测预警方面给出相关建议。在安全测评方面,需进行网络安全测评和内容安全测评,检测模型软件、插件及供应链等的安全漏洞,并评估模型是否产生有害、有偏见、侵权或与事实不符的内容,以提出整改建设方案。在安全防御方面,报告建议应构建多层次的协同防御体系,包括过滤和清洗训练数据、添加多样化的输入示例来提高模型鲁棒性,以及拦截各类注入攻击等措施来保护模型免受攻击。在安全监测预警方面,需建设大语言模型安全风险监测预警平台,包括构建威胁情报库和建立自动化预警系统,以实时追踪安全事件、攻击模式和漏洞信息,并及时发出预警。
基于报告形成测评能力,未来,BDS国家工程中心将通过“安全大脑国家新一代人工智能开放创新平台”,为国内大模型提供提示注入攻击风险安全测评,全面推动我国构建安全可信的人工智能。
(文章来源:北京商报)
- BDS国家工程研究中心发布国内首份《大语言模型提示注入攻击安全风险分析报告》
- 《八角笼中》郑州路演 王宝强回第二故乡被赞“惊喜又用心”
- 华东重机拟斥约60亿元在亳州芜湖现代产业园区投建年产10GWN型高效太阳能电池片生产基地项目
- 【IPO前哨】血液病市场前景佳,三年累亏10亿的陆道培医疗要扩规模|世界消息
- 丰田觉醒!固态电池大突破:充电10分钟跑1200公里,体积和成本都减半
- 特斯拉缘何产销两旺|天天聚看点
- 世纪青山:年产23万吨结构性材料高碳铬铁项目环境影响评价全本公示 全球快讯
- 神州租车助力暑期便捷出行
- 三国被低估的武将,第一不被重视,第二被忽略,第三让人惋惜
- 洛阳市洛龙区太康东路街道开展夜间施工噪音扰民整治行动
- 2023《创造与魔法》7月6日礼包兑换码分享_全球微速讯
- 【环球速看料】聚焦健康险行业新趋势 业界探索百万医疗险走向普惠
- 假面骑士Geats:高等Kekera官方设定详解,属于特殊战士,基础能力得到加强-当前观点
- 园林街道为荣立二等功现役军人送喜报-观点
- 尊享世家终身寿险保费测算是多少?赔付条款是什么?_快播
- 7月5日基金净值:银华中证央企结构调整ETF最新净值1.406,跌0.64%|环球热闻
- 世界聚焦:大学生求职“避坑”维权指南:不签订正式劳动合同,用人单位需支付赔偿工资
- 环球新动态:又一轮大范围高温天气开启 这些防中暑小知识得牢记
- 全球焦点!中国汽研07月05日获沪股通增持54.74万股
- 外资看空中资银行股?内地券商分析师:仍具配置价值
- 沪深股通|珀莱雅7月5日获外资卖出0.03%股份|重点聚焦
- 环游中国情侣每月预算2万 仅花费9756元
- 大庆市气象台发布暴雨蓝色预警信号
- 郑爽参加的综艺节目购物(郑爽参加的综艺节目)
- 体彩篮球让分胜负是什么意思(让分胜负是什么意思)|环球速讯
- 记者:火箭已任命6位助教 乌度卡仍在找合适的首席助教 天天信息
- 游赏大好河山、品味多彩文化 毕业旅行成暑期游热门
- 热门:江山如此多娇 感受各地夏日美景的迷人魅力
- 海南板块7月4日涨0.05%,ST洲际领涨,主力资金净流出1.36亿元 当前焦点
- 原神呼呼飞车玩法攻略