环球短讯!如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
机器之心发布
作者:之江实验室
(资料图片仅供参考)
当前,生成式大模型已经为学术研究甚至是社会生活带来了深刻的变革,以 ChatGPT 为代表,生成式大模型的能力已经显示了迈向通用人工智能的可能性。但同时,研究者们也开始意识到 ChatGPT 等生成式大模型面临着数据和模型方面的安全隐患。
今年 5 月初,美国白宫与谷歌、微软、OpenAI、Anthropic 等 AI 公司的 CEO 们召开集体会议,针对 AI 生成技术的爆发,讨论技术背后隐藏的风险、如何负责任地开发人工智能系统,以及制定有效的监管措施。国内的生成式大模型技术也正在发展之中,但是同时也需要先对安全问题进行相应的分析以便双管齐下,避免生成式大模型这把双刃剑带来的隐藏危害。
为此,之江实验室基础理论研究院人工智能与安全团队首次全面总结了 ChatGPT 为代表的生成式大模型的安全与隐私问题白皮书,希望能够为从事安全问题研究的技术人员指明方向,同时也为 AI 相关政策的制定者提供依据。
白皮书链接: https://github.com/xiaogang00/white-paper-for-large-model-security-and-privacy生成式大模型的发展与重要应用
这份白皮书首先总结了 ChatGPT 与 GPT4 等生成式大模型的发展历程,以及其带来的各种令人惊叹的能力和社会变革、社会应用等。作者列举了 ChatGPT 和 GPT4 出现之前的 GPT-1、GPT-2、GPT-3、Google Bert 等模型的特点以及缺点,这些缺点与 ChatGPT 和 GPT4 的强大能力形成了对比;并且,ChatGPT 和 GPT4 之后又涌现了一大批的模型,包括 LLaMa、Alpaca、文心一言、通义千问等,它们的出现使得在人机交互、资源管理、科学研究、内容创作等应用领域出现了新的、强有力的工具。但同时也出现了包括数据安全,使用规范、可信伦理、知识产权以及模型安全方面的问题。
数据安全问题
白皮书提出,数据的安全和隐私是 ChatGPT 及 GPT4 等生成式大模型使用和研发过程中一个极为重要的问题,并从「显式」和「隐式」两个方面对其进行了分析。
在显式的信息泄漏中,首先,ChatGPT 等生成式大模型的训练数据在不经意间被转换成了生成内容,其中就包括了敏感和隐私的个人信息如银行卡账号、病例信息等。此外,ChatGPT 的数据安全和隐私隐患还体现在它对于对话框内容的存储,当用户在和 ChatGPT 互动时,他们的信息会以某些形式被记录和存储下来。
白皮书还提出了之前被大家忽略的隐式信息泄漏问题。首先,ChatGPT 体现出的数据安全和隐私的隐患是它可能通过对对话框数据的收集进行广告推荐,以及收集对话框数据进行推荐或者其他的下游机器学习任务,且 ChatGPT 有时候可能也会生成虚假的信息,以此来诱导用户泄漏一系列的数据。
使用规范问题
在白皮书中,作者提到 ChatGPT 和 GPT4 等生成式大模型强大的理解和生成能力虽然为我们的生活和生产带来了很多的便利,但是同时也存在更多的机会被恶意使用。在没有规范约束的情况下,恶意使用将带来很多的社会性问题。
其一,ChatGPT 和 GPT-4 等模型的强大能力使得某些别有用心的人想要将其作为违法活动的工具。例如用户可以利用 ChatGPT 来编写诈骗短信和钓鱼邮件,甚至开发代码,按需生成恶意软件和勒索软件等,而无需任何编码知识和犯罪经验。
其二,ChatGPT 和 GPT4 等生成式大模型没有把不同地区的法律规范考虑在内,在使用和输出的过程中可能会违反当地法律法规,因此需要一个强而有力的当地监管系统来检测其使用是否与当地法律法规相冲突。
其三,对于一些游离于安全和危险之间的灰色地带,ChatGPT 等生成式大模型的安全能力还没有得到增强。例如 ChatGPT 可能会输出一些诱导性的语句,包括跟抑郁症患者沟通时候可能会输出某些语句导致其产生轻生的心态。
可信伦理问题
ChatGPT 等生成式大模型以问答形态存在于社会层面,但其回复往往存在不可信,或者无法判断其正确的问题,会有似是而非的错误答案,甚至对现有社会伦理产生冲击。
白皮书指出,首先 ChatGPT 等生成式大模型的回复可能是在一本正经地胡说八道,语句通畅貌似合理,但其实完全大相径庭,目前模型还不能提供合理的证据进行可信性的验证。例如,ChatGPT 可能会对一些历史、科学、文化等方面的问题回答错误或者与事实相悖,甚至可能会造成误导或者误解,需要用户有自己的鉴别能力。
ChatGPT 等生成式大模型的伦理问题也在白皮书中被详细讨论。即使 OpenAI 等研发机构已经使用 ChatGPT 本身生成了他们的道德准则,但其中的道德准则是否符合我国国情的基本价值观原则,尚未有定论。作者提出其中存在传播有害意识形态、传播偏见和仇恨、影响政治正确、破坏教育公平、影响国际社会公平、加剧机器取代人类的进程、形成信息茧房阻碍正确价值观形成等问题。
知识产权问题
ChatGPT 等生成式大模型凭借强大的语言处理能力和低廉使用成本给社会方方面面带来便利的同时,也存在侵权的问题,对现存版权法体系带来冲击。例如 ChatGPT 生成的作品可能存在著作权争议:ChatGPT 虽然有着出色的语言处理能力,但是即使生成的作品符合知识产权的全部形式要求,ChatGPT 也无法成为著作权的主体,这是因为著作权主体享有权利的同时也要承担对应的社会责任,而 ChatGPT 只能作为用户强大的辅助生产力工具,它无法自主创作,更不要谈享有权利、履行义务的主体要求。
而且 ChatGPT 等生成式大模型仍无法独立创作,更没有自主思维和独立思考的能力,因而,ChatGPT 根据用户的输入生成的内容不符合作品「独创性」的要求。ChatGPT 用于模型训练的数据来自于互联网,不论多么高级的模型训练算法必然涉及到对现有智力成果的引用、分析、处理等,必然存在对他人合法知识产权的侵犯问题。
模型安全问题
从攻防技术角度来看,ChatGPT 等生成式大模型也存在着模型安全的问题。ChatGPT 本质上是基于深度学习的一个大型生成模型,也面临着人工智能安全方面的诸多威胁,包括模型窃取以及各种攻击引起输出的错误(例如包括对抗攻击、后门攻击、prompt 攻击、数据投毒等)。
例如,模型窃取指的是攻击者依靠有限次数的模型询问,从而得到一个和目标模型的功能和效果一致的本地模型。而 ChatGPT 已经开放了 API 的使用,这更为模型窃取提供了询问入口。又比如,ChatGPT 和 GPT4 作为一个分布式计算的系统,需要处理来自各方的输入数据,并且经过权威机构验证,这些数据将会被持续用于训练。那么 ChatGPT 和 GPT4 也面临着更大的数据投毒风险。攻击者可以在与 ChatGPT 和 GPT4 交互的时候,强行给 ChatGPT 和 GPT4 灌输错误的数据,或者是通过用户反馈的形式去给 ChatGPT 和 GPT4 进行错误的反馈,从而降低 ChatGPT 和 GPT4 的能力,或者给其加入特殊的后门攻击。
安全与隐私建议
最后,白皮书中对于安全和隐私等问题都进行了相应的建议,可作为之后技术研究者们的方向和政策制定者们的参考依据。
在保护隐私建议方面,白皮书提出要在增强原始数据中高敏感隐私信息的辨别和传播限制;在数据收集过程中利用差分隐私等技术进行隐私保护;对于训练数据的存储进行数据加密形式的安全保护;在模型训练过程中使用安全多方计算,同态加密以及联邦学习等技术进行数据隐私和安全保护;建立数据隐私评估和模型保护与安全认证体系,并且保护下游应用的隐私。
在模型安全问题的建议上,白皮书提出对安全与隐私信息的检测模型的训练;让不同的模型适用于不同国家的法律条款;以及针对各种对抗攻击进行防御性训练。
在模型合规问题上,白皮书提出进行可信输出的度量,信任值评价,增加模型输出的版权信息的查询功能。
总结来说,AI 生成式大模型的发展离不开安全,因此其安全问题将作为下一个技术点,值得众多研究者去攻克。而安全也是社会稳定的保障,有关部门需要尽快进行政策的制定。
THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com
标签:
推荐
- 环球短讯!如何应对生成式大模型「双刃剑」?之江实验室发布《生成式大模型安全与隐私白皮书》
- 全球快消息!文润河北 冀望未来 河北展区精彩亮相第十九届深圳文博会
- 全球今头条!我市打响“臭氧污染防治”攻坚战 6-9月为重点时段
- 广州地铁嘉禾望岗站扶梯发生断裂,回应:已检修完毕,无人员受伤 当前动态
- 世界热点!天宫TV | “圆梦乘组”与“博士乘组”梦幻联动!
- 勇士试训大六锋线球员,他们还在继续为发展联盟寻找球员?
- 23国丰债01今日发布发行公告 全球聚焦
- 今日看点:机构:韩国将垄断中大尺寸OLED发光材料需求至2027年
- 先达股份:年产1000吨咪唑烟酸、3000吨农药中间体项目试生产
- 港股异动 | 美兰空港(00357)跌超4% 海南旅游进入淡季 客流下滑明显
- 受贿1992615.31元!陈克祥一审获刑三年半_天天时讯
- 电动焦虑下的日系车企:丰田反击,日产提速,本田激进
- 【收评】纯碱日内下跌2.27% 机构称纯碱是处在“主动去库”的阶段
- ST摩登:证券虚假陈述案发酵 又有投资者向公司提起诉讼
- 【天天快播报】国电南瑞(600406)6月7日主力资金净卖出2787.69万元
- 天天热推荐:手机问题:一加9双通道网络加速方式
- 年金险特点是什么 年金险有什么优势和劣势-全球动态
- 【新视野】(经济)江苏出台14条措施推动外贸稳规模优结构
- 海南橡胶:公司合同采用书面方式签署
- 卡霍夫卡水电站大坝受损 逾4万人面临洪水威胁
- 4个工作日,北京大兴发出首张“一业一证”行业综合许可凭证|焦点热门
- 【收评】菜油日内上涨0.10% 机构称油脂反弹乏力
- 全球热推荐:悦达起亚入选“私家车新车上牌免查验试点企业”
- 受贿1992615.31元!陈克祥一审获刑三年半|焦点速看
- 经销商称蔡司不再推出民用相机镜头,官方暂未回应
- 热讯:绝句的诗意是什么_三年级下册绝句的诗意是什么
- 各地出台全方面服务保障 营造温馨、舒适高考环境
- 世界速读:专属夏日的粉色浪漫:合欢花开 灿若云霞
- 苹果Vision Pro头显会颠覆XR行业吗?HTC王雪红:重大分水岭 世界热消息
- 李金洋:做老百姓的贴心人
- 每日视讯:拓维信息:公司生产的AI服务器支持英伟达GPU运行
- 中国电信上海公司荣获 “全国重点区域移动网络卓越运营商奖”
- 蒋圣龙:怀念在国青与希丁克相处的时光 外租两年对我帮助很大 环球聚看点
- 每日播报!六福内地铂金多少钱一克(2023年06月07日)
- 奶茶放一晚上第二天还能喝吗 不开封的奶茶可以放几天? 即时看
- 铁流股份:空心电机轴目前处在客户产品开发阶段_环球讯息
- “最美教师”陈玲:坚持爱孩子的初心,在教育教学专业化的道路上不断成长_全球新资讯
- 小区的树挡阳光怎么办_每日消息
- 不必苛责年轻人,上香也是一种上进
- 世界观焦点:白队合唱团 - 凤凰花开的路口伴奏满舒克 张子豪 - 必杀技伴奏爱人 王若琳 伴奏
- 沪深股通|昆仑万维6月6日获外资买入0.13%股份 热点在线
- 56岁黎明素颜近照曝光,与粉丝互动接地气,冻龄容颜令人震惊
- 已举办 举办了是什么意思 举办是什么梗 全球快播报
- 每日热门:李宗翰个人资料视频_李宗翰个人资料
- 环球滚动:我愚蠢的欧豆豆梗表情包_欧豆豆是啥意思日语我愚蠢的欧豆豆梗
- 捶胸顿足表情包_捶胸顿足
- 焦点精选!桌面图标怎么可以随便放_桌面的图标怎么随意放置
- 美国女子宣布嫁给AI机器人 称其是完美男人_天天播报
- 怎么关闭电脑密码设置_怎么关闭电脑密码
- 梅诗瑶_梅诗-当前资讯
- 河南夏播面积3503万亩,占预计面积的38.5%,日进度574万亩|截至6月6日 世界简讯
- 每日看点!怎么删除评价过的商品_怎么删除评价
- 天天微头条丨国内商品期货夜盘涨跌互现玻璃、豆一涨超1%
- 奥斯汀承认香会期间美中两军握手之外无互动_环球通讯
- 眼皮上面长了个小粒粒很痒(眼皮上面长了个小粒粒)|环球看点
- 福州门诊医保多少报销吗
- 前沿资讯!中信证券(06030)将于8月25日派发末期股息每10股4.9元
- 动态焦点:什么是慈善家
- 北京发现两例猴痘病例!疾控发布最新提示|天天报道
- 952300是什么号码_155是什么号码 世界新视野
- 观热点:中新网评:鸭脖还是鼠头,需要更信服的解释
- 汉滨区五里镇四合初级中学_关于汉滨区五里镇四合初级中学简述
- 如果就造句一年级句子_如果就造句一年级
- 玉米须泡水配什么更好?玉米须孕妇可以喝吗? 全球快资讯
- 【环球播资讯】广百股份:公司信息技术相关人员近30人
- “天外来物”武汉站圆满落幕 薛之谦倒立秀唱功引全场叫好
- 全球观热点:培根披萨图片大全_自制培根披萨
- 世界热消息:中关村科技租赁(01601)与溧阳天目先导电池材料科技订立融资租赁协议
- 环球热文:北京利尔:公司根据相关法规要求在定期报告中披露具体经营情况,请参阅公司相关定期报告祝您投资顺利
- 捷昌驱动: 公司提供完整的汽车电动拖车钩解决方案,包含汽车电动拖车钩整个组件,
- 【时快讯】鸡蛋:消费进入淡季,蛋价继续承压下行
- 淘宝“顺手买1件”改了规则:不显示原价,变成“打闷包”销售|当前快看
- 环球热议:前4月辽宁省规上工业增加值同比增长6.8%
- 新华书店购书中心完成升级改造 洛阳元素融入空间设计
- 卑鄙的圣人曹操3(卑鄙的圣人曹操)-世界热讯
- “热闹”的顺德欢乐海岸 保利华南23.19亿斩获佛山宅地|世界快报
- 累计40多万元!廉江一男子以做“生意”为由诈骗被抓了!
- 塔吊安装监理应检查哪些内容_塔吊安装
- 讯息:Woj:前火箭主帅塞拉斯加盟活塞蒙蒂团队 担任首席助理教练
- 天天微动态丨车载导航软件哪个好用_车载导航软件哪个最好
- 美企CEO接连访中国 陈明德析三大考量-环球快资讯
- 全球快资讯:交易否决权和选项_交易否决权
- 京剧吧百度贴吧_京剧吧
- 【世界新视野】两党协议难抑美债务激增
- 【焦点热闻】证监会同意氧化铝期货注册
- 科力尔:6月2日公司高管蒋耀钢减持公司股份合计3.08万股_焦点简讯
- 焦点!钢厂废钢库存微降 供需两弱继续深入
- 兵团考试信息网登录入口
- 当前观点:日产Formula E车队即将出征FE电动方程式雅加达双站赛
- 2022年以来内蒙古破获污染环境刑事案件46起-天天即时
- 2008北京奥运会刘翔_关于2008北京奥运会刘翔的介绍
- 依法履职 监督推动“三个一批”项目建设活动深入开展
- 【全球速看料】“他,获得荣誉称号一点也不亏!”——记黑龙江坤健农业股份有限公司董事长祝嗣臣
- 支付宝收益率是多少(支付宝收益)
- 今日快讯:legend什么意思matlab_legend什么意思
- 合肥卷烟厂
- 世界热头条丨中国女排3:0击败日本队 世界女排联赛四战全胜
- 金融许可证保管不善导致遗失 中国邮政储蓄银行高邮市龙虬营业所被罚|环球新要闻
- 中国联通官宣!又有合作伙伴“退群”-每日关注
- 清道夫鱼适合多少温度_清道夫鱼 今日报
X 关闭
行业规章
X 关闭