◎本报记者 翟冬冬
自Open AI推出ChatGPT大模型以来,AI大模型进入到公众视野,探讨热度飙升,百度、腾讯、阿里等互联网巨头也纷纷公布了其对AI大模型的投资与布局路线图。
【资料图】
然而,在一片火热中,也有不少科技巨头表达了对AI大模型的担忧。利用人工智能写论文、制作虚假图片……在给人类带来便利的同时,“稚嫩”的人工智能技术也暴露出许多安全隐患问题。据媒体报道,被誉为“人工智能教父”的杰弗里·辛顿已从谷歌辞职,只为完全自由地谈论AI大模型等人工智能技术所带来的危险。
狂野生长的AI大模型,真的管不住了吗?来自美国卡内基梅隆大学语言技术研究所、国际商业机器公司研究院等机构的研究人员提出了一种全新的方法——自对齐。该方法结合了原则驱动式推理和大模型的生成能力,从而使用极少的人类监督便能实现AI大模型的“自我监管”。
和人类价值观“对齐”
目前,即便是最先进的AI大模型,也无法实现自我监管,仍需要依赖人类指令以及注释进行相应的调整。
“生成式人工智能可以被看作一个预测工具,它主要依靠大量数据样本来预测正确答案。”清华大学交叉信息研究院助理教授、人工智能国际学术交流项目主任于洋表示,所有基于数据统计的人工智能模型,对于“答案”的预测都必然有一定的随机性,而这种随机性所产生的偏差一旦与人类价值观、伦理观、道德观以及法律法规等相悖,就需要对该模型进行监管、完善。计算科学工作者致力于消除这类偏差,尽量使之与人类的价值观、伦理、法律、公序良俗等相符,这被称为“对齐”。
然而,从统计学的角度看,AI大模型一定会“犯错”。因此,AI模型对齐的监管,不应追求获得一个不犯错的完美AI大模型,而是要管理AI大模型产生违规错误的风险。“例如,对话类AI大模型在其对话中,是否会大量出现针对某个地区的地域歧视。”于洋举例道,对于AI大模型的监管,就是为了避免这类内容出现的概率过高、避免模型的答案系统性发生整体倾向这类偏误。
然而,如果AI大模型严重依赖人类监督,会造成成本过高、可靠性不足、存在偏向性等问题。因此,以最少的人类监督实现AI大模型的自我监督成为构建AI大模型的关键。
为了解决这一难题,研究人员提出了一种自对齐的新方法,仅需一个人工定义的小型原则集(规则),便能引导AI大模型生成答复的正确导向,且能显著减少对人类监督的需求,使其几乎无需任何额外注释。AI大模型可以自对齐的设计目标是开发出有用、可靠且符合人类道德观念的AI大模型,包括在生成答案时可以反对用户的有害询问,并且为表示反对的背后原因提供解释。
值得一提的是,此前一些AI大模型至少需要5万条注释,而整个自对齐过程所需的注释量少于300行,监督效率非常高,极大地降低了AI大模型对人类监管工作的需求。
把“打骂”变为“讲道理”
那么,未来AI大模型是否可以实现完全的自我监管?于洋表示,AI大模型监管的主要方式必然是自动化、机器化、算法化的,因为AI大模型依赖海量数据支撑,仅凭人工监管是不现实的。但完全的自我监督不太可能实现,这是因为即使AI学会了相应的人类规则,但它和人类所掌握的规则数量仍然无法比较。同时,人类的思维以及逻辑推理过程具有极高的复杂性,也是AI大模型难以真正“理解”人类的原因之一。
于洋举了个例子,现在的AI大模型监管就好比教育孩子,现有的人工对齐技术方案,其实都是在“打骂”孩子,也就是用奖励和惩罚的方式训练AI什么能做、什么不能做。而真正的教育,是要对孩子讲道理,了解为什么有些事情不能做,即要让AI理解背后的逻辑,理解人类的评判标准。这是一件很难的事情,目前大多数的AI大模型的训练和对齐技术的开发,还停留在“打骂”阶段,要从“打骂”变成“讲道理”,还有很长的路要走。
“除了技术人员开发教育AI合规的技术外,监管当局也必须制度化、系统化地从社会合规和社会影响等方面对AI大模型进行多维度的审计和监管。”于洋进一步解释道,相关行业及管理部门,需要对AI大模型违背人类价值的概率,有一个系统化的评估,并根据AI大模型相关产业的发展现状,调整监管手段,有针对性地提出监管方案,建立动态、敏捷响应技术前沿变化的监管体系。企业也要建立专门针对AI大模型的监管部门,来审核AI大模型中是否包含自我监管机制,以及具体到每一个模块将带来哪些影响,以此尽量降低AI模型的违规风险。
此外,于洋还建议,人工智能的治理,也需要大量的公众参与,因为和训练模型寻找漏洞相比,在大量应用实践中去发现漏洞、完善AI大模型,显然更加高效,也能显著降低AI大模型开发成本,推动AI大模型在各行各业的广泛应用。
-
自对齐能否驾驭“狂奔”的AI◎本报记者翟冬冬自OpenAI推出ChatGPT大模型以来,AI大模型进入到公众视野,探讨热度飙升,百度、腾讯、阿
-
王者荣耀镜什么时候出镜上线时间_非常详细的分析|天天日报王者荣耀镜什么时候出镜上线时间,非常详细的分析很多人还不知道,现在让我们一起来看看吧!1、王者荣耀之
-
火龙浴_关于火龙浴介绍 世界观速讯1、“火龙浴”一词是来自韩国话的翻译词,同时韩国也是“火龙浴”的发祥地名。2、火龙浴又称玉石浴,浴池的
-
中新天津生态城“生态+智慧”发力数字经济-焦点报道中新天津生态城“生态+智慧”发力数字经济
-
中级经济师毕业几年才能考? 全球速看中级经济师工作年限和学历有关,报考2023年中级经济师考试要求考生有1-6年相关专业工作经验,学历越高,则
-
世界观天下!《真人快打1》将是系列发售后支持最长的游戏几天前,NetheRealm公布了《真人快打1》,将于9月19日发售,随后公开了游戏的PC配置需求,将使用DX12API,
-
8套“移动违法停车抓拍系统”,5月29日正式开拍!懒得找车位,就停这吧,反正没摄像头~我就去路边吃个饭,一会就走,反正大家都这么停 年轻人,你
-
环球热点!世乒赛爆冷!中国7人一轮游,张本智和惨败丢冠,国乒劲敌出局世乒赛爆冷!中国7人一轮游,张本智和惨败丢冠,国乒劲敌出局,国乒,八强,世乒赛,张本智和,乒乓球比赛,奥林
-
在阶梯顶端购买房产的价格和持续成本|全球快资讯根据当前英国平均房价283,496英镑、25%的首付(70,874英镑)和2 97%的三年期固定抵押贷款,抵押贷款经纪人HenryDannell
-
若三战爆发,14亿国人每人捐款1千,军费够吗?俄罗斯就是一个例子 最新资讯如果三战爆发,14亿国人每人捐款1千,是否能够保证足够的军费呢?这个问题涉及到多个方面,包括国家的财政
-
当前关注:苏维埃老银元价格(2023年05月22日)指股网财经网提供苏维埃老银元价格(2023年05月22日),苏维埃银元最新消息(2023年05月22日)。
-
2023年马鞍山社保个人和单位各交多少钱(马鞍山社保五险一金缴费标准表)2023年马鞍山社保个人和单位各交多少钱(马鞍山社保五险一金缴费标准表),下文就随社保君来简单的了解一下
-
高黎贡山两代“鸟导”的共同心愿题:高黎贡山两代“鸟导”的共同心愿中新社记者 韩帅南驱车前往地处高黎贡山东麓的云南省保山市百花
-
今亮点!晋江市政府第27次常务会召开晋江市政府第27次常务会召开
-
对价形式以外的原因什么意思对价形式以外的原因是指不是以物品的价格为唯一因素来决定交易的进行的,可以通过其他方式来完成。这类原因
-
天天微资讯!皮蛋破了好几天了还能吃吗?如果皮蛋破了好几天了,要看皮蛋里面的那层膜有没有破,或者是皮蛋里面的黄是否流出来。如果只是外壳破了,
-
20点54分!辽媒曝杨鸣赴欧洲主要目的,有3项任务,将考察新外援20点54分!辽媒曝杨鸣赴欧洲主要目的,有3项任务,将考察新外援,杨鸣,同曦,辽媒,欧洲,cba,辽宁飞豹,山东男
-
动态:奥士康:截至2023年5月19日,公司在册股东的总户数为14,797户奥士康(002913)05月22日在投资者关系平台上答复了投资者关心的问题。
-
极目快评|网红青蛙偷看女生裙底?别辜负了“卖崽青蛙”的可爱形象|今头条极目快评|网红青蛙偷看女生裙底?别辜负了“卖崽青蛙”的可爱形象---近日,山东潍坊,网上盛传奎文区泰华城
-
我国加快推进节粮减损 耕好“无形良田” 环球最资讯新华社合肥5月21日电(记者水金辰)5月21日,全国粮食和物资储备科技活动周在安徽省合肥市启动,科学减损成为
-
焦点观察:人民日报关注!宁德霞浦用心守护这片海5月22日,《人民日报》第14版大篇幅聚焦宁德霞浦开展生态整治、带动城市发展,用心守护一片海。一起来看原
-
全球聚焦:崩坏星穹铁道可击破物在哪 崩坏星穹铁道黑塔空间站可击破物点位一览崩坏星穹铁道可击破物在哪,可击破物能带来少量的材料和信用点,也是经常出现在日常任务中的一环,下面是由
-
南宁青秀区法院与慧泊公司合作跟踪 5人停职检查记者刚刚从广西壮族自治区有关部门获悉:近日,南宁市青秀区人民法院与南宁慧泊停车场服务有限责任公司签订
-
焦点讯息:律师费我已经交了但我又不想打了这个费用咋退回律师费我已经交了但我又不想打了这个费用咋退回
-
褪黑素的作用机理_裉黑素的作用-世界通讯1、褪黑素的作用:直接影响睡眠的褪黑素,正常情况下主要调节睡眠时相,失眠状态下如果外服褪黑激素可起催眠
-
环球今日报丨祝贺!中国三人女篮实现两连冠在北京时间21日晚结束的2023年国际篮联三人篮球女子系列赛阿斯塔拉站上,中国三人女篮以21:15战胜埃及队获
-
“音乐+旅游”助文旅破圈 世界今亮点数据显示,“五一”假期,旅游、餐厅、音乐节三大文娱领域表现亮眼。其中,年轻群体广泛参与的音乐节开始呈
-
河南省力量钻石股份有限公司 关于董事长代为履行董事会秘书职责的 公告 天天通讯证券代码:301071 证券简称:力量钻石 公告编号:2023-039本公司及全体
-
专家学者城北“唇枪舌剑” 只为企业员工“舌尖”事5月12日下午,一场主题为“党建联建融合互促商治解决企业员工用餐问题”的座谈会在城北街道举行,街道通过
-
福克斯开空调滴水正常吗_为什么?福特福克斯的空调系统有一个蒸发器,蒸发器是在车子的仪表板上,当空调处于制冷模式下,蒸发器表面的温度就