您当前的位置:首页 > 电脑百科 > 人工智能

大模型的幻觉有治了?OpenAI推出“挑刺模型”,让GPT-4自己给自己改作业

时间:2024-07-12 20:54:28  来源:搜狐科技  作者:

图片来源:AI target=_blank class=infotextkey>OpenAI

出品 | 搜狐科技

作者 | 王一鸣

编辑|杨锦

批评使人进步,不仅仅是针对人,对于大语言模型也是一样。

近期,OpenAI 的研究人员推出了 CriticGPT,这是为GPT-4打造的“挑刺模型”,它能识别ChatGPT产生的代码中的错误。它通过人类反馈强化学习(RLHF)来增强AI系统,帮助人类训练师让大语言模型(LLM)输出的结果更加准确,以达到表现出人类训练师想要的输出效果。

Open AI使用了RLHF,这是一种机器学习(ML)技术,它利用人类训练师的反馈来优化 ML模型,可以高效地进行自我学习。RLHF可以让训练软件做出最高效准确的判断。

RLHF把AI训练师的反馈赋予了奖励的意义,这让ML模型能执行更符合训练师目标和需求的任务。RLHF广泛应用于生成式AI应用程序,包括大语言模型。CriticGPT的关键功能已被整合进了生成式AI,也顺理成章地成为了RLHF的一部分。

来自GPT-4,提升GPT-4

在“LLM Critics Help Catch LLM Bugs”的论文中表述到,现在的模型能力已经强到经验丰富的专家都难以去评估模型输出的质量和准确性。在不久的将来人类对大语言模型的评估可能会逐渐失效,限制了RLHF发挥矫正的作用。

言外之意就是:人类的智慧对于人工智能语言大模型来说已经到头了,需要另请高明。

研究人员还发现:

1.可扩展监督方法有助于训练员更全面地找到现实中RLHF数据问题。

2.CriticGPT比ChatGPT和CriticGPT的训练员能发现更多错误,展现出更强的优势。

3.由CriticGPT作为辅助的训练员团队比没有使用CriticGPT的训练员撰写的批注更全面,而且还减少了模型的幻觉率。

4.研究人员提出的强制采样集束搜索(FSBS)是一种推理时间采样策略和评分策略,这让大语言模型的批注在真实和虚假问题之间取得了平衡。

CriticGPT的核心思路就是训练大量模型故意插入bug,然后给CriticGPT提供示例反馈,让CriticGPT认为就好像他们发现了这些bug,为模型做提示工程。这个过程可以让模型学习到如何识别和批注各种类型的代码bug。

训练师使用CriticGPT当作AI工具,审查ChatGPT的编程代码。CriticGPT基于GPT-4系列的LLMS分析代码并指出潜在可能被忽视的错误。研究人员在本来就有错误的代码样本数据集的基础上训练了CriticGPT,教它识别和标记各种编码错误。

研究人员发现,在63%的错误案例中,训练师更偏向于CriticGPT对错误的批注,而不是人类的批注。

根据统计结果表明,CriticGPT展现出了优越的成绩,使用CriticGPT的团队比只有人类训练师做出的批注更全面。但是只有CriticGPT也不太行,它产生幻觉问题的几率还是挺高的。所以需要人类训练师和CriticGPT一起配合来降低幻觉发生的概率,其效果会更好。

CriticGPT帮助训练师写出更全面的批注(图中数值越高越好)

训练师与CriticGPT结合有效降低了幻觉问题(图中数值越低越好)

在实验过程中,CriticGPT展示了它能够捕捉ChatGPT输出中插入的错误和自然发生的错误。在ChatGPT所产生的63%自然错误案例中,训练师更喜欢人类与CriticGPT一起打配合的批注,因为这样无用“吹毛求疵”的批注的情况比较少,并且误报或幻觉问题也会更少一些。

人类训练员的批注中“吹毛求疵”和幻觉问题比大语言模型要少很多,但是人机团队配合的表现比CriticGPT和ChatGPT都要好。

所以说CriticGPT也并不是完美无缺的,它仍然需要“人工介入”。

研究人员还创造了一种新技术叫强制采样集束搜索(FSBS),它可以帮助CriticGPT编写更详细的代码批注。

研究人员还可以通过FSBS调整CriticGPT搜寻问题的力度,调节它发现不存在的问题的频率,这种功能可以根据不同AI训练任务的需求来调整平衡性。

FSBS的过程

纠错的“列文虎克”

CriticGPT的功能不仅仅局限于代码检查。研究人员实验发现,如果把模型配置在ChatGPT 训练数据的一个子集,值得注意的是这些数据曾被人类训练师评为无差错。

让所有人意外的是,CriticGPT在这些无差错案例中仍发现了24%的错误,随后人类训练师也证实了这些错误的存在。

Open AI认为CriticGPT模型有潜力应用到非代码任务,它捕捉细微错误的能力特别突出,就算是仔细的人类训练师可能都觉察不到。

大语言模型比起人工大幅度提高了检查到代码错误的数量,模型的批注以超过80%数值领先于人工批注

ChatGPT和CriticGPT同时都可以比人类训练师捕捉到更多的错误(图中数值越高越好)

CriticGPT为ChatGPT-4指出的安全错误

CriticGPT接受问题和答案作为一对进行输入,然后输出在答案中的批注指出特定的错误。批注通常情况下包含多重批注,每一个都与答案的引用部分相关联。

此为数据收集示意图

训练师需要修改ChatGPT的响应,添加细微的代码错误。就跟训练师日常进行代码审查一样,他们记录下每个添加错误的解释,然后验证+确认这些错误不会轻易被CriticGPT发现。在“篡改”一部分代码增添bug后,训练师会对篡改版本的批注效果进行排名。

CriticGPT仍需要跟人类肩并肩合作

与其他很多模型一样,其实CriticGPT也是有它的局限性,它只能针对简短的指令进行训练,也许还没有为未来AI系统所需要处理更复杂的事务做好准备。此外,CriticGPT减少了幻觉问题,虽然不能完全消除,但是训练师可以根据产生的这些错误结果进行标注。

研究团队承认CriticGPT可以非常有效地识别代码中某个特定精确位置的错误。然而,AI所产生的真实错误通常散布在生成内容的各个部分,这也对未来的模型迭代提出了挑战。

OpenAI计划将类似CriticGPT的模型集成到RLHF标注管线(综合解决方案)中,为训练师提供AI协助。对于OpenAI来说,开发更好的工具来评估LLM系统内容输出是迈出的一大步,如果没有额外的支持,训练师可能很难对这些内容结果进行评估。

最后,研究人员警告说,就算是训练师跟CriticGPT这样的AI工具一起打配合,在训练大模型遇到特别复杂的任务或响应的时候,这对训练师来说仍然是个不小的挑战。



Tags:OpenAI   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
大模型的幻觉有治了?OpenAI推出“挑刺模型”,让GPT-4自己给自己改作业
图片来源:OpenAI出品 | 搜狐科技作者 | 王一鸣编辑|杨锦批评使人进步,不仅仅是针对人,对于大语言模型也是一样。近期,OpenAI 的研究人员推出了 CriticGPT,这是为GPT-4打造的“挑刺...【详细内容】
2024-07-12  Search: OpenAI  点击:(0)  评论:(0)  加入收藏
OpenAI首席技术官:生成式AI带来的经济影响才刚刚开始
新浪科技讯 北京时间5月30日下午消息,OpenAI首席技术官Mira Murati说,生成式人工智能(AI)带来的经济影响才刚刚开始显现。Murati周四通过视频在新加坡Asia Tech X会议上表示,Open...【详细内容】
2024-05-30  Search: OpenAI  点击:(25)  评论:(0)  加入收藏
OpenAI与Reddit建立合作伙伴关系,利用其内容训练人工智能
OpenAI周四宣布与Reddit建立合作伙伴关系,OpenAI将把Reddit网站上的内容引入聊天机器人ChatGPT和其他产品,同时也帮助这家社交媒体公司在其论坛中添加新的人工智能功能。消息...【详细内容】
2024-05-17  Search: OpenAI  点击:(40)  评论:(0)  加入收藏
OpenAI首席科学家伊尔亚离职,曾被猜测发现“超级智能”突破
OpenAI的关键人物伊尔亚选择离开。当地时间5月14日,OpenAI联合创始人、首席科学家伊尔亚·苏茨克维(Ilya Sutskever)发文称:“(待了)近十年后,我决定离开OpenAI。”他表示,公...【详细内容】
2024-05-16  Search: OpenAI  点击:(45)  评论:(0)  加入收藏
OpenAI再次加塞砸场?谷歌展示自己才是AI灭霸
OpenAI为什么总要故意砸场,谷歌今天又给出了什么回应?OpenAI又一次加塞砸场这已经不是第一次了。OpenAI摆明了是要加塞,故意在谷歌发布会前一天发布自己的产品,砸直接竞争对手的...【详细内容】
2024-05-15  Search: OpenAI  点击:(30)  评论:(0)  加入收藏
“有眼睛、有耳朵、有嘴巴”的AI?OpenAI最新发布!
中新网5月14日电(中新财经 吴家驹)不是GPT-5,而是GPT-4o。北京时间5月14日,研发ChatGPT的OpenAI公司,推出了具备“听、看、说”能力的GPT-4o。OpenAI网站称,GPT-4o的“o”代表“...【详细内容】
2024-05-15  Search: OpenAI  点击:(31)  评论:(0)  加入收藏
OpenAI用26分钟再次震撼世界!新模型GPT-4o语音水平接近人类,科幻正在成真
出品 | 搜狐科技作者 | 梁昌均北京时间5月14日凌晨,OpenAI再迎重磅更新,虽然不是AI搜索,也不是GPT-5,而是发布了新旗舰模型GPT-4o,但也足以让业内震撼。在此次OpenAI 仅有26分钟...【详细内容】
2024-05-14  Search: OpenAI  点击:(39)  评论:(0)  加入收藏
类人速度超快语音响应!OpenAI推出新旗舰模型GPT-4o,图文音频手机AI搞定
虽然没有带来备受期待的人工智能(AI)搜索引擎,但OpenAI在主打产品AI模型上花了更多心思,拓展多模态功能,让用户可以免费玩转文字、图片和语音输入。美东时间5月13日周一,OpenAI首...【详细内容】
2024-05-14  Search: OpenAI  点击:(46)  评论:(0)  加入收藏
科技界的“AI月”开启!OpenAI、谷歌、微软等巨头将带来哪些颠覆性体验?
  每经记者 蔡鼎 每经编辑 兰素英  全球市场迎来“AI月”。从当地时间5月13日到6月10日,AI领域的开发者和投资者们将迎来一个接一个的重要事件。  从OpenAI直播演示Ch...【详细内容】
2024-05-14  Search: OpenAI  点击:(60)  评论:(0)  加入收藏
ChatGPT-4o,OpenAI的一小步,人类「AI助理」的一大步
科幻电影‘Her’的剧情正在成为现实。作者 | 黎诗韵5 月 13 日,OpenAI 用一场春季发布会,再次搅动了整个 AI 行业。在 Sam Altman 缺席的情况下,OpenAI CTO Mira Mur...【详细内容】
2024-05-14  Search: OpenAI  点击:(50)  评论:(0)  加入收藏
▌简易百科推荐
大模型的幻觉有治了?OpenAI推出“挑刺模型”,让GPT-4自己给自己改作业
图片来源:OpenAI出品 | 搜狐科技作者 | 王一鸣编辑|杨锦批评使人进步,不仅仅是针对人,对于大语言模型也是一样。近期,OpenAI 的研究人员推出了 CriticGPT,这是为GPT-4打造的“挑刺...【详细内容】
2024-07-12    搜狐科技  Tags:OpenAI   点击:(0)  评论:(0)  加入收藏
百度的萝卜快跑 ,会让 1000 万司机失业吗?
网约车,开不下去了。根据广州市交通运输局最新统计,从去年 12 月到今年 5 月,网约车日均订单量则从 14.21 单下降至 12.22 单,日均营收从 343.34 元降至 311.63 元。这意味着,一...【详细内容】
2024-07-12    爱范儿  Tags:萝卜快跑   点击:(1)  评论:(0)  加入收藏
GPT准备替中医把脉了
出品 | 虎嗅医疗组作者 | 陈广晶编辑 | 苗正卿坐在你面前的,是“赛博中医”:它的眼睛是摄像头,像老中医一样,要“扫描”你的舌苔、面色;它也能号脉,感应器构成的号脉终端不到2分钟...【详细内容】
2024-05-30    虎嗅APP  Tags:GPT   点击:(33)  评论:(0)  加入收藏
全球100位顶尖商业大佬如何看AI
美丽新世界,还是人类文明的终结作者丨王亚骏 魏琳华 曹毅封面来源丨雪豹财经社1956年,计算机科学家约翰·麦卡锡在达特茅斯会议上,首次提出了“人工智能(Artificial Inte...【详细内容】
2024-05-28    雪豹财经社  Tags:AI   点击:(43)  评论:(0)  加入收藏
GPT-4o:实现跨越文本与视觉的智能交互
想了解更多AIGC的内容,请访问:51CTO AI.x社区https://www.51cto.com/aigc/摘要OpenAI最新发布的GPT-4o模型及其在多模态处理上的卓越能力,标志着人机交互迈向新的高度。GPT-4o...【详细内容】
2024-05-17    51CTO  Tags:GPT-4o   点击:(37)  评论:(0)  加入收藏
AI应“善管”
《中国经济周刊》 记者 王红茹|北京报道随着科技的飞速进步,人工智能(AI)已逐渐渗透到社会生活的方方面面,从千行百业到衣食住行,AI技术在赋能发展和提升效率的同时,也带来了一系列...【详细内容】
2024-05-16    中国经济周刊  Tags:AI   点击:(43)  评论:(0)  加入收藏
字节跳动正式发布豆包大模型家族
新浪科技讯 5月15日上午消息,2024春季火山引擎Force原动力大会上宣布,字节豆包大模型正式开启对外服务,据悉,豆包大模型包含豆包通用模型Pro、豆包通用模型liti、豆包·角...【详细内容】
2024-05-15    新浪科技  Tags:豆包大模型   点击:(38)  评论:(0)  加入收藏
微调大语言模型的七个步骤
译者 | 布加迪审校 | 重楼在最近一年半的时间里,自然语言处理(NLP)领域发生了显著的变化,这主要得益于OpenAI的GPT系列等大语言模型(LLM)的兴起。这些功能强大的模型已彻底改变了...【详细内容】
2024-05-14    51CTO  Tags:大语言模型   点击:(37)  评论:(0)  加入收藏
人形机器人成本大揭秘:如何降低成本提高效率?
5月13日,据宇树科技官微消息,该公司发布了一款名为Unitree G1的新型人形机器人。据官方介绍,这款机器人具备超大关节运动角度及34个关节,还结合了力位混合控制技术,能够模拟人手...【详细内容】
2024-05-14    金融界  Tags:人形机器人   点击:(28)  评论:(0)  加入收藏
类人速度超快语音响应!OpenAI推出新旗舰模型GPT-4o,图文音频手机AI搞定
虽然没有带来备受期待的人工智能(AI)搜索引擎,但OpenAI在主打产品AI模型上花了更多心思,拓展多模态功能,让用户可以免费玩转文字、图片和语音输入。美东时间5月13日周一,OpenAI首...【详细内容】
2024-05-14    硬AI  Tags:OpenAI   点击:(46)  评论:(0)  加入收藏
站内最新
站内热门
站内头条