您当前的位置:首页 > 新闻资讯 > 科技

Bing Chat越来越“傻”,可微软却解决不了这个问题

时间:2023-08-16 10:13:53  来源:三易生活  作者:

随着时间的推移,AI聊天机器人越来越不好用这件事,似乎已经成为了全球用户的共同体验。其中例如微软的Bing Chat,即使有着GPT-4的支持、并打开了创造力模式,也经常会出现经常回避问题或是无法给出回复的情况。在海外社交媒体Reddit上,就有诸多网友吐槽Bing Chat已经变得没有乐趣可言,回答的内容不再风趣、不再快乐,让人感觉是冷冰冰、没有人性的机器。

更有甚者,在有用户试图要求Bing Chat围绕某个虚构人物进行演绎时,在明知相关讨论是无害的情况下,Bing Chat居然认为这一行为存在风险。事实上,微软方面也承认了Bing Chat性能下降的事实,并在给出的相关回复中表示,正在积极监测用户的反馈,并计划在不久的将来做出改变、以解决相关问题。

其实自今年2月初内测以来,New Bing已经经过了大大小小的几次更新,从一开始的“牛Bing”、到后来被“赛博阉割”成“New病”,再到现在提供精准、平衡、创造力三种模式,微软方面一直在试图做一款让所有人满意的AI大模型。但现在看来,似乎有点适得其反了,而ChatGPT这类大语言模型(下文简称为LLM)之所以能够在2022年秋季开始走红,在AI热退烧之后重新点燃外界对于其未来的热情,靠的就是ChatGPT比以往任何同类产品都更智能,或者说更像人。

无独有偶,ChatGPT如今也开始被用户吐槽逐渐出现了速度变慢、回复冗长重复、聊天主题单一无趣等问题。其实这类聊天机器人产品性能下降并非孤立事件,在不同厂商的LLM中都有发生。

事实上,业界也早已关注到这一现象。例如为了验证ChatGPT的行为如何随时间变化,斯坦福大学和加州大学伯克利分校的研究人员就测试了GPT-4在今年3月和6月的两个版本,测试内容横跨数学问题、回答敏感问题、代码生成和视觉推理四个部分。

最终的测试结果也确实证明了ChatGPT能力的衰减,例如在数学和视觉推理部分,研究人员使用了思维链(chain-of-thought,CoT)技术,让LLM来模拟人类思考的过程,并帮助其生成一个推理路径,将复杂的推理问题分解为多个简单的步骤,而不仅仅只是从语料库中直接拟合出最终答案。

然而结果显示,GPT-4的性能发生了显著的漂移,从3月到6月,GPT-4关于数学问题的准确率一路从97.6%降至2.4%,同时回答长度也减少了超过90%。

而在视觉推理方面,6月的GPT-4在部分此前在3月曾正确回答的查询上,反而又出现了错误。即对于3月能给出正确结果的问题,6月反而就做不到了。

如今相当多程序员每天都在使用的AI编写代码,但研究人员发现,在3月时GPT-4输出的代码中有超过50%是可直接执行的,可这一数字到了6月就仅有10%。而且这还不是最夸张的,在回答敏感问题方面,GPT-4的直接回答率已经从21%降至5%,甚至在拒绝回答不当问题时,6月版本的GPT-4也倾向于不向用户提供解释。

通常来说,事物的发展往往是呈螺旋形上升,具体到信息技术领域更呈现出了跨越式前进的状态,“今不如古”的情况可以说是绝无仅有。那么问题就来了,出现“科研靠考古”这种情况只有一种可能,那就是行业整体曾崩溃过、如今又在重建。但AI大模型可是纯粹的前沿科技,并不存在类似的问题,所以这其中肯定是有蹊跷的。

目前在网络上最主流的声音,是ChatGPT、Bing Chat能力下降是为了平衡用户体验的结果。毕竟ChatGPT生成的内容是需要消耗算力的,用户越多需要的算力就会随之增加,但OpenAI、微软购买算力资源的速度在这半年以来,却无法与用户增长相匹配,所以就导致了响应速度的下降,用户得排队向这类产品提问,而且提问数量被限制的情况也早已发生。所以在这种情况下,降低性能来平衡响应速度就是不难想到的一种解决方案。

当然,更深层次的核心矛盾是AI伦理问题,也就是数月前曾引起诸多讨论的“AI可能给人类带来灭绝风险”,对于AI的担忧甚至让OpenAI创始人奥特曼走上了美国参议院的听证会,更让他这几个月来一直在全球各地“布道”。不受控制的AI会成为毁灭人类文明的罪魁祸首,这无疑是科幻小说的一个重要题材,因此对于AI失控的担忧也是这一技术自诞生以来就存在的。

由此也衍生出了一个控制AI的概念“AI对齐”,即要求AI系统的目标要与人类的价值观和利益对齐,使其符合设计者的利益预期,不会产生意外的有害后果,比如生成各种不当言论等内容。事实上,微软、OpenAI这列企业搞AI对齐是必然,例如微软在2016年发布的聊天机器人Tay就曾出现过发表种族歧视内容的情况,也直接导致它出师未捷身先死。

但强行让AI遵守人类的价值观本身就是反直觉的事情,想要让AI与人类对齐,开发者就需要指定正确的目标函数,需要证实应当提供什么样的反馈才能正确引导AI。此外甚至还需要证明提供这些反馈是合理的,而这无疑堪称是当下难以解决的技术难题。那么问题也就来了,如果想要让一个人不胡思乱想,并矫正其思维模式,最直接的方式是什么?当然是诺贝尔奖中的黑历史前脑叶白质切除术了,直接就把人类的思维能力从物理层面消灭。

回到AI领域也是一样,由微软研究院发布的一篇论文证实对AI大模型所进行的任何AI对齐行为,都会损失其准确性和性能,因为ChatGPT这类产品是基于人类反馈的强化学习来构建智能,人工强行干预的AI对齐会阻碍大模型对任务理解的真实程度。所以自然而然的,AI大模型的性能就出现了开局即巅峰的情况。

但无论是算力紧张、还是AI伦理限制,短时间来看几乎都是无解的,因此用户体验高开低走也是必然,相关企业也不太可能解决得了这一问题。



Tags:Bing Chat   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
Bing Chat越来越“傻”,可微软却解决不了这个问题
随着时间的推移,AI聊天机器人越来越不好用这件事,似乎已经成为了全球用户的共同体验。其中例如微软的Bing Chat,即使有着GPT-4的支持、并打开了创造力模式,也经常会出现经常回避...【详细内容】
2023-08-16  Search: Bing Chat  点击:(1564)  评论:(0)  加入收藏
迎战谷歌!微软聊天工具Bing Chat将登陆Chrome等第三方浏览器
据媒体周二(7月25日)报道,微软的人工智能(AI)聊天机器人 Bing Chat将在第三方浏览器上推出,包括谷歌的Chrome和苹果的Safari。微软正试图让两种浏览器的用户都可以使用到该工具。...【详细内容】
2023-07-26  Search: Bing Chat  点击:(46)  评论:(0)  加入收藏
微软 Edge 浏览器内 Bing Chat 将支持聊天记录功能
IT之家 7 月 11 日消息,微软广告和网络服务首席执行官 Mikhail Parakhin 近日在回复网友提问时,明确表示必应聊天(Bing Chat)的聊天记录功能将登陆 Edge 浏览器。一位推特网友询...【详细内容】
2023-07-11  Search: Bing Chat  点击:(272)  评论:(0)  加入收藏
搜索大战白热化:微软全面开放Bing Chat,谷歌或实现个性化搜索
钛媒体编辑使用AI生成▎毫无疑问,微软新Bing正成为谷歌搜索25年来面临的最大威胁。作者|林志佳编辑|李小年本文首发于钛媒体APP微软和谷歌在人工智能(AI)搜索领域的竞争进入...【详细内容】
2023-05-07  Search: Bing Chat  点击:(247)  评论:(0)  加入收藏
微软Bing Chat全面开放 无需排队
微软现已全面开放必应GPT-4聊天机器人,不再需要加入“候补名单”。玩家需要做的就是使用你的微软账号登陆新的Bing或Edge浏览器,然后就能访问GPT-4驱动的开放预览版本。微软还...【详细内容】
2023-05-05  Search: Bing Chat  点击:(127)  评论:(0)  加入收藏
微软Bing Chat AI全面开放无需申请,但国内需要网络设置…
今日,微软突然官宣:基于GPT-4的人工智能搜索引擎Bing Chat AI将正式全面开放,不再需要进行申请,只需注册一个账户,首页即可体验。而且还带来诸如支持100种语言多模态输出、持续聊...【详细内容】
2023-05-05  Search: Bing Chat  点击:(417)  评论:(0)  加入收藏
微软Bing Chat正式进入开放预览模式,用户已超过1亿
驱动中国2023年5月4日消息,据悉,微软的Bing Chat服务已正式进入开放预览模式,任何人都可以使用。目前,Bing Chat已经拥有超过1亿日活跃用户,总共有超过5亿次聊天记录。该服务的用...【详细内容】
2023-05-04  Search: Bing Chat  点击:(286)  评论:(0)  加入收藏
▌简易百科推荐
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(7)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(7)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(1)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(3)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07    IT之家  Tags:OpenAI   点击:(6)  评论:(0)  加入收藏
量子计算会和经典计算一样融入人们的日常生活
作为2024中国网络媒体论坛打造的创新活动之一,“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场,本源量子计算科技(合肥)股份有限公司(以下简称“...【详细内容】
2024-04-03    人民网  Tags:量子计算   点击:(8)  评论:(0)  加入收藏
ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
新智元报道编辑:编辑部【新智元导读】OpenAI这份愚人节礼物,实在是太大了:今天起,ChatGPT不用注册,可以直接使用。用户狂欢,竞品颤抖,我们仿佛已经听到,谷歌搜索引擎这位巨人轰然倒...【详细内容】
2024-04-02    新智元  Tags:ChatGPT   点击:(8)  评论:(0)  加入收藏
谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
IT之家 4 月 2 日消息,根据华尔街日报报道,谷歌为了结追溯到 2020 年的集体诉讼案,近日同意删除通过 Chrome 浏览器“无痕(Incognito)模式”下收集的用户数据。这起诉讼原告认为,...【详细内容】
2024-04-02    IT之家  Tags:Chrome   点击:(7)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
栏目相关
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · 国家数据局局长刘烈宏:充分发挥数据要素价值 培育新质生产力
  • · 谷歌Chrome巨变:第三方Cookie的终结将重塑互联网格局
  • · 百度+苹果,“AI手机元年”真的来了?
  • · 百度AI“咬”了一口苹果 大模型商用有戏了?
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条