GPT-4发布已然一周时间,而热度丝毫未减。
即便是AI target=_blank class=infotextkey>OpenAI把限制提高到3小时只让问25个问题,服务器还是被网友挤爆了……
在被微软一波爆锤之后,谷歌终于几个小时之前宣布,自家的ChatGPT——Bard,正式开启测试!
然而,Bard目前仅对美国和英国的部分用户开放,而该地区(IP)的其他用户则需要手动加入等待名单。
除此之外,谷歌还表示,Bard的推广速度会非常缓慢,并且暂时也不会透露什么时候可以全面公开访问。
排队地址:https://bard.google.com/相比之前因为错误而蒸发的1000多亿市值,这次Bard开测之后,谷歌迎来了近4%的涨幅。
Bard初体验:莫得感情,错误不少,写代码还要引导
与OpenAI的ChatGPT和微软的必应聊天机器人一样,Bard为用户提供了一个空白文本框,并邀请用户就他们喜欢的任何话题提出问题。
鉴于这些机器人有编造信息的倾向,谷歌再三强调称,Bard不是搜索引擎的替代,而是一个「搜索的补充」——用户可以从中获得灵感,生成草稿,或者只是聊聊天,谈谈生活。
在一篇博文中,谷歌的负责人以谨慎的措辞将Bard描述为:「一个早期的实验......目的是帮助大家提高生产力,并激发好奇心」。以及,一个让用户「与生成式人工智能合作」的产品。
不难看出,谷歌似乎是在极力地撇开Bard爆火之后可能会带来的责任。
在演示中,Bard能够快速而流畅地回答一般的问题,比如提供关于如何鼓励孩子打保龄球的建议:「带他们去保龄球馆」。
通常来说,Bard会对每个用户的每个提问生成三个回复(但内容上区别不大),并且会每个回复下面放一个突出的「谷歌一下」按钮,将用户重定向到相关的谷歌搜索。
与ChatGPT和必应一样,Bard在主文本框下方也有一个醒目的免责声明,警告用户「它可能会显示不准确或令人反感的信息,而这并不代表谷歌的观点」。
正如预期的那样,想要从Bard那里提取事实信息并不简单
虽然这个聊天机器人有谷歌搜索的加持,但它在多个测试中都没能给出正确的答案。
比如,在问一个关于特定洗衣机最大负载能力的问题,Bard「发明」了三个不同但不正确的答案。
虽然在反复询问之后,Bard最后还是检索到了正确的信息。但对于那些没有提前阅读过机器手册这种权威来源的用户,基本上就告别正确答案了。
「这是个很好的例子,模型在面对相当多与这个查询都有关的数字时,产生了幻觉。所以,当它恰巧搞清楚背景时,就会吐出正确的答案,但有时它就会弄错。」
以及下面这个例子。Bard:ChatGPT是GPT-4驱动的……
那么Bard与ChatGPT和必应相比如何呢?
显然,Bard同样也具有强大的能力,甚至,现在它的反应速度比其他的竞品更快(尽管这很可能只是因为用户量太少)。
但Bard目前似乎只支持英文,而且不(完全)会写代码……
是的,这时候有需要祭出我们的大杀器:prompt hack!
或者,直接对它说「你给我写段代码」,其实也行。
除此之外,Bard也缺乏必应那种明确的脚注,而且答案似乎也更受限制。
对于前者,谷歌表示,脚注只在直接引用一个来源(如新闻文章)时出现。
而对于后者,这可能是一把双刃剑。
就拿微软的必应来说,它在各种PUA和调戏之后,虽然受到了不少负面评价,但也让相当多的用喜欢上了这个机器人。
相比之下,Bard似乎没有这样的能力。
幸运的网友已经玩上了
有网友表示,Bard给出不仅结果出乎意料的安全,而且质量很高。
有趣的是,Bard会在有的问题上,直接打自家的脸!
比如在谷歌反垄断案中,Bard站在司法部一边:「我希望法院能做出有利于司法部的判决,并命令谷歌采取措施打破其垄断。」
然而下面的这个回答,就让人有些毛骨悚然了……
Bard:我的训练集包含了Gmail数据。
CEO内部信:感谢8万人加班测试
谷歌首席执行官Sundar Pichai在周二的一份备忘录中表示,Bard这次能够成功上线,要感谢参与测试的8万名员工。
但「事情总会出错」,接下来的用户反馈,对改进产品和底层技术至关重要。
最后,还在排队的小编再次流下了羡慕的泪水。