参考消息网7月28日报道据美国石英财经网站7月26日报道,ChatGPT大型语言模型(LLM)的开发者日前悄悄下架了它用来识别人工智能生成文本的工具,原因是准确率太低。
开放人工智能研究中心(AI target=_blank class=infotextkey>OpenAI)今年1月发布的人工智能识别工具曾受到热捧,声称能够辨别文本是否由ChatGPT生成。OpenAI在发布时大肆宣传说,与此前该公司尝试构建的类似识别系统相比,这一工具“在(识别)文本方面要可靠得多”,但承认其并不完美。
OpenAI今年1月发布该工具时说:“我们的识别工具并不完全可靠。在我们对英文文本‘挑战数据集’进行的评估中,我们的识别工具正确地将26%的人工智能写作的文本认定为‘可能由人工智能写作’,同时错把人类写作的文本标注为人工智能写作文本的概率为9%。”
不过,OpenAI解释说,随着输入文本的篇幅增加,该识别工具的可靠性有所提高。但在1月声明的一份更新中,该公司证实,这一人工智能识别工具自7月20日起不再可用。该公司还说:“我们正在努力整合反馈意见,目前正在研究更有效的文本溯源技术。”
这一识别工具是在教师和其他专业人士担心ChatGPT助长作弊和抄袭以及该聊天机器人生成内容失实后发布的。今年5月,一名美国律师被指控在经手的一起案件中使用该聊天机器人进行引证,但事实证明,这些证据具有误导性且不存在。
这一最新的事态发展使ChatGPT的处境越发如履薄冰。美国斯坦福大学7月19日发布的一项关于ChatGPT准确率的研究报告暗示,随着其最新版本GPT-3.5和GPT-4的发布,该聊天机器人的准确率有所下降。它在解决数学问题方面的准确率已经从97.6%下降到2.4%。报告警告说,其准确率可能会进一步下滑。报告称:“这凸显了在生产应用中持续评估和评价大型语言模型行为的必要性。”
在去年11月发布以来人气飙升后,ChatGPT的网络流量在今年5月至6月首次录得下降,下降值为9.7%。OpenAI下架人工智能识别工具的举动可能会进一步拉低其网络流量,让备受赞誉的人工智能热潮降温。