突发！OpenAI 骤然关停 AI “打假”工具，官方承认：准确率过低

时间：2023-07-26 20:01:01 来源：CSDN 作者：

整理 | 郑丽媛

出品 | CSDN（ID：CSDNnews）

回想 ChatGPT 刚爆火那阵，它卓越的生成能力令不少行业“又爱又恨”。

以教育界为例，学生热衷于在 ChatGPT 的帮助下完成作业，教师们却头疼于无法杜绝学生用 ChatGPT 作弊的行为。在这一趋势下，今年 1 月美国纽约市教育部曾正式宣布：纽约市的学生和教师，无法再在教育部设备或互联网上访问 ChatGPT。

或许是为了应对这日益扩大的舆论矛盾，AI target=_blank class=infotextkey>OpenAI 在今年 1 月底重磅推出了一款新 AI 工具 AI-Text-Classifier（AI 文本分类器），旨在用来识别 AI 生成的文本内容。

不曾想，这个新 AI 工具诞生还不满半年，就已被 OpenAI “偷偷”关停了——而 OpenAI 官方后续给出的理由是：AI Classifier 的“准确率太低”。

刚推出时，OpenAI 就提醒：不可靠

实际上，在 OpenAI 刚推出这款 AI 文本分类器时，就承认过它“并不可靠”：“我们训练了一个分类器来区分人类撰写的文本和 AI 撰写的文本，但这个分类器并不完全可靠。”

据了解，AI Classifier 是一个语言模型，基于同一主题下人工编写文本和 AI 编写文本对数据集上进行的微调。OpenAI 将由人类编写的各种来源集成到这个数据集，例如预训练数据和提交给 InstructGPT 的人类演示等。然后 OpenAI 再将把每个文本分为提示和响应，研究人员根据这些提示，让各种不同的语言模型产生响应，以此来不断训练这款 AI 文本分类器。OpenAI 特别强调：只有在 AI Classifier 非常有把握的情况下，才会将文本标记为“可能是 AI 编写的”。

针对这款 AI 文本分类器，OpenAI 在官宣博客中并没有介绍其详细原理，但给出了实验测试结果：在对英语文本内容进行测试时，AI Classifier 能正确识别 26% 的 AI 内容，显示“可能由 AI 编写”的建议参考，但同时也会把 9% 的人类编写内容“误判”为 AI 生成的内容。

对于 OpenAI 提供的这个数据，当时洛桑联邦理工学院教授 Marcel Salathé 还专门进行了计算：假设一所大学有 1000 名学生被要求写一篇文章，其中 3% 的人试图用 ChatGPT 来生成文本，即其中会有 30 个 AI 生成的文本和 970 个人类生成的文本。

但根据 AI Classifier 的测试数据结果，将出现以下情况：首先，在 970 个人类生成的文本中，会有 9%（即 87 个）被错误地标记为 AI 生成的；其次，在 30 个 AI 生成的文本中，会有 26%（即 8 个）被正确标记为 AI 生成的。

也就是说，如果老师用 AI Classifier 来识别学生的文章，共会有 95（87+8）个文本被标记为 AI 生成——但实际情况是，其中只有 8 个是 AI 生成的，而 87 个自己写文章的学生会被 AI Classifier “误伤”。

存在不少局限性

平心而论，AI Classifier 的这个正确率确实不太可观，因此当时 OpenAI 也主动提醒道：“我们的分类器有一些重要的局限性，它不应作为主要的决策工具，而应作为确定文本来源的方法补充。”

具体来说，AI Classifier 有以下 6 种局限性：

（1）在处理短文（1000 字以下）时非常不可靠，但即使是较长的文本，有时也会被分类器错误标注。

（2）有时，人类撰写的文本会被分类器“错误而自信地”标注为 AI 撰写的文本。

（3）建议仅在英文文本中使用该分类器，因为它在其他语言中的表现要差得多，在代码中也不太可靠。

（4）无法可靠地识别可预测性很强的文本。例如，分类器无法预测前 1000 个质数的列表是由 AI 还是人类写的，因为正确答案总是一样的。

（5）AI 写的文本可以被二次编辑，从而躲过分类器的检测。

（6）基于神经网络的分类器在训练数据之外的校准效果总是很差。对于与训练集中的文本有很大差异的输入，分类器有时会很自信地做出错误标注。

尽管正确率不高，局限性也较多，但 OpenAI 在推出 AI Classifier 时，还是表示：“我们相信，好的分类器可以为减少 AI 生成文本是由人类撰写的虚假说法”，“与我们之前发布的分类器相比，AI Classifier 在处理来自最新 AI 系统的文本时可靠性明显有所提高。”

网友支持关停的决定

然而，与半年前刚发布 AI Classifier 时的高调自信不同，OpenAI 关闭 AI Classifier 的决定很“低调”，甚至丝毫没有提前通知就突然关停了。

当用户们面对打不开的页面一头雾水、官方也没相关回应时，终于有人在半年前 OpenAI 发布 AI Classifier 的博客中，找到了藏在其中的添加注释：

由于准确率较低，截至 2023 年 7 月 20 日，AI Classifier 已不再可用。我们正在努力采纳反馈意见，目前正在研究更有效的文本出处技术，并承诺开发和部署相关机制，使用户能够了解音频或视频内容是否由 AI 生成。

虽然有些突然，但结合近半年来各类 AI 文本检测器的表现来看，OpenAI 做出这个决定或许并不意外。

不论是 OpenAI 的 AI Classifier，还是斯坦福大学的 DetectGPT，亦或是大学生研发 GPTZero 等 AI 检测工具，其定位都是用来区分文本究竟是由人类撰写的还是由 AI 生成的，而它们的失误率也都高得惊人。

此外，在仔细研究了检测大型语言模型生成的文本后，美国马里兰大学的计算机科学家 Vinu Sankar Sadasivan 也坦言：即使是用最好的检测器来检测 AI 生成的文本，概率并不比扔硬币进行判断好到哪里去。

因此对于 OpenAI 突然关停 AI Classifier 的这个决定，不少网友都表示支持：

▶ “虽说少了一个公告，但我很高兴 OpenAI 这么做了。现在很多人都以为只要仅凭几句话就能检测出是否是 AI 写的，但实际上根本就没人能保证这一点。”

▶ “很好，如果它确实不可靠，那它存在的意义就弊大于利了。”

▶ “关的好！你们都不知道，因为这个工具，学术界出现了大量的虚假指控。”

参考链接：

https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text

https://decrypt.co/149826/openai-quietly-shutters-its-ai-detection-tool

Tags：OpenAI 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

IT之家 4 月 7 日消息，本周早些时候，《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天，《纽约时报》详细介绍了 AI 公司处理此问题的一些方法，其中涉及到...【详细内容】

2024-04-07　　Search: OpenAI 点击:(6)　　评论:(0)　　加入收藏

开发者再分享 OpenAI Sora 生成的短视频：树叶大象、彩虹瀑布等

IT之家 3 月 19 日消息，OpenAI 今年 2 月推出 Sora 模型之后，迅速成为 AI 圈内头条，能够基于用户的一句话，生成最长 1 分钟的视频，效果接近实拍。OpenAI 目前并未向公众发布 Sora...【详细内容】

2024-03-19　　Search: OpenAI 点击:(12)　　评论:(0)　　加入收藏

刚刚曝光的 Claude3，直击 OpenAI 最大弱点

作为 OpenAI GPT3 研发负责人的创业项目，Anthropic 被视为最能与 OpenAI 抗衡的一家创业公司。当地时间周一，Anthropic 发布了一组 Claude 3 系列大模型，称其功能最强大的模型...【详细内容】

2024-03-05　　Search: OpenAI 点击:(30)　　评论:(0)　　加入收藏

OpenAI Sora已开放对外申请网友爆料：可能还有其它重磅产品发布

OpenAI Sora 终于开放对外申请。内测申请链接：https://openai.com/form/red-teaming-network虽然开放，但目前只有两种方式能用上官方版的Sora：加入Red Teaming和著名艺术从业者...【详细内容】

2024-02-26　　Search: OpenAI 点击:(36)　　评论:(0)　　加入收藏

通俗易懂地解释OpenAI Sora视频生成的特点有哪些？它与此前的Runway Gen2、Pika有什么区别？以及缺点是什么？

生成长达一分钟的视频，更加自由尺寸的视频，支持向前以及向后扩展视频，多个视频的连接，涌现出真实物理世界模拟的能力OpenAI的Sora模型是最近两天最火热的模型。它生成的视频无论...【详细内容】

2024-02-23　　Search: OpenAI 点击:(33)　　评论:(0)　　加入收藏

从Google Gemini到OpenAI Q*：生成式AI研究领域全面综述

新智元报道来源：专知【新智元导读】这项综述性研究报告批判性地分析了生成式AI的发展现状和发展方向，并探究了谷歌Gemini和备受期待的OpenAI Q*等创新成果将如何改变多个领域...【详细内容】

2024-01-09　　Search: OpenAI 点击:(165)　　评论:(0)　　加入收藏

OpenAI 工程师自曝开发 ChatGPT 仅用时 8 天，长文揭秘谷歌 DeepMind 等硅谷顶流如何诞生

OpenAI 的出现，源自马斯克和拉里佩奇的一场争论。那是在 2015 年，特斯拉刚刚盈利，佩奇还是谷歌的 CEO。就是这场争吵的几周后，OpenAI 在一次晚饭上诞生。最近，OpenAI 工程师惊人...【详细内容】

2023-12-18　　Search: OpenAI 点击:(72)　　评论:(0)　　加入收藏

OpenAI 宣布修复GPT-4变懒问题，将在离线评估及AB测试后更新模型

IT之家 12 月 11 日消息，OpenAI 在上周遭到部分用户投诉，许多用户声称，他们在使用 ChatGPT 或 GPT-4 API 时，会遇到回应速度慢、敷衍回答、拒绝回答、中断会话等一系列问题，OpenA...【详细内容】

2023-12-12　　Search: OpenAI 点击:(50)　　评论:(0)　　加入收藏

OpenAI COO：大家高估了AI对企业的作用，但忽略了它对个体的价值

按：本文为CNBC在最近的“宫斗事件”前后对OpenAI COO Brad Lightcap的访谈，华尔街见闻编译。要点如下：人工智能最被过度炒作的部分之一就是“可以一举带来实质性的商业变革”...【详细内容】

2023-12-07　　Search: OpenAI 点击:(178)　　评论:(0)　　加入收藏

谷歌推出 Gemini ，对 OpenAI 意味着什么

图片来源：由无界 AI生成昨晚 11 点，Google 发布原生多模态大模型 Gemini，最强 Ultra 模型达到 GPT-4 水平，多模态能力超过 GPT-4V。这是我们在 OpenAI 发布一年内第一次看到有可...【详细内容】

2023-12-07　　Search: OpenAI 点击:(152)　　评论:(0)　　加入收藏

▌简易百科推荐

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(1)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(2)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(2)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(4)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(5)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

第一批用 Kimi 做内容的网红已经杀疯了

作者：王东东文章来自：斗战圣佛小组技术信仰派 VS 市场信仰派朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是：大模型有没有戏。技术派...【详细内容】

2024-04-04　　　　斗战圣佛小组　　Tags:Kimi 　点击:(4)　　评论:(0)　　加入收藏

昆仑万维发布面向人工智能时代的六条人才宣言

过去的一年多，是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里，我们见证了人工智能的快速发展和广泛的影响，人工智能已经迅速地融入了我们的生活，深刻...【详细内容】

2024-04-03　　　　砍柴网　　Tags:昆仑万维　点击:(7)　　评论:(0)　　加入收藏

推荐资讯

AI是万灵药？Meta要把大	考研调剂第一次失败后
高职单招是什么意思？	在饭局上喝酒，要学会3
汽车不停能开多少公里	三证齐全，中国“飞的”
小米SU7被大卸八块，雷	视频号，从抖音挖来一个