ChatGPT火遍全网，却有一大缺陷

时间：2023-02-13 10:34:47 来源：中国科学报作者：

文｜吴飞（浙江大学人工智能研究所所长、浙江大学计算机科学与技术学院教授）

最近，聊天机器人模型ChatGPT可谓火遍全网。

去年11月30日，由美国人工智能实验室AI target=_blank class=infotextkey>OpenAI推出的ChatGPT可完成类似人类的文本回复，涵盖事实信息、对话和创意写作等任务，具有改变企业与客户互动方式的潜力，适用于聊天机器人、虚拟助理、语言翻译和内容生成等多种应用场景。

人工智能技术长期积累的产物

ChatGPT的成功并非一蹴而就，而是源于以深度学习为代表的人工智能技术的长期积累。

早期神经网络技术秉承人工智能深度学习 “逐层递进、层层抽象”的基本思想，出现了诸如MCP神经元、感知机和前馈神经网络等模型。它们通常由多个处理信息且相互连接的“神经元”组成，其灵感来自人脑中所链接神经元之间的信息交换。

1949年，心理学家唐纳德·赫布指出，“神经元之间持续重复的经验刺激可导致突触传递效能增加，神经元之间突触的强弱变化是学习与记忆的生理学基础。”赫布理论为神经网络研究奠定了认知神经心理学基础。

在自然语言中，句子均由一个个单词前后相连组成。为了处理自然语言这一种序列数据，循环神经网络被提出。循环神经网络适用于处理自然语言这种序列数据，其特点是可存储前序信息将其作为上下文，以辅助句子理解。

2017年12月，google发表了论文Attention is all you need，将自注意力机制引入以更高效学习单词与其上下文单词之间的共生关系，构建了被称为Transformer的模型。

研究人员一般采取一种“完形填空”方法来训练Transformer模型。给定一个句子，可从句子中“移除”一个单词，然后让模型根据剩下单词的上下文填空，预测最合适的“填空词”，通过这样的“自监督学习”不断强化模型能力。可以看出，通过“完形填空”就可使用互联网以及图书馆中海量语料自动训练模型，从而减少对昂贵标注数据的依赖。

由于ChatGPT需要完成的是聊天问答任务，研究者提出了一种“提示学习”方法改善模型。在该方法中，将答案句子中某个单词“移除”，然后把问题句子和答案句子拼合在一起，让模型预测被移除的单词。如此不断学习，模型就挖掘出了“问”和“答”之间的关联，具备了根据问题合成答案的能力。

ChatGPT还引入了人类反馈中的强化学习技术，将人类对其所提供答案的判断反馈给模型，以便对模型参数微调，提高语言模型回答的真实性和流畅性。

可见，人工智能现有基本模型是以逻辑推理为核心的符号主义AI、以数据驱动为核心的连接主义AI（深度学习）、以反馈控制为核心的行为主义AI（强化学习）。ChatGPT是对现有人工智能方法和技术的创新性整合。

技术特点和不足

在“数据是燃料、模型是引擎、算力是加速器”的驱动下，以深度学习为核心的人工智能正犹如水和电一样赋能人类社会。

ChatGPT恰如其分地体现了“数据、模型和算力”特点：ChatGPT的训练使用了45TB的数据、近1万亿个单词（大概是1351万本牛津词典所包含的单词数量）。使用了深度神经网络、自监督学习、强化学习和提示学习等人工智能模型。训练ChatGPT所耗费的算力大概是3640 PetaFLOPs per day，即用每秒能够运算一千万亿次的算力对模型进行训练，需要3640天完成。目前披露的ChatGPT的前身GPT-3模型参数数目高达1750亿。如果将这个模型的参数全部打印在A4纸上，一张一张叠加后，高度将超过上海中心大厦（632米）。

在大数据、大模型和大算力的工程性结合下，ChatGPT展现出统计关联能力，可洞悉海量数据中单词-单词、句子-句子等之间的关联性，体现了语言对话的能力。

ChatGPT以“共生则关联”为标准对模型训练会产生虚假关联和东拼西凑的合成结果，如ChatGPT认真回答“林黛玉倒拔垂杨柳”这样啼笑皆非的问题，就是缺乏常识下对数据进行机械式硬匹配所致。

2016年3月所出现的人工智能现象级产品AlphaGo以4：1击败李世石在互联网上激起了热烈讨论。虽然AlphaGo在迎战李世石之前，已经“阅览完毕”人类选手所有比赛棋局，并且通过自我对弈“华山论剑”海量虚拟棋局。但是，李世石在唯一获胜的一盘中使出了人类选手绝对不可能落子的一招，这一AlphaGo从未见过的落子使其无法从容应对而落败。可见，“数据驱动学习”模式下现有人工智能算法在挖掘共生知识方面固然表现出很强的能力，但是应用归纳、演绎、顿悟等能力获得新的创新知识更难能可贵。

同时，ChatGPT通过所挖掘的单词之间的关联统计关系合成语言答案，却无法明晰判断答案中内容的可信度，损害基于该模型研发的一系列具体应用模型的有效性，甚至引发偏见，传播与事实不符、冒犯性或存在伦理风险的毒性信息，产生技术伦理风险。

人和人造物的力量协同

1956年，人工智能从达特茅斯启航，经历了三起两落的曲折历程，今天我们很幸运地处于其第三次崛起过程中，这得益于深度学习在自然语言、计算机视觉和机器人等领域应用的成功。

1973年发表的“莱特希尔报告”对当时雄心勃勃构造“人类知识水晶球”符号主义人工智能提出了批评，认为“迄今的发现尚未产生当时承诺的重大影响”，人工智能跌入了第一次隆冬。BBC甚至于当年邀请科学家围绕“通用机器人是海市蜃楼吗”进行了一场电视辩论。

20世纪80年代左右，神经网络在实际应用中作用有限，使得人工智能跌入了第二次低谷。先后在麻省理工学院和加州大学伯克利分校任教的休伯特·德雷福斯教授以兰德公司顾问的身份，于1965年发表了《炼金术与人工智能》报告，将当时所进行的神经网络研究与历史上的炼金术相提并论，辛辣指出爬上树梢不等于攀登月球。

人工智能本身还在不断发展，将其等同于人类大脑是不切实际的想法，认为其超越人类则是杞人忧天。我们要认识到目前人工智能还处于完成特定任务的“就事论事”阶段，迈向通用人工智能是今后面临的长期挑战。人工智能是帮手，将人类从繁冗工作中解放出来，使得人类更专注于独立思考、综合判断、创新思维等工作。

在中国工程院院士潘云鹤看来，“未来将是人和人工智能共同进化的时代”“科学普及将人类进化中累积知识转化为人和人造物的力量”。

美国历史学家斯塔夫里阿诺斯在《全球通史》一书中赞誉“蒸汽机的历史意义无论怎样夸大都不过”，但是蒸汽机必须与纺织工业、冶金行业、交通行业等结合，才能推动人类整体迈入工业革命时代。

同理，电力和计算机等为代表的通用使能技术与其他技术结合，使人类先后进入了电气化时代和信息化时代。今天，人工智能已经成为一种通用使能技术，具有增强任何领域技术的潜力，被广泛应用于农业、制造、经济、运输和医疗等领域，发挥很强的“头雁效应”。

ChatGPT因人而生、因人反馈而演进，人和人造物协同迸发出赋能之力，凡贵通者，贵其能用之也！

《中国科学报》 (2023-02-13 第3版综合原标题为《ChatGPT：爬上树梢与攀登月球》)

编辑 | 赵路

Tags：ChatGPT 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

ChatGPT 应用商店？可能是一个万能应用程序！

OpenAI 在去年 11 月召开了一次开发者大会，首席执行官 Sam Altman 希望软件制造商在 ChatGPT 之上进行进一步的构建。OpenAI 表示，它将很快推出一个市场，开发人员和非技术人员...【详细内容】

2024-04-12　　Search: ChatGPT 点击:(8)　　评论:(0)　　加入收藏

OpenAI 宣布向 ChatGPT 付费用户开放新 GPT-4 Turbo 模型

IT之家 4 月 12 日消息，OpenAI 今日宣布，新 GPT-4 Turbo 现已向付费 ChatGPT 用户开放。与 1 月份相比，新版本提高了写作、数学、逻辑推理和编码的能力。GPT-4 Turbo 可在 Chat...【详细内容】

2024-04-12　　Search: ChatGPT 点击:(6)　　评论:(0)　　加入收藏

ChatGPT官宣免注册，全球互联网变天！OpenAI将取代谷歌搜索？

新智元报道编辑：编辑部【新智元导读】OpenAI这份愚人节礼物，实在是太大了：今天起，ChatGPT不用注册，可以直接使用。用户狂欢，竞品颤抖，我们仿佛已经听到，谷歌搜索引擎这位巨人轰然倒...【详细内容】

2024-04-02　　Search: ChatGPT 点击:(18)　　评论:(0)　　加入收藏

无需注册！OpenAI宣布放开ChatGPT使用限制

工智能初创公司OpenAI宣布，即日起用户无须注册即可开始使用ChatGPT的功能。OpenAI在最新公告中写道：“让ChatGPT等工具广泛可用，让人们能够体验到人工智能的好处，这是我们使命的...【详细内容】

2024-04-02　　Search: ChatGPT 点击:(8)　　评论:(0)　　加入收藏

ChatGPT 突然放开了账户限制，面向所有人开放

大门终于打开。奥特曼 OpenAI 的旗舰产品 ChatGPT 突然宣布：将面向所有人开放，无论你有没有注册账户。从今天开始，访问 Chat.openai.com 将不再要求用户登录，用户将直接进入与 C...【详细内容】

2024-04-02　　Search: ChatGPT 点击:(3)　　评论:(0)　　加入收藏

今天起，ChatGPT无需注册就能用了！

　来源：量子位　　　　金磊克雷西发自凹非寺　　就在刚刚，OpenAI狠狠地open了一把：从今天起，ChatGPT打开即用，无需再注册帐号和登录了！　　像这样，直接登录网站，然后就可以开启对...【详细内容】

2024-04-02　　Search: ChatGPT 点击:(8)　　评论:(0)　　加入收藏

ChatGPT之父Altman两小时对谈，首聊GPT-5何时发布、llya去哪里了、Q*究竟是什么

Altman做客油管博主Lex Fridman科技博客，被追问了一个又一个辛辣的问题。长达两个小时的对谈，奥特曼从OpenAI宫斗、马斯克诉讼、Sora，一直聊到AGI与外星文明！本文重点梳理了长...【详细内容】

2024-03-20　　Search: ChatGPT 点击:(9)　　评论:(0)　　加入收藏

ChatGPT主管最新访谈：未来AI和人类如何共处？

Peter Deng在最新访谈中表示：AI不会取代生产力，人类和AI只有合作才能释放真正潜力，ChatGPT比已知的更强大、最大的挑战在于理解用户需求。当地时间3月13日，OpenAI 消费产品副总...【详细内容】

2024-03-19　　Search: ChatGPT 点击:(13)　　评论:(0)　　加入收藏

ChatGPT日耗电超50万度，大模型或带来“电荒”

未来两年内将由“缺硅”变为“缺电”，马斯克的预言可能正在变成现实。据《纽约客》杂志报道，OpenAI的热门聊天机器人ChatGPT每天可能要消耗超过50万千瓦时的电力，以响应用户的...【详细内容】

2024-03-11　　Search: ChatGPT 点击:(34)　　评论:(0)　　加入收藏

OpenAI新功能：ChatGPT可调用自定义机器人，对话更高效！

近日，知名科技公司OpenAI推出了一项新的功能——“对话中调用（@）自定义聊天机器人”，让用户在对话中无缝切换不同领域的机器人。这一功能的出现，为用户带来了极大的便...【详细内容】

2024-02-02　　Search: ChatGPT 点击:(55)　　评论:(0)　　加入收藏

▌简易百科推荐

ChatGPT 应用商店？可能是一个万能应用程序！

2024-04-12　　视角先锋队　　　　Tags:ChatGPT 　点击:(8)　　评论:(0)　　加入收藏

Kyligence发布企业级AI解决方案！AI数智助理降低数据使用门槛

智东西作者 | 长颈鹿编辑 | 李水青智东西4月12日报道，昨日大数据分析和指标平台供应商Kyligence（硅智信息）召开了数智论坛暨春季发布会，并分享和探讨Data+AI产品及解决方案在金...【详细内容】

2024-04-12　　　　智东西　　Tags:Kyligence 　点击:(7)　　评论:(0)　　加入收藏

百度Create AI剧透：“三大开发神器”升级，模型增至77个，三步即可生成应用

智东西（公众号：zhidxcom）作者| 香草编辑| 李水青智东西4月11日报道，今日，在百度Create AI开发者大会预沟通会上，百度披露了“三大开发神器”AgentBuilder、AppBuilder、ModelBuild...【详细内容】

2024-04-12　　　　智东西　　Tags:Create AI 　点击:(5)　　评论:(0)　　加入收藏

李彦宏最新内部讲话：开源大模型不如闭源，后者会持续领先

界面新闻记者 | 李如嘉界面新闻编辑 | 宋佳楠4月11日，界面新闻获悉，百度创始人、董事长兼首席执行官李彦宏在一场内部讲话中首次谈及文心大模型为何不开源，以及对于大模型开源...【详细内容】

2024-04-12　　　　界面　　Tags:李彦宏　点击:(5)　　评论:(0)　　加入收藏

AI未来或超越“最聪明的人”？专家谈发展如何兼顾公平

中新社北京4月11日电 (记者马帅莎)到明年底或2026年，人工智能(AI)或超越“最聪明的人”，美国知名企业家埃隆·马斯克近日对人工智能的这一大胆猜想引起关注，这比他去年...【详细内容】

2024-04-12　　　　中国新闻网　　Tags:AI 　点击:(5)　　评论:(0)　　加入收藏

行业大模型快速落地的一年，如何做？

生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看，无论是“文生文”的大语言模型，还是“文生图”的多模态模型，更多的是辅助人们进行一些简单的办公，或者提供一...【详细内容】

2024-04-10　　　　钛媒体APP　　Tags:行业大模型　点击:(5)　　评论:(0)　　加入收藏

互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

早前，一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主，向用户大力推介“所有人都需要学”的AI入门课程。不过，这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】

2024-04-10　　　　九派新闻　　Tags:AI课　点击:(10)　　评论:(0)　　加入收藏

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(7)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(7)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(4)　　评论:(0)　　加入收藏

推荐资讯

Meta如何将缓存一致性	兄弟，王者荣耀的段位排
雷军：10年编程路，给程序	5月新政策实施，电动车
新“国九条”，你真看懂	网友喊话刘强东开直播
4月央行缩量续做1000	知名早教机构跑路，背后