ChatGPT爆火，是AI的“狂飙”吗

时间：2023-02-22 09:17:19 来源：北京日报作者：

张田勘

说到最近网上最火的科技名词，非“ChatGPT”莫属。ChatGPT(Chat Generative Pre-trAIned Transformer)是美国一家人工智能研究公司研发的聊天机器人程序，不仅能与人有问有答，文章也写得有模有样，因此有些人称之为史上最强AI(人工智能)，甚至还有人联想到科幻片中人工智能最终取代人类的情节。记得上一轮掀起舆论热潮的人工智能事件，还是2016闍lphaGo以4∶1战胜世界顶级围棋棋手李世石。今天我们就来说说以ChatGPT为代表的人工智能对当前社会发展的影响，以及其现有成果在生物科学领域的作用。

接受强化训练的生成式AI：

对接用户需求创造新内容

现在全世界都在谈论的ChatGPT是一个人工智能撰稿和聊天工具，去年11月一经推出，便在社交媒体上迅速走红，至今月活跃用户已过亿。ChatGPT能够通过学习和理解人类的语言来进行对话、回答各种问题，还能根据要求完成视频脚本、文案、论文、代码等写作任务。它的成功，源于以深度学习为代表的人工智能技术的长期积累。从属性上看，ChatGPT其实是一个大型语言模型(LLM)，接受过大量文本数据的训练，能够对各种各样的问题输入生成类似人类的应答结果和反应，因此，也可以称它为容生成器。

AI需要具备3个要素：数据、算力及算法。数据是知识原料，算力及算法则提供“计算智能”以学习知识并实现特定目标。人们对AI有多种分类，以AI“能做什么工作”和“完成什么任务”作为标准，可以简单将其分为反应式AI(分析型AI)和生成式AI。

反应式AI根据预编程规则对不同类型的刺激做出反应，由于不使用内存，所以无法通过新数据进行学习。1997年击败国际象棋冠军加里·卡斯帕罗夫的IBM深蓝超级计算机就是反应式AI。

而生成式AI获得了大量数据、信息，并且经过强化训练和深度学习，以及类似于神经网络的反馈纠错机制，所以能完成很多工作，产生很多产品。用一句话概括其本质：根据用户的具体需求创造新内容。

从ChatGPT的全称“Chat Generative Pre-trained Transformer(生成式预训练转换器)”就能看出，它是一款可以自行生成许多内容的AI，包括各类文本、文章、与人对话、翻译、编写代码、绘画、制作视频等。

由于受各种因素的制约，ChatGPT生成的内容也有不少错误，尤其是关于社会、文化、人文、哲学、政治、经济和历史方面的内容。但是在自然科学领域，由于有公认的定律和共同的认知，如“原子是由带正电的原子核和核外带负电的电子构成的”，ChatGPT生成的内容出错率相对较少。

正因如此，虽然生成式AI在所有领域都有用武之地，但类似ChatGPT的生成式AI在自然科学领域的应用更受青睐。生物医学研究、医疗和生命科学都需要生成式AI，ChatGPT只是其中一种。

准确预测蛋白质结构：

可加快新药和疫苗研发

目前，生成式AI在生物医学领域的用途方兴未艾。生成式AI不仅能分析成千上万种蛋白质，还可以生成新的蛋白质，甚至是自然界从未出现过的蛋白质。

过去，认识和精确测定蛋白质的构型需要耗费大量的时间和精力，还未必能测得准，给药物、疫苗研发和疾病治疗造成了阻碍。如果生成式AI的结果既准确又快速，就可以知道一些病毒变异后的蛋白质结构，如新冠病毒的S蛋白变异，从而加快研发新药和疫苗的速度。

2020年，英国深度思考公司研发的阿尔法折叠2(Alpha Fold-2)有了惊人成就。这款生成式AI在2020年举行的第14届“蛋白质结构预测关键评估”大赛中大放异彩。它测定的大部分蛋白质结构非常准确，不仅与实验方法测得的蛋白质结构的精确度相同，还远超解析新蛋白质结构的其他方法。具体来说，阿尔法折叠2能在几分钟内预测出一个典型蛋白质的结构，并能够在几天内生成高精度的结构。2022年初，阿尔法折叠2又测出了2.2亿个蛋白质的结构，几乎涵盖了DNA数据库中已知生物的所有蛋白质。

2022年11月，Meta公司(前身为Facebook)奋起直追，其名为ESMFold的生成式AI软件预测了约6亿个蛋白质的结构，这些蛋白质来自细菌、病毒和其他尚未命名的微生铩Ｋ淙桓萌砑？淖既沸圆蝗绨⒍？ㄕ鄣�2，但在预测结构方面速度要快约60倍。

ESMFold的原理与ChatGPT基本相似，也是一种大型语言模型，只不过，训练它的内容不是自然语言，而是生物基因语言，也就是通过碱基排列的顺序和规律来检测蛋白质。

举例来说，对于ESMFold的训练，是把已知蛋白质的氨基酸序列“投喂”给它们，正如训练ChatGPT要把自然语言的词语根据语法进行“投喂”一样。自然界的蛋白质可以用20个不同的氨基酸链表示，每个氨基酸链由一个字母表示，这种训练使ESMFold对蛋白质序列有直观理解，并能理解蛋白质序列包含的蛋白质形状信息。在这样的深度学习之后，ESMFold学会了在氨基酸比例模糊的情况下“自动补全”信息。

研究团队把ESMFold应用于大规模测序的“宏基因组”DNA数据库，这些DNA来自于环境，包括土壤、海水、人类肠道、皮肤和其他微生物栖息地。ESMFold通过算法，能结合蛋白质结构和序列之间关系的信息生成预测结构。它总共预测了超过6.17亿个蛋白质的结构，只花了两周时间。而且，在6.17亿个蛋白质测试中，超过1/3的预测是高质量的，有数以百万计的蛋白质结构是全新的。

自然界酶类从无到有：

人工酶氨基酸序列变化也无损活性

生成式AI的强大还体现在可以生成自然界中没有的蛋白质和物质，为人类的衣食住行生产、提供新原料和产品。

美国一家人工智能研究企业研发了另一种生成式AI，称为人工酶人工智能系统ProGen。这是一种专门检测酶(由活体细胞产生的一种特殊蛋白质，人体内几乎所有生化反应都必须有酶参与才能完成)和生成酶的AI软件。在实验室测试中，ProGen设计的一些人工酶与自然界中发现的酶一样有效，即使其氨基酸序列与任何已知的天然蛋白质存在显著差异，也仍然有生物活性。

特定的蛋白质各有其单独的氨基酸排列顺序。研究人员把1.9万个酶家族的2.8亿种不同蛋白质的氨基酸序列输入ProGen机器学习模型中，同时提供相关蛋白质特性作为控制标签，然后让系统花费数周时间来“消化”这些信息。此后，研究人员再把信息收窄，使用来自5个溶菌酶家族的5.6万种蛋白质氨基酸序列，以及有关这些蛋白质的一些信息来对模型进行微调。

根据学习的内容，ProGen迅速生成了100万个蛋白质序列，研究团队在其中选择了100个进行测试后发现：来自5个溶菌酶家族的所有人工蛋白质均显示出活性，且73%具有抗菌功能，而在天然蛋白质中仅59%具有抗菌功能。

更令人惊讶的是，在另一轮筛选中研究团队发现，即使只有31.4%的序列与目前已知的天然蛋白质相似，生成式AI设计的酶类依然显示出了生物活性。与之相反的是，天然蛋白质如果发生任何一个突变，都有可能失去生物活性。

这些研究结果总结起来，彰显了三方面的意义：一是ProGen生成的人工蛋白质不仅可以正确表达，还展示出与蛋白质天然折叠相类似的结构；二是AI生成的蛋白质即便只有部分氨基酸序列与天然蛋白质的序列相似，也具有生物活性，但天然蛋白没有这个优势；三是人工智能可以设计出在自然界从未有过的新物质和新产品。

这意味着，如果采用生成式AI设计和生产蛋白药物、食品及生物产品(如降解塑料的产品)，会更快更有效，当然其安全性还需通过进一步的研究来检验。换句话说，如果人工智能生成的蛋白质能够像自然生成的蛋白质一样，也意味着未来人工智能可以设计人类所需要的各类产品，首要的就是满足人类生存的食物和药品。

帮助诊断疾病和优生：

最终结果仍需人类审核决定

现在，生成式AI已经发展到通过图像、血液、组织扫描结果，来检测、诊断和预测心血管病、眼部疾病、糖尿病，以及结直肠癌、肺癌、乳腺癌、前列腺癌等多种癌症。

心脏病是一类严重的心血管疾病。心电图信号最常被用作筛查心脏病的工具。新加坡南洋理工大学等机构的研究人员利用一种名为Gabor-CNN的人工智能机器学习算法设计出了一种生成式AI诊断工具，能模仿人类大脑的结构和功能，使用心电图诊断冠状动脉疾病、心肌梗死和充血性心力衰竭。试验结果显示，这种人工智能有助于自动识别健康人群和不同心血管疾病患者相关的心电图信号，其准确率能超过98.5%。

癌症同样可以利用AI来诊断和治疗。对于结直肠癌和乳腺癌，现在一般是通过观察CT照片和组织切片来进行诊断。中国中南大学等机构的研究人员从中国、德国和美国的8803名受试者和13个独立的癌症研究中心收集了超过1.3万张结直肠癌图像，利用这些随机选择的图像，研究人员构建了一种AI软件来识别结直肠癌的图像。初步测试结果显示，AI软件能检测出大部分结直肠癌图片，堪比真正的病理学家，甚至在很多情况下表现得更好。当然，最后的诊断还需经过病理学家的把关和审查。

还有一个受到医学关注的领域是不孕不育。现代生活方式和环境变化造成约有15%的夫妇不育，其中精子质量差是重要的原因之一。传统的做法是对精子活检来检测质量，但这个任务如果由AI来完成会更出色。

最近上海市第一妇婴保健院研发了一种AI软件，通过深度学习和算法，可以识别精子的“面部”和不同运动形态(类似于人脸识别)，操作者只需通过电脑屏幕观察即可。这套AI系统对3家医院共1000份样本进行检测的结果显示，其准确性与传统方法相同。AI软件大大缩短了整个检查过程，仅需一个半小时，而使用传统方法需要大约一周时间才能拿到报告。

这样的“智能”例子举不胜举。可以预想，人工智能的快速发展将会对许多领域造成冲击，尤其是那些创造性较低且基于行业知识或训练就可以完成的工作，如客服、动画建模、美工、翻译、低级代码开发人员等。此次风靡全球的ChatGPT让我们看到，人工智能的发展有了质的飞跃，预示了更多可能，但这种技术革新目前还只限于语言维度，并非主动意识，也不具备真正的创新能力，与科幻片中“人工智能取代人”的幻想相去甚远。

总之，无论AI应用到了什么领域，最终所获得的成果或生成的产品仍需由人来审核和决定，这才是对待AI的科学态度。

《北京日报》2023年2月22日第9版

Tags：AI 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

Meta推出新版自研AI芯片：性能较上代提高三倍，降低对英伟达依赖

AI（人工智能）芯片紧缺之际，越来越多科技巨头选择自行研发。当地时间4月10日，社交巨头Meta公布了自主研发芯片MTIA的最新版本。MTIA是Meta专门为AI训练和推理工作设计的定制芯片...【详细内容】

2024-04-11　　Search: AI 点击:(1)　　评论:(0)　　加入收藏

英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电

新华财经上海4月11日电当地时间4月9日，英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称，相比英伟达的H100 GPU，Gaudi3 AI芯片的模型...【详细内容】

2024-04-11　　Search: AI 点击:(2)　　评论:(0)　　加入收藏

AI“复活”亲人成生意，哪些红线待划定？

提供一张照片、一段10多秒的音频，即可让逝者在视频中“活”过来——AI“复活”亲人成生意，哪些红线待划定？本报记者陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】

2024-04-11　　Search: AI 点击:(2)　　评论:(0)　　加入收藏

全球十大独角兽发布：字节稳坐第一，SpaceX第二，OpenAI第三

鞭牛士报道，4月10日消息，根据胡润《2024 年全球独角兽指数》，TikTok 所有者字节跳动以 1.56 万亿元人民币（1.72 万亿港元）连续第三年成为全球最大的独角兽公司。SpaceX 以 1.28...【详细内容】

2024-04-10　　Search: AI 点击:(0)　　评论:(0)　　加入收藏

科技巨头狂撒千亿美元 “买照片”，只为训练AI模型？

高质量的数据，越来越值钱。你能想象，那些被遗忘在网盘的陈年老图，有朝一日能价值千金？就在最近，路透社报道称，苹果公司正与图像托管网站Photobucket协商，希望得到这家公司近130亿张...【详细内容】

2024-04-10　　Search: AI 点击:(0)　　评论:(0)　　加入收藏

数字水印国标将出，AI生成内容标识成新焦点

日前，全国网络安全标准化技术委员会就国家标准《信息安全技术数字水印技术实现指南》公开征求意见，这是数字水印技术方面的首份国家标准，旨在解决由于缺乏统一实施流程、服务接...【详细内容】

2024-04-10　　Search: AI 点击:(2)　　评论:(0)　　加入收藏

互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

早前，一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主，向用户大力推介“所有人都需要学”的AI入门课程。不过，这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】

2024-04-10　　Search: AI 点击:(7)　　评论:(0)　　加入收藏

AI是万灵药？Meta要把大模型塞进AR眼镜里

寻找下一块“屏幕”，这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网，智能手机让移动互联网无处不在之后，这前后两次造富神话的出现，也让所有人都在期待下...【详细内容】

2024-04-09　　Search: AI 点击:(6)　　评论:(0)　　加入收藏

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　Search: AI 点击:(3)　　评论:(0)　　加入收藏

AI+数字人成为市场关注焦点，大屏AI数字人助力展厅设计创意升级

随着各行业产业的数字化转型加速，人工智能时代的到来，展馆展厅行业也步入数字时代，各式的展馆展厅设计在融合了全息投影、虚拟现实、数字沙盘、互动投影、互动桌面等多种技术后...【详细内容】

2024-04-09　　Search: AI 点击:(4)　　评论:(0)　　加入收藏

▌简易百科推荐

行业大模型快速落地的一年，如何做？

生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看，无论是“文生文”的大语言模型，还是“文生图”的多模态模型，更多的是辅助人们进行一些简单的办公，或者提供一...【详细内容】

2024-04-10　　　　钛媒体APP　　Tags:行业大模型　点击:(3)　　评论:(0)　　加入收藏

互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

2024-04-10　　　　九派新闻　　Tags:AI课　点击:(7)　　评论:(0)　　加入收藏

藏在AI背后的“吃电狂魔”

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(3)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(3)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(4)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(6)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(3)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(5)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(6)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

推荐资讯

新增融券再启动暂停键	16个Redis常见使用场
一篇文章教会你使用Py	聊聊Rust里面的数据类
C++中的外部模板及其	一篇文章带你了解Pyth
网络安全行业的春天何	Linux获取Redis 性能