生成式人工智能浅论

时间：2023-08-03 13:48:20 来源：作者：梁佳乐

生成式人工智能由来已久。一些资料显示，它早在 20 世纪 50 年代就已出现。其他资料则指出，最早的初级聊天机器人出现在 20 世纪 60 年代。无论真正的起源点是什么，我们都认为，与过去一年中出现的大量研究论文、应用、新闻报道、博客文章和对话相比，这些都只是历史时间轴上的小石子，尤其是随着生成式人工智能在计算机视觉模型（图像和视频的深度学习，包括稳定扩散、Midjourney 和 DALL-E）和大型语言模型（文本和语言的深度学习，包括 GPT-3、GPT-4 和本文标题中提到的杰出范例）的出现。

生成式人工智能（Generative AI）是人工智能（AI）的一个领域，其重点是训练和部署能够生成新的原创内容的系统，例如从某类内容的历史训练实例中创建新颖的文本、图像、音乐或视频。虽然这可以应用于结构化数据（如数据表、时间序列和数据库），但当它应用于非结构化数据（图像和文本）时，更具有开创性和全球新闻价值。与依赖于预定义规则和模式的传统人工智能模型不同，生成式人工智能模型能够通过学习大量先前的数据产生新颖的输出结果。生成式人工智能的核心是机器学习（ML）和统计学的概念。(当然，统计学习和机器学习已经密切相关）。

关于生成式人工智能中出现的 ML 的具体方面，ML 的一个子集被称为无监督学习，用于学习给定数据集中重复出现的模式和结构。然后，这些模式就会成为 "具有统计超能力的积木"（请原谅我的夸张），然后可以将其组合成逻辑上有意义、统计上可行的分组，生成与训练数据（文本或图像）非常相似的新内容（通常是令人印象深刻的新内容）。这一过程属于无监督学习，因为它的目的不是对已知模式进行分类、标记或复制（监督学习），而是在非结构化数据中发现复杂模式（有点像独立分量分析 ICA 的一般形式，与主分量分析 PCA 相似，但并不相同）。ICA 用于信号处理（如盲源分离或 "鸡尾酒会问题"），它是一种计算方法，用于识别复杂信号并将其分离为一组独立的加法子分量。

关于在生成式人工智能中出现的统计学方面，我们会遇到许多作为马尔可夫模型和贝叶斯学习基础的关键统计学概念（因此，生成式人工智能起源于 20 世纪 50 年代）。为这些方法提供支持的条件概率的历史可以追溯到更久远的年代，其中最著名的当然是托马斯-贝叶斯（Thomas Bayes）牧师（贝叶斯定理发表于 1763 年）。生成式人工智能利用条件概率对极其复杂和庞大的多元数据进行处理，计算出这些构件（无监督 ML 学习到的模式和结构）最有可能的组合，以响应用户的查询（即用户提示）。

因此，生成式人工智能构建新颖输出能力的 "秘诀 "由三个基本结构组成：(1) 储存所有可能成分的仓库（即训练数据中的 ML 学习模式和结构）；(2) 用户的意图（即用户查询中提供的大量个性化请求的菜单选项，用户查询是指明用户需要的提示类别）；(3) 配方（即计算成分组合和顺序的统计模型，将生成在统计上最有可能满足用户查询的输出）。

为了在这里增加一点色彩，查询的“上下文” 从根本上说也很重要，但我希望生成式人工智能的“个性化” 部分已经体现在指明用户意图的提示中了。要获得最佳（信息量最大、最令人满意、最个性化）的响应，很大程度上取决于在良好的提示工程中提供良好的上下文，而这正在成为“未来工作” 的一项新工作技能。

在写这篇文章时，我决定用 ChatGPT 来实例化我的食物隐喻。于是，我向 ChatGPT 提出了一个问题：“给我一个使用夏威夷当地水果和香料的派的食谱”。下面是回复：“Kirk Borne 向 ChatGPT 询问夏威夷派的食谱”（具体食谱此文略）。我要结束这篇博客，现在就去做一个派。

虽然这一切如此诱人，令人兴奋、令人振奋，而且具有爆炸性的变革意义，但我们也必须接受教育。更准确的说，在企业高管和其他领导者因为害怕落后于竞争对手和其他市场而出现“FOMO”现象，说 “马上给我一些生成式人工智能”之前，需要为任何此类部署在企业内取得成功和富有成效奠定基础。配方中有哪些关键成分？这里有三个：

数据素养：人们需要了解数据以及数据如何提供业务洞察力和价值；企业中存在哪些类型的数据；这些数据存放在哪里；谁在使用这些数据；数据用于哪些业务目的；访问和使用这些数据有哪些道德（管理或法律）要求；以及这些数据最终是否足以用于训练生成式人工智能（大型语言或视觉模型）？
数据质量：还用说吗？好吧，我来说：GIGO “垃圾进，垃圾出！”在黑盒子 ML 模型中，尤其是那些消耗大量数据的模型（如深度学习、人工智能和生成式人工智能），脏数据的危害更大。如果数据不干净，模型的可解释性就毫无意义，模型的可信度也会丧失。
数据/ML 工程基础架构：在数据科学家的笔记本电脑上运行的探索性 ML 模型与在整个业务中运行的已部署、已验证、已管理和全企业范围的模型之间存在着巨大的差异，企业对后者下了很大的赌注并产生了极大的依赖。基础设施必须为人工智能做好准备，其中包括网络、存储和计算基础设施。如果没有这种弹性基础，在董事会上运行首席执行官笔记本电脑上的 ML 模型可能比在最糟糕的时候出现的生成式人工智能“演示恶魔”更好。

原文标题：I bet you think this article is about ChatGPT

原文作者：Kirk Borne

Tags：人工智能点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　Search: 人工智能点击:(4)　　评论:(0)　　加入收藏

谷歌或改变商业模式，人工智能搜索考虑收费

诸如ChatGPT这样的产品针对提问可以给出快速而完整的答案，这可能会使传统搜索引擎的链接列表和伴随这些链接出现的广告变得多余。谷歌考虑对人工智能搜索收费谷歌考虑对人工...【详细内容】

2024-04-07　　Search: 人工智能点击:(1)　　评论:(0)　　加入收藏

昆仑万维发布面向人工智能时代的六条人才宣言

过去的一年多，是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里，我们见证了人工智能的快速发展和广泛的影响，人工智能已经迅速地融入了我们的生活，深刻...【详细内容】

2024-04-03　　Search: 人工智能点击:(7)　　评论:(0)　　加入收藏

生成式人工智能有哪些新趋势？

相较于去年，当下我们所能体验的人工智能技术的范围已经大幅提升。从搜索引擎、电商平台再到社媒平台，只要是以搜索结果为导向的内容，都会出现它的身影。但其实，人工智能的应用场...【详细内容】

2024-04-03　　Search: 人工智能点击:(6)　　评论:(0)　　加入收藏

关于AI人工智能在写作方面有哪些优势？

随着科技的快速发展，AI人工智能已逐渐渗透到我们生活的方方面面，其中在写作领域的应用也愈发广泛。AI人工智能在写作方面的优势不仅体现在其高效、精准的处理能力上，还体现在其...【详细内容】

2024-03-27　　Search: 人工智能点击:(17)　　评论:(0)　　加入收藏

生成式人工智能在搜索引擎优化（SEO）中的应用顶级案例

原文作者 | Rahul Solanki生成式人工智能正在迅速改变搜索引擎优化 (SEO) 的工作方式。这些新时代的语言模型和机器学习系统不仅可以研究大量信息，还可以理解上下文和含义，并...【详细内容】

2024-03-27　　Search: 人工智能点击:(9)　　评论:(0)　　加入收藏

苹果手机将搭载百度AI技术？百度人工智能A股小伙伴有这些

财联社3月24日讯（编辑若宇俞琪）据华尔街日报周五晚间报道，苹果在中国寻找本土生成式AI提供方，苹果讨论了在中国的设备中使用百度的人工智能技术。受该利好消息刺激，百度美股周...【详细内容】

2024-03-26　　Search: 人工智能点击:(10)　　评论:(0)　　加入收藏

“AI骗局”横行人工智能安全亟待加码

人工智能的“双刃剑”效应日益明显。AI技术在引发科技变革、提升生产力和效率等方面展现了充分的潜力，但与此同时，它带来的安全隐患也越来越凸显。利用深度伪造制造假象、操纵...【详细内容】

2024-03-22　　Search: 人工智能点击:(7)　　评论:(0)　　加入收藏

马斯克旗下人工智能大模型Grok已正式开源

鞭牛士报道，3月18日消息，据外电报道，埃隆·马斯克 (Elon Musk) 的人工智能初创公司 xAI 迈出了重大一步，开源了其大型语言模型 (LLM) Grok。这意味着企业家、程序员、公司...【详细内容】

2024-03-18　　Search: 人工智能点击:(13)　　评论:(0)　　加入收藏

《2024人工智能安全报告》：2023年AI深度伪造欺诈增长30倍

近日，奇安信集团发布《2024人工智能安全报告》（以下简称《报告》）。《报告》显示，2023年基于AI的深度伪造欺诈增长了3000％，基于AI的钓鱼邮件增长了1000％；目前已发现多个有国家背景的...【详细内容】

2024-03-18　　Search: 人工智能点击:(21)　　评论:(0)　　加入收藏

▌简易百科推荐

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(1)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(2)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(2)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(4)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(5)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

第一批用 Kimi 做内容的网红已经杀疯了

作者：王东东文章来自：斗战圣佛小组技术信仰派 VS 市场信仰派朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是：大模型有没有戏。技术派...【详细内容】

2024-04-04　　　　斗战圣佛小组　　Tags:Kimi 　点击:(4)　　评论:(0)　　加入收藏

昆仑万维发布面向人工智能时代的六条人才宣言

2024-04-03　　　　砍柴网　　Tags:昆仑万维　点击:(7)　　评论:(0)　　加入收藏

推荐资讯

AI是万灵药？Meta要把大	考研调剂第一次失败后
高职单招是什么意思？	在饭局上喝酒，要学会3
汽车不停能开多少公里	三证齐全，中国“飞的”
小米SU7被大卸八块，雷	视频号，从抖音挖来一个