您当前的位置:首页 > 新闻资讯 > 科技

读懂2023中国AIGC商业潜力研究报告

时间:2023-09-06 11:04:55  来源:  作者:蒲公英创业吧

人工智能发展的漫长历程中,如何让机器学会创作一直被视为难以逾越的天堑,“创造力”也因此被视为人类与机器最本质的区别之一。然而,人类的创造力也终将赋予机器创造力,把世界送入智能创作的新时代。

从机器学习到智能创造,从 PGC,UGC 到 AIGC,我们即将见证一场深刻的生产力变革,而这份变革也会影响到我们工作与生活的方方面面。

 

预学习引发AI技术质变,摆脱过去AI的高门槛、训练成本高、生成内容单一的痛点。基于大模型的泛化能力,知识蒸馏与微调后进入专用领域的应用,覆盖短头、长尾的场景。多模态打破多种信息之间的边界,提升AIGC内容多样性与技术多样性,拓宽应用的场景。

中外差距:中国生成式 AI 与国外先进水平存在一定差距,但凭借国内应用场景的多样性,具备AIGC的数据积累优势,有望追上先进步伐。

AIGC 概述

AIGC(AI Generated Content)是基于 GAN、预训练大模型、多模态技术融合的产物,通过已有的数据寻找规律,并通过泛化能力形成相关内容。

从商业角度看,AIGC 是一种赋能技术,通过高质量、高自由度、低门槛的生成方式为内容相关场景及生产者进行服务。

早期决策式 AI 依赖逻辑判断的纯粹性,万物都能完美观察、任何测量不存在误差的前提,不符合真实世界的“不确定性”;概率范式基于经验主义与理性主义一定程度上解决了“不确定性”;深度加强学习可以利用合理的数据丰度与奖惩模型达到类人类智能的水平,实现高质量内容与内容创作自动化;通用型 AI 具备泛人类智能,可以像人类一样执行各种任务。

决策式 AI

AI 在早期工作在于关注逻辑、自动定理证明和操纵各种符号,该类 AI 理解基础的物理知识,具备一定的逻辑能力,通过分析数据和信息,帮助使用者更好的做出判断与决策。但基于逻辑的 AI 缺乏感知能力,对真实世界普遍存在的“不确定性”较难处理。概率与统计可以初步解决“不确定性”,但是概率范式需要经验主义先于理性主义进行填充。以 Bayes 模型为例,需要 经验主义者先设定先验数据。

生成式 AI

以数据为中心,深层次的网络堆叠为架构,样本数据及数据种类的丰富,训练的模型泛化能力就越强,效果越好。同时深度学习训练 AI 已经可以很好的执行任务。不过,强化学习的效果却不一定受到数据丰度的影响。强化学习遵循 Markov 原则,只要奖惩设计合理就能实现不错的效果。

通用型 AI

具备泛人类智能的 AI,可以像人类一样执行各种任务。历次 AI 寒潮沉淀的技术,终在算法、算力、数据三者共振的情况下诞生出大模型。

在1956年的达特茅斯会议上,“人工智能”的概念被首次提出,六十多年以来,历经逻辑推理、专家系统、深度学习等技术的发展,人工智能也经历了数次沉浮,有如日中天的发展时期,也有因技术不足热度退去后的寒潮。而每一次寒潮后,也会经历技术的蛰伏发展,为人工智能带来里程碑式的进步。

 

预学习的出现解决了过去生成式大模型的痛点,但预学习本身存在模型尺寸、小样本数量、微调能力的不可能三角,解决方法也不尽相同:对于极大模型,使用知识蒸馏;对于少样本学习能力,进行数据增强;对于监督训练表现欠佳的模型,进行提示学习。

以 GPT 为例,在目前阶段,厂商通常的做法是扩大模型尺寸。

预学习大模型的出现解决了过去各类生成式模型使用门槛高、训练成本高、内容生成简单和质量偏低的痛点,满足真实内容消费场景中的灵活多变、高 精度、高质量等需求。

预学习思路

• 将大量低成本收集的训练数据集中,学习其中的共性;

• 然后将其中的共性移植到特定任务的模型中,再进行微调,去学习该特定任务的特性部分。

AI 大模型底座驱动 AIGC 概念落地

在 AIGC 概念实际落地的过程中,只有基础大模型与通用技术是远远不够的,还需要能与场景融合匹配,更需要支持应用落地的工具平台和开放包容的创新生态,三者协同优化,加速 AIGC 落地。

在全应用流程中,主要通过大量的无标注文本进行共性学习,获得预训练大模型,此后再根据应用场景特征进行微调,更好与项目任务适配。

多模态打破多种信息之间的边界并生成质量稳定的内容,提升 AIGC 内容多样性。相比于信息模态单一的单模态模型,多模态模型可以同时处理更多模态的信息并将它们相互转化。

现今多模态模型以图文多模块为主。Transformer 虽受制于单模态但其权重共享适用于多模态;ViT 模型处理输入图片,使得 Transformer 可用, 从而打破 NLP 和 CV 间屏障;BEiT 将生成式预训练从自然语言处理迁移到了计算机视觉;扩散模型多用于文本图像生成。

多模态信息持续融合增加技术多样性,拓宽场景。多模态在视频分类、情感分析、语音识别等领域都得到了广泛应用,涉及图像、视频、语音、文本等融合内容,未来还将进入交互、感知、内容等更多应用场景。

中国决策式 AI 已达到世界一流水平,而生成式 AI 还与国外存在基础要素的不足。

在决策式 AI 方面,中国已经处在第一梯队,中国是发表 AI 论文最多的国家,且近 10 年来占比逐年增加。而在生成式 AI 方面,与国外还存在参数量的差距,背后隐含着算力资源、数据质量等基础要素的不足的原因。

AIGC 的原子能力随着时间的变化,内容呈现复杂化、多维化的特征,基础模态原子能力向多模态转变,表明目前 AIGC 商业应用的尝试正下沉至长尾场景,大模型的泛化能力、实时性、强推理与共情能力正在不断渗透为虚拟人、聊天机器人、知识图谱、合成数据、AIGS 进行多维度的赋能, 推动通用人工智能时代到来。

短期内算力成本占据生态圈核心,算法与配套的数据价值在远期凸显。

AIGC 大模型的训练、微调和运营需要大量的计算资源支撑,目前算力占据 AIGC 生态圈 65%成本,数据及算法占据剩下 35%的成本。

从短期看,一头独大的格局不会发生太大变化,大模型新入局玩家的算法训练和老玩家大模型的微调、迭代将会持续刺激算力成本上扬。

从长期看,有望出现三头并进格局,模型算法的迭代会成为 AIGC 通往 AGI 的解决方案,随着应用不断下沉长尾的专用场景,专用算法及场景沉淀的数据将会成为 AIGC 体验的核心,另外,合成数据及减少算力依赖的框架算法成熟将会加大缓和算力紧张的缺口。

 

随着数字经济蓬勃发展,数字化新事物、新业态、新模式推动应用场景向多元化发展,扩大算力是 AIGC 短期内最需要解决的问题。在后摩尔时代,算力供给和需求都会飙升,据预测,中国智能算力规模将会拥有47.5%的年复合增长率,但与智能算力需求仍存在较大差距。

中国算力需求剪刀差。算力构成了 AIGC 产业的核心底座,主要包括 AI 芯片、AI 服务器和数据中心。

AI 芯片:是算力的基础,主要分为 CPU、GPU、FPGA、ASIC 四类。CPU 是人工智能计算的基础,而 GPU、FPGA 和 ASIC 为协助 CPU 进行大规模计算的加速芯片。

AI 服务器:对 AI 芯片进行系统集成。AI 服务器的架构为“CPU+加速芯片”,在进行模型处理推理和训练时,效率更高。

数据中心:提供计算服务,承接 AI 算力需求。AIGC 使用算力资源在云端实现模型训练。

短期内 GPU 不可撼动,但随着 AI 任务比例变化,FPGA 及 ASIC 有望远期成为主力 AI 芯片。

短期看,GPU 占据 AIGC 训练及推理的绝对地位,英伟达基于 CUDA 强大的并行计算能力及自身产品力构建了护城河;远期看,FPGA 及 ASIC 芯片时延低、特需设计等特点将成为主力芯片,国内厂商凭借两者的多年积累有望加速 AI 芯片的自主化进程。

 

缺乏优质数据,让中文大模型患上“心脏病”。

AIGC 由 PGC 和 UGC 进行内容支撑,缺乏过往内容的将会直接性影响 AIGC,缺乏高质量的中文数据资料,将会影响到中文大模型在知识领域的能力。

此外,国内拥有大量高价值数据的互联网企业更倾向于将数据封闭在 App 和平台中,不同 APP 间数据不能连通,无法进行搜索,形成“数据孤岛”现象。

数据马太效应或导致中国大模型难以获得商业循环的支撑。

由于英文数据和中文数据之间的指数级别的差距,建立在数据之上的模型也会出现越来越大的差距,形成数据马太效应。

数据马太效应或导致英文大模型获得更多的商业机会,中文大模型亟需大量高质量的标注数据提升模型能力。

中文高质标注数据是国内大模型能力跻身国际先进水平的充要条件。

数据工程是 AI 工程的基础环节,其核心在于高质高效的数据标注,数据工程所得出的数据的质量,直接影响到整个模型的质量与精度。

中国数据量呈指数级增长,其中大占比的非结构化数据产生海量数据标注与清洗的需求,未来市场前景广阔。

 

开发通用大模型成为 AIGC 应用的底座。算法模型是人工智能的“灵魂”,通过建立算法模型并进行下行研发实现 AI 资产的复用获得盈利。

盈利方式通过大模型使用授权、行业大模型定制、工作流订阅及基于下游任务微调三种途径进行订阅模式、平台服务模式、定制化服务模式、API 服务模式、广告和推广模式、数据授权模式的商业变现。

目前大模型生成应用服务以 B 端为主,平台服务模式占比相对较高。作为服务提供商,AIGC 向 B 端和 C 端用户提供生成内容的技术平台和工具,并通过收取平台使用费、交易手续费、广告和推广收益以及数据授 权收益等方式获得收益。

在用户定位方面,AIGC 主要面向 B 端用户,如媒体、广告主、文化机构等,以及开发者、科研机构等需要使用生成内容技术的用户。

订阅模式

定义:用户通过订阅服务,定期或按需获取人工智能生成的内容。

案例:OpenAI:提供了GPT-3 订阅服务;Grammarly:提供英文语法和写作帮助的订阅服务。

平台服务模式

定义:AIGC 提供生成内容技术平台和工具,通过收取平台使用费获得收益。

案例:google Cloud AI:提供各种 AI 平台服务。

定制化服务模式

定义:公司可以根据客户的特定需求,提供定制化的人工智能生成内容服务。

案例:Hugging Face:提供NLP领域的开源软件,同时也提供定制化的 NLP 服务。

API 服务模式

定义:公司提供人工智能生成内容的 API,供开发者集成到自己的应用程序中。

案例:Google Cloud Vision API:提供基于图像和视频的视觉智能 API 服务。

广告和推广模式

定义:人工智能生成的内容可以作为广告或推广渠道,通过展示广告或推广内容来获得收益。

案例:阿里巴巴“文娱大 脑”:为企业生成各种类型的广告文案。

数据授权模式

定义:人工智能生成的内容可以作为数据的授权和授权来源,被其他公司或个人购买或授权使用。

案例:OpenAI:将GPT3的API授权给了 Microsoft 和 Github 等公司。

整体来看,数据和算力是大模型性能的关键限制因素,而算法的不断改进是让大模型接近其上限能力的关键,同时也是商业变现的“接口”。

AIGC 生态底座服务商会形成以互联网企业的通用大模型+行业大模型+原子基础能力的泛化派玩家,以大模型 AI 服务商、行业/垂直领域 AI 服务商为主的专用派服务商,结合企业自身过去的业务与技术强化 AIGC 在长尾场景的应用能力。

 



Tags:AIGC   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AIGC飞向“寻常人家”,专家称解决应用落地的“最后一公里”
中新网北京1月5日电 (记者 夏宾)AIGC可谓是2023年的热词之一。从GPT为代表的大模型涌现,到应用层的快速创新,接着继续向深度业务场景挺进,其服务实体经济的作用愈加明显。近日,I...【详细内容】
2024-01-05  Search: AIGC  点击:(109)  评论:(0)  加入收藏
科技部发文规范 AI 使用,禁用 AIGC 直接生成申报材料
IT之家 1 月 3 日消息,科技部监督司上个月编制印发《负责任研究行为规范指引(2023)》,《指引》从研究选题与实施、数据管理、成果署名、同行评议、伦理审查、监督管理等 11 个方...【详细内容】
2024-01-04  Search: AIGC  点击:(60)  评论:(0)  加入收藏
AIGC重塑基础设施,高密数据中心为何众望所归?
凯文·凯利在《必然》中认为,科技在本质上有所偏好,使得它朝往某种特定方向。毫无疑问,进入到数字经济时代,人工智能技术飞速发展与加速应用之际,这个特定方向逐渐明朗:即算...【详细内容】
2023-12-26  Search: AIGC  点击:(49)  评论:(0)  加入收藏
抖音拿下首张AIGC系统软件著作权,生成式内容或受法律保护!概念股砸出“坑”
研究机构表示,2023年我国AIGC市场规模约为14.4万亿元。抖音AIGC系统软件著作权获登记批准12月20日,天眼查App显示,抖音视界有限公司“基于人工智能的内容生成系统”软件著作权...【详细内容】
2023-12-22  Search: AIGC  点击:(111)  评论:(0)  加入收藏
关于“AIGC是什么意思”
当谈到AIGC时,人们可能会有不同的理解和观点。AIGC可以指代多种概念,包括人工智能全球大会、人工智能全球中心、人工智能全球竞赛等。在不同的背景下,AIGC可能代表着不同的含义...【详细内容】
2023-12-05  Search: AIGC  点击:(85)  评论:(0)  加入收藏
AIGC创业公司还没盈利,微软Adobe已赚得盆满钵满
衡宇 萧箫 发自 凹非寺量子位 | 公众号 QbitAI一出奥特曼在OpenAI“来去之间”的戏码,以回归暂告一段落。过程很抓马,吃瓜群众很激动,当然了,最开心的还得是微软。不仅因为这出...【详细内容】
2023-11-24  Search: AIGC  点击:(81)  评论:(0)  加入收藏
“大模型+小应用” 京东云激发AIGC生产力
大模型全面落地下的首个11.11,AIGC掀起了新一轮智能应用潮流。数百个智能场景落地京东:京东云智能客服处理咨询超14亿次,自动为客户推荐“一键价保”等超337万次;京小智服务商家...【详细内容】
2023-11-17  Search: AIGC  点击:(183)  评论:(0)  加入收藏
信息流场景下的AIGC实践
一、个性化的标题生成个性化的标题生成,指使用用户内容以及个性化的信息生成针对不同用户或者不同应用场景的标题。主要使用场景有以下三种: 推荐场景:在推荐系统中,不同用户或...【详细内容】
2023-10-16  Search: AIGC  点击:(192)  评论:(0)  加入收藏
AIGC浪潮“卷”至广告业,AI营销到底靠不靠谱?
今年以来,AIGC浪潮席卷各行各业,尤其是在营销领域,几乎每个月都有公司展开新动作,例如在刚刚过去的9月,蓝标发布营销行业模型,另有数家传媒类A股上市公司已陆续推出AI工具。一方面...【详细内容】
2023-10-13  Search: AIGC  点击:(265)  评论:(0)  加入收藏
美图秀秀上车最新自研大模型,各类AIGC玩法可直接体验
图片来源:由无界 AI生成美图自研大模型3.0,正式发布!并且全面应用于美图旗下影像与设计产品。这是自美图大模型面世100天后的最新迭代。相较于最初版本,3.0版能够生成更加真实细...【详细内容】
2023-10-10  Search: AIGC  点击:(166)  评论:(0)  加入收藏
▌简易百科推荐
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(7)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(7)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(1)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(3)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07    IT之家  Tags:OpenAI   点击:(6)  评论:(0)  加入收藏
量子计算会和经典计算一样融入人们的日常生活
作为2024中国网络媒体论坛打造的创新活动之一,“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场,本源量子计算科技(合肥)股份有限公司(以下简称“...【详细内容】
2024-04-03    人民网  Tags:量子计算   点击:(8)  评论:(0)  加入收藏
ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
新智元报道编辑:编辑部【新智元导读】OpenAI这份愚人节礼物,实在是太大了:今天起,ChatGPT不用注册,可以直接使用。用户狂欢,竞品颤抖,我们仿佛已经听到,谷歌搜索引擎这位巨人轰然倒...【详细内容】
2024-04-02    新智元  Tags:ChatGPT   点击:(8)  评论:(0)  加入收藏
谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
IT之家 4 月 2 日消息,根据华尔街日报报道,谷歌为了结追溯到 2020 年的集体诉讼案,近日同意删除通过 Chrome 浏览器“无痕(Incognito)模式”下收集的用户数据。这起诉讼原告认为,...【详细内容】
2024-04-02    IT之家  Tags:Chrome   点击:(7)  评论:(0)  加入收藏
站内最新
栏目相关
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · 国家数据局局长刘烈宏:充分发挥数据要素价值 培育新质生产力
  • · 谷歌Chrome巨变:第三方Cookie的终结将重塑互联网格局
  • · 百度+苹果,“AI手机元年”真的来了?
  • · 百度AI“咬”了一口苹果 大模型商用有戏了?
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条