AIGC产品的版权争议有“解药”吗？

时间：2023-04-20 10:18:34 来源：第一财经YiMagazine 作者：

实习记者 | 何欣晔

编辑 | 王姗姗

AIGC领域创新产品频出的当下，与之伴随的争议和担忧也正在同步升温。

一个月前，微软宣布旗下代码托管平台 Github 的AI生成代码辅助工具Copilot已集成了最新的GPT-4模型，开发者可以通过与机器人(11.530, 0.01, 0.09%)对话完成诸多日常工作。但这款大热的代码工具，目前正面临着内容使用版权方面的两起诉讼。

3月末，意大利成为首个明确禁用ChatGPT的国家；伊隆·马斯克等一千多名业界、学界人士则联署发表公开信，呼吁所有AI实验室立即暂停训练比GPT-4更强大的AI系统，暂停时间至少6个月。

上述公开信还建议，AI开发人员应与政策制定者合作，共同推出更强大的AI监管治理系统，包括内容出处与水印系统，帮助鉴别区分AI合成内容和真实内容，并追踪模型的数据来源。

的确，大模型以“黑盒”形式迅速迭代发展，其智能程度惊艳世人，但数据内容版权保护以及由此带来的信息安全、隐私保护等问题，都未得到清晰解释。

训练和输出阶段的版权争议

Copilot在2022年6月上线之初就因版权问题遭到抵制，有试用者称Copilot会直接复制粘贴大段开发者的代码。德州农工大学计算机教授 Tim Davis 在推特上发文称，Copilot 在没有标注归属信息的情况下，输出了大段其所有的受版权保护的代码。

程序员兼律师Matthew Butterick就旗帜鲜明地反对Copilot。2022年11月，他联合美国Joseph Saveri律师事务所的3位律师，正式对GitHub Copilot 及其背后的微软和OpenAI 公司提起诉讼。这是美国第一起关于生成式人工智能的集体诉讼。

来源：Matthew Butterick博客

Butterick称，Copilot违反了开源许可协议，在模型训练阶段，使用了Github社区中的开源代码作为训练数据，但抹去了代码的归属信息。代码的原作者信息无法在输出结果中被看到，开源社区的开发者可能会因此失去获得客户的机会。

GitHub称Copilot生成代码的所有权和责任属于操作者。Butterick和律师团队的诉状已提交至美国加州北区地方法院，要求批准 90 亿美元的法定赔偿金。后来，该团队以类似的理由代表两名匿名软件开发者发起了第二起集体诉讼，被告方分别为GitHub和OpenAI。

在今年1月提交给旧金山联邦法院的法庭文件中，两家被告公司称，原告依靠假设事件来提出索赔，并未指出其个人如何切实地受到Copilot的伤害。GitHub表示，Copilot在工作原理上，不会夺走开源代码中的任何东西，相反，它根据从公开代码中学到的知识生成建议，帮助开发人员编写代码。

这起诉讼的相关法庭听证会将在今年5月举行。而AIGC领域的诉讼不止关于AI代码工具。

今年1月，Butterick和团队还代理了三位艺术家起诉AI艺术创作工具Stability Al、DeviantArt和Midjourney的案件，指控Stable Diffusion等工具是21世纪的“拼贴把戏”，它们在未经授权的情况下使用了大量艺术作品。今年1月到2月，美国盖蒂图片社（Getty Images）也加入起诉行列，先后在英国和美国对Stability AI提起诉讼，称其知识产权受到侵犯，被诉公司从Getty Images的数据库中复制了超过1200万张图像。

“合理使用”定义模糊

这些站在被告席的AI技术公司，如果能证明在AI训练对数据的爬取中，模型训练的用途可以构成“合理使用”免责，就有可能免除内容侵权的诉讼风险。

但是关于“合理使用”的判断，美国的版权法采取“四要素”分析法，即使用目的和性质、版权作品的性质、所使用部分的量和对作品市场的影响。依据此标准，Copilot 对于现有代码的使用很难被纳入“合理使用”范畴。

在使用性质方面，自2022年7月，Copilot已正式开启收费模式，具有了盈利的目的；市场影响方面，当前各种类型的AI产品生成的内容会挤压原作者的生存空间，甚至会替代原有市场。

AI技术公司能拿出的一个对其有利的“先例”是google Books对书籍文本的使用因具有变革性而获得“合理使用”免责。Copilot对代码的使用方式似乎也是具有变革性的，有律师认为，它的“合理使用”辩护可能因此得到支持。

对于监管机构来说，“合理使用”认定困境主要在于，如果训练AI模型的数据不属于该范围，那么科技公司就必须向数据所有者支付版权费用，这会阻碍该新兴领域的发展；但如果认定属于“合理使用”，可能导致科技公司肆意使用人类劳动成果。目前，英国知识产权局为促进人工智能发展，已允许出于任何目的的文本和数据挖掘行为。

AIGC作品享有版权吗

今年3月，美国版权局（USCO）发布了一份关于AIGC作品版权的新指南，对AI作品的版权条件进行了说明。指南中提到，通过ChatGPT等AI工具直接生成的作品不受版权法保护，仅以AI作为辅助工具的人类创作的作品可以予以版权支持。

这份指南特别指出，版权只能保护人类创作的作品，宪法和版权法中使用的术语“作者”排除了非人类。

针对艺术家卡什塔诺娃（Kris Kashtanova）的作品《黎明的曙光》的版权认定问题，美国版权局今年2月指出，由艺术家本人撰写和编排的文字部分受版权保护，但使用Midjourney制作的图像不享有版权，理由是这些图像“并非人类创作的产物”。

《黎明的曙光》封面和扉页。| 来源：美国版权局

对于美国版权局的这一主张，计算科学家斯蒂芬·泰勒（Stephen Thaler）并不同意。他用自己发明的AI程序DABUS制作了一款塑料食品容器和一款闪烁的信标灯，从2018年开始向全球很多国家申请专利。截至目前，除了南非，其他国家均对泰勒的版权申请予以否决，理由是：机器人不具备“发明人”地位。

泰勒认为，版权法没有理由将作者限制为自然人，不应将专利所有者限制为人类。他还称，AI正被用于医学、能源等领域的创新，拒绝AI生成作品专利认证会削弱专利系统的能力，且不利于推动创新和技术进步。

基于现有的法律边界，由AIGC引发的争议和诉讼将会越来越多。

斯坦福法学院教授Mark Lemley和Bryan Casey提出，AI训练所使用的是版权作品中的思想、事实和功能要素，但这些要素并不受版权法保护，因此应该允许AI公司爬取学习这些不受版权保护的内容，实现所谓的“合理学习”。

但是，在推行“合理学习 ”的提议之前，人工智能算法“黑箱”带来的信息不透明的问题亟待解决。如果版权持有者无法获得个人作品如何被AI平台使用的信息，他们难免会假设最坏的情况。

为了规避内容版权风险，AI初创公司ServiceNow Research和HuggingFace创建的AI训练数据集“The Stack”，只包含开源许可要求宽松的代码等安全数据，并为开发人员提供了简单方便的数据删除机制，但目前使用这种方法的公司并不多。

去年10月，付费图库网站Shutterstock宣布与OpenAI建立长期合作关系，同时宣布启动“贡献者基金”计划，当创作者上传到Shutterstock的作品被用于训练AI模型时，Shutterstock会补偿给创作者一笔资金。艺术社区DeviantArt则在网站上提供了选项，艺术家可以选择阻止第三方以AI训练目的抓取他们的内容。

Shutterstock与OpenAI的合作方案，很容易让人联想到过去20年数字音乐版权之争最终各方握手合作的场景。

4月18日，社交新闻网站Reddit发布博客表示，计划以收费模式，为需要额外功能、更高的使用限制和更广泛的使用权的第三方推出一个新的高级访问。“Reddit的数据库真的很有价值……我们不需要将所有这些价值免费提供给世界上最大的一些公司。”Reddit联合创始人兼首席执行官Steve Huffman 对媒体表示。早在2016年就有新闻报道提及openAI利用Reddit的海量新闻数据训练聊天机器人。

每一项新技术在推广之初几乎都会因没有成文法或判例法可以覆盖而面临法律挑战，但争议最终都会在立法修订、诉讼案例的丰富与利益相关方长期谈判的推进中得到解决。在本世纪初的音乐盗版争议中，因牵涉的版权持有人、中介机构和许可类型众多，音乐内容的版权问题十分棘手，但通过利益相关者的谈判及Napster案等经典判例的推动，在线音乐平台与唱片公司最终达成许可交易，实现了版权内容的合法引入。AI技术在内容版权上的纠葛，背后的技术复杂性远远高于数字音乐的使用场景。机器智慧的最终目标当然是让人类受益，但实现这个目标还有一段距离。

Tags：AIGC 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

AIGC飞向“寻常人家”，专家称解决应用落地的“最后一公里”

中新网北京1月5日电 (记者夏宾)AIGC可谓是2023年的热词之一。从GPT为代表的大模型涌现，到应用层的快速创新，接着继续向深度业务场景挺进，其服务实体经济的作用愈加明显。近日，I...【详细内容】

2024-01-05　　Search: AIGC 点击:(109)　　评论:(0)　　加入收藏

科技部发文规范 AI 使用，禁用 AIGC 直接生成申报材料

IT之家 1 月 3 日消息，科技部监督司上个月编制印发《负责任研究行为规范指引（2023）》，《指引》从研究选题与实施、数据管理、成果署名、同行评议、伦理审查、监督管理等 11 个方...【详细内容】

2024-01-04　　Search: AIGC 点击:(60)　　评论:(0)　　加入收藏

AIGC重塑基础设施，高密数据中心为何众望所归？

凯文·凯利在《必然》中认为，科技在本质上有所偏好，使得它朝往某种特定方向。毫无疑问，进入到数字经济时代，人工智能技术飞速发展与加速应用之际，这个特定方向逐渐明朗：即算...【详细内容】

2023-12-26　　Search: AIGC 点击:(49)　　评论:(0)　　加入收藏

抖音拿下首张AIGC系统软件著作权，生成式内容或受法律保护！概念股砸出“坑”

研究机构表示，2023年我国AIGC市场规模约为14.4万亿元。抖音AIGC系统软件著作权获登记批准12月20日，天眼查App显示，抖音视界有限公司“基于人工智能的内容生成系统”软件著作权...【详细内容】

2023-12-22　　Search: AIGC 点击:(112)　　评论:(0)　　加入收藏

关于“AIGC是什么意思”

当谈到AIGC时，人们可能会有不同的理解和观点。AIGC可以指代多种概念，包括人工智能全球大会、人工智能全球中心、人工智能全球竞赛等。在不同的背景下，AIGC可能代表着不同的含义...【详细内容】

2023-12-05　　Search: AIGC 点击:(85)　　评论:(0)　　加入收藏

AIGC创业公司还没盈利，微软Adobe已赚得盆满钵满

衡宇萧箫发自凹非寺量子位 | 公众号 QbitAI一出奥特曼在OpenAI“来去之间”的戏码，以回归暂告一段落。过程很抓马，吃瓜群众很激动，当然了，最开心的还得是微软。不仅因为这出...【详细内容】

2023-11-24　　Search: AIGC 点击:(81)　　评论:(0)　　加入收藏

“大模型+小应用” 京东云激发AIGC生产力

大模型全面落地下的首个11.11，AIGC掀起了新一轮智能应用潮流。数百个智能场景落地京东：京东云智能客服处理咨询超14亿次，自动为客户推荐“一键价保”等超337万次；京小智服务商家...【详细内容】

2023-11-17　　Search: AIGC 点击:(184)　　评论:(0)　　加入收藏

信息流场景下的AIGC实践

一、个性化的标题生成个性化的标题生成，指使用用户内容以及个性化的信息生成针对不同用户或者不同应用场景的标题。主要使用场景有以下三种：推荐场景：在推荐系统中，不同用户或...【详细内容】

2023-10-16　　Search: AIGC 点击:(192)　　评论:(0)　　加入收藏

AIGC浪潮“卷”至广告业，AI营销到底靠不靠谱？

今年以来，AIGC浪潮席卷各行各业，尤其是在营销领域，几乎每个月都有公司展开新动作，例如在刚刚过去的9月，蓝标发布营销行业模型，另有数家传媒类A股上市公司已陆续推出AI工具。一方面...【详细内容】

2023-10-13　　Search: AIGC 点击:(266)　　评论:(0)　　加入收藏

美图秀秀上车最新自研大模型，各类AIGC玩法可直接体验

图片来源：由无界 AI生成美图自研大模型3.0，正式发布！并且全面应用于美图旗下影像与设计产品。这是自美图大模型面世100天后的最新迭代。相较于最初版本，3.0版能够生成更加真实细...【详细内容】

2023-10-10　　Search: AIGC 点击:(166)　　评论:(0)　　加入收藏

▌简易百科推荐

行业大模型快速落地的一年，如何做？

生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看，无论是“文生文”的大语言模型，还是“文生图”的多模态模型，更多的是辅助人们进行一些简单的办公，或者提供一...【详细内容】

2024-04-10　　　　钛媒体APP　　Tags:行业大模型　点击:(3)　　评论:(0)　　加入收藏

互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

早前，一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主，向用户大力推介“所有人都需要学”的AI入门课程。不过，这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】

2024-04-10　　　　九派新闻　　Tags:AI课　点击:(7)　　评论:(0)　　加入收藏

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(3)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(3)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(4)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(6)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(3)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(5)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(6)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

推荐资讯

整治“暗箱操作” 义	网易再牵暴雪的手，实际
注意！密码、验证码都没	将他人商标设为搜索关
打破刚兑：投资者还能相	拜登坐不住了？罕见对美
黄金狂飙如何影响人民	重新审视2008年全球金