您当前的位置:首页 > 电脑百科 > 人工智能

再让AI大厂这么“偷”下去,咱可能就看不到免费的网站了。。。

时间:2023-07-12 14:39:37  来源:  作者:差评

几天前,谷歌突然更新了隐私政策,明确表示要用网上所有的公开数据,来训练自家的 AI 模型。

也就是说,根据新政策,你在网上公开发布的任何信息都有可能被谷歌抓取,包括但不限于你发的帖子、搜索的关键词以及看过的视频。

这不妥妥互联网裸奔吗!

OpenAI 前脚刚被起诉数据侵权还没多久,谷歌就马上着急来撞枪口。

在这个节骨眼上整这么一出,大概率跟数据收费脱不了关系, 谷歌再不薅这波免费的羊毛,之后很有可能就薅不到咯。

这事儿啊,自打 ChatGPT 爆火后再也没消停过。

世超先给大家伙儿捋捋时间线。

今年 3 月的时候呢,马斯克带头打响了数据收费第一枪,宣称推特的 API 接口不再免费了。

紧接着, 美版贴吧 Reddit 也按耐不住了。

上个月 Reddit 闹得沸沸扬扬的 “ 停电 ” 运动,就是为了抗议官方的 API 收费政策。

之前世超写这事儿的时候还在猜测, Reddit 官方最后会不会作出让步。

从现在的后续看来,大多第三方软件已经确认关停, Reddit 是铁了心要数据收费。

再到这段时间,推特又整了限流的幺蛾子,没有花钱认证的帐号每天就只能阅读 600 条贴文,目的呢也是为了防止机器人抓取用户数据。

难道数据就这么值钱吗?

世超觉着啊,还是 AI 的锅。

AI 大模型要想变得更聪明,就需要源源不断的数据去 “ 喂养 ” 。

现在能做大模型的,要不就是自己家有数据,像百度、阿里和腾讯;要不就是爬人家的数据,这里点名 OpenAI 。

因为很多网站都开放有免费的 API 接口,才给了微软、 OpenAI 这些巨头可乘之机。

但今时不同往日, AI 在重新赋予数据价值以后,有筹码在手上的平台当然 不乐意被白嫖了。

甚至于 Reddit 的 CEO 霍夫曼都把话搬上明面儿了:就是不想免费提供数据给巨头们。

所以, OpenAI 被起诉估计也是平台们联合起来想要 “ 杀鸡儆猴 ”, 治一治 AI 的这股歪风邪气。

不过,法律这次会不会站在 OpenAI 这边,还真不好说。

因为数据版权涉及到 3 个关键的问题:

1.数据爬虫的行为本身是否是合法的?

2.数据是否受到版权的保护?

3.用数据生成的作品是否受到版权保护?

首先第一个问题,要获取数据,无非就是付费购买,或者收集网上公开的数据。

但需要注意的是, 公开的数据并不能等同于授权使用,而且还要看网站是不是有相关的条款对数据爬虫行为做出了限制。

要是直接越过版权方的同意,或者绕过了网站限制强行获取数据,那就是妥妥的非法获取计算机信息系统数据罪。

即使 OpenAI 声称爬的是公开网站的数据,数据爬虫行为本身是否合法,还要看版权方是不是给了授权。

其次,关于 数据本身是否受到版权保护

根据美国的版权法,如果 AI 模型训练所用的数据符合 “ 合理使用 ” 的范围,那就不会构成侵权。

但问题就出在这 “ 合理使用” 上。

“ 合理使用 ” 的构成要件包括是否涉及商用、作品本身是否受版权法保护、所使用部分的数量以及使用之后对作品本身造成的影响这四个标准。

像什么新闻报道、学术研究,适当引用是完全 ok 的。

可 AI 模型上亿万级别的数据使用量、已经商业化的 AI 软件,还能算作 “ 合理使用 ” 吗?

最后,就是 AI 生成作品的版权问题

因为训练数据版权理不清, AI 生成的内容自然也会存在版权争议。前几天, Steam 还下架了一款使用了 AIGC 生成的游戏,理由就是版权有问题。

咱就拿 AI 绘画举例子,图像生成相当于一个拆分又重组的过程,虽然最后的结果是完全 “ 新 ” 的,但仍然会保留训练图像的某些特征。

但这种情况到底算不算侵权,各国的说法现在也是众说纷纭。

因为训练数据是人家的,美国版权局认定 AI 生成的作品不受版权法保护,甚至还可能侵犯著作权。

而日本政府的态度则截然不同,表示日本法律不保护 AI 训练所用数据的版权。

至少在现行的法律框架下,上面这些问题很难得到一个统一的答案。

既然监管不给力,那版权方就只有提刀自己干了,该收费的收费,该追偿的也赶紧追偿。

▼OpenAI 被起诉的文件

可以预见,在推特和 Reddit 之后,可能还会有更多的内容版权方竖起高墙。

这事儿呢,对于平台来说,当然是个挣钱的新路子,科技巨头再不济也就是多砸点儿钱。

但对于整个互联网来说,可算不上一件好事儿。

当年,互联网就是带着开放共享的基因出生的,像什么维基百科、推特,之前常年免费提供 API 接口,开发者调用数据很方便。

但现在如果让数据收费这么一搞,结果会怎么样还真不好说。

毕竟,小开发者没有支付巨额数据费的能力,如果创新只在巨头里发生,这不就是纯纯搞垄断了?

最主要的是,可能很多现在免费能看到的网站之后就要花钱才能看了,这才是对咱们这种普通用户的真实暴击。

其实吧,数据收费这事儿也不能全怪平台,实在是让 AI 巨头给 “ 抢 ” 怕了,算是一种自保的无奈之举。

虽然这次谷歌有“隐私政策”护体,但结果如何还真不好说。

所以,关键还要是看监管的大锤什么时候能落下。

厘清数据版权,是 AI 要发展始终绕不过去的一道坎儿,而现在,似乎也同样关乎着互联网的未来走向。

不知道 AI 这艘船,会将我们推向一个更开放,还是更封闭的时代?

撰文:糖醋排骨 编辑:江江&面线 封面:焕妍

图片、资料来源

推特、谷歌

金杜律师事务所, CHATGPT 许可应用,知识产权和数据怎么看?

21 世纪经济报道, AIGC 爆火之后:如何平衡数据流动共享与安全保护?

链科天下, OpenAI 遭集体诉讼,明星大模型变 “ 数据小偷 ” ?

知乎, AI 数据合规系列文章( 二 )——数据获取的合规风险

己任律师事务所,浅析数据爬取行为的刑事风险及防范思路



Tags:AI   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI是万灵药?Meta要把大模型塞进AR眼镜里
寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下...【详细内容】
2024-04-09  Search: AI  点击:(2)  评论:(0)  加入收藏
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09  Search: AI  点击:(1)  评论:(0)  加入收藏
AI+数字人成为市场关注焦点,大屏AI数字人助力展厅设计创意升级
随着各行业产业的数字化转型加速,人工智能时代的到来,展馆展厅行业也步入数字时代,各式的展馆展厅设计在融合了全息投影、虚拟现实、数字沙盘、互动投影、互动桌面等多种技术后...【详细内容】
2024-04-09  Search: AI  点击:(1)  评论:(0)  加入收藏
聚焦AI自动驾驶 热闹背后的三个灵魂拷问
2024年,如果还有人没听说过人工智能,那恐怕就不是一句OUT能够形容的了。Artificial Intelligence简称AI,已经是老少皆知、无远弗届的存在。从美国瑰丽七股(Magnificent Seven)、...【详细内容】
2024-04-09  Search: AI  点击:(3)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  Search: AI  点击:(1)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09  Search: AI  点击:(1)  评论:(0)  加入收藏
搜索引擎大变局:向左AI,向右收费
自ChatGPT面世以来,它是否会取代谷歌的讨论就未曾止歇。近日,知情人士透露,谷歌正考虑对生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务史上最大的变革,传统搜索引擎公...【详细内容】
2024-04-09  Search: AI  点击:(2)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09  Search: AI  点击:(2)  评论:(0)  加入收藏
手机还装不下AI的梦想
■AI手机为什么这么火?■手机是AI的重要载体?■苹果为什么也下场了?作者|武占国来源|市值榜2024年,对于手机行业,必然是混战的一年。普遍认为,AI手机是继功能机、智能机之后,手机行业...【详细内容】
2024-04-09  Search: AI  点击:(3)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08  Search: AI  点击:(7)  评论:(0)  加入收藏
▌简易百科推荐
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(1)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(1)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(1)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(2)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(2)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(5)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条