大模型打响开闭源之战

时间：2023-07-22 18:44:22 来源：钛媒体APP 作者：

图片来源@视觉中国

文 | 科技新知

大模型的开、闭源之战，开始得比想象中早上一些。

7月18日，Facebook母公司Meta表示，将发布其开源大模型Llama的商用版本，为初创企业和其他企业提供了一个强大的免费选择，以取代AI target=_blank class=infotextkey>OpenAI和谷歌出售的昂贵的专有模型。同时宣布，Llama将由微软通过其Azure云服务分发，并将在windows操作系统上运行，并称微软是“我们的首选合作伙伴”。

一时间，有不少分析人士认为，Llama将改变AIGC的产业格局。Meta 副总裁、人工智能部门负责人杨立昆也赶来站台，“Llama 2 将改变大语言模型市场的格局。”事实真的如此没有悬念吗？

开源（Open Source），即开放源代码，最早起源于20世纪50、60年代的美国。早期开发互联网技术和电信网络协议时，研究人员需要进行开放式的协作环境。而1968年Inte.NET的先驱阿帕网（ARPANET）的建立，成为了对开放源代码可行性展示的标志。到了1985年，自由软件运动领袖理查德·斯托曼（Richard Stallman），看到以专利软件为手段的商业化逐渐取代实验室中免费可自由流通的软件后，发表了著名的GNU宣言，开启了开源运动，最终导致了免费的linux操作系统的诞生。

自ChatGPT爆火以来，将其开源的呼声未曾断绝。可就在ChatGPT2发布之后，OpenAI选择了闭源发展。这也未必完全出于规避竞争的考量，就算某天OpenAI真的完全open了，其他同行也不能简单复制其成功的路径。

因为ChatGPT能够引发“iphone时刻”的原因在于，强大的生成能力给予了人们不一样的场景体验。但这背后依赖OpenAI很长一段时间内在算力、算法和数据方面的积累。实际上，在这场全球大模型军备赛中，有关开源发展和闭源深耕的争论将继续下去不止不休。

开源or闭源

历史的车轮总会重复碾过，在互联网发展史上，有关开源和闭源的战争一直都在上演。

除了上文理查德·斯托曼的GNU宣言，打响对闭源的第一枪外，随后的PC时代有关开闭源的争论也没停过。

PC刚兴起之时，微软内部的研发团队通过闭源开发Windows操作系统，并开发配套的应用软件如office等，并在生态建设方面组局Inter形成 Wintel 联盟，成功抢占了PC市场。而Linux在那个时期，则属于自发的“民间组织”，由全球开发者共同参与建设，通过开源与微软形成了一定的竞争。

到了移动互联网时代，谷歌的Android和苹果的IOS开闭源之争，也是各自走出了不同的路径。基于Android的开放，诞生了一大批的定制化手机操作系统，比如国内小米的MIUI、OPPO的ColorOS等，就连车机端的比亚迪车机系统都是基于Android开发而来。当然，就商业成功的角度来看，微软和苹果的阵地一定时期内更加牢靠。

在SaaS的发展史上，软件的开源也与上同理。中科院院士、CCF开源发展委员会主任王怀民教授关于开闭源认为，在一个确定发展方向的时代中，闭源公司的推进效果是明显的，竞争力也是极强的。“但当一个不确定性的互联网时代到来时，开源吸引了全球开发者参与其中的可能，使得后来的服务器操作系统、云操作系统、手机操作系统、物联网操作系统都是以开源的Linux为基础。”

国外有ChatGPT与Llama之争，国内的大模型厂商也各有千秋。

如阿里云、智谱和清华EKG、百川智能等，选择了开源。阿里云公布1+4开源战略，推出大模型方向的开源新势力魔搭GPT。阿里巴巴达摩院高级算法工程师李晨亮，曾对外表示，“开源生态肯定是有助于大模型的繁荣。”反之，华为的盘古大模型就选择了闭源，也是为了其数据隐私和商业收益的考虑。

价优者胜？

大模型开源之后，会吸引更多的人才参与进入，加快技术进步，但想要实现突破，还需要从底层理解模型框架和算法基本原理。众所周知，人工智能三要素是：算力、算法和数据。开源只是处于算法阶段，之后还需要对其进行大量的算力支持和数据训练，这背后的成本就相当高昂。

以OpenAI为例：业内人士表示，大模型训练和运行将耗费巨大的算力资源和数据，仅是在 2022 年，OpenAI 总计花费就达到了 5.4 亿美元，与之形成鲜明对比的，则是其产生的收入只有 2800 万美元。

有行业消息透露，一家上市公司的人工智能部门打算用OpenAI的GPT-3.5开发功能，但迫于成本和定制开发以及不支持同一时间响应大量用户请求的原因，选择了参数量更小的Llama和一个国内公司的开源大模型，在后期的训练和部署的成本也会更低。

“开源模式的任何渐进式改进都在蚕食闭源模式的市场份额，因为你可以以更低的成本运行它们，而且依赖性更小。” 软件开发平台Replit的首席执行官Amjad Masad表示。

开源也能让其他新加入者更快适应AI产业。比如在谷歌泄漏的文件中就提到：几乎任何人都能按照自己的想法实现模型微调，到时候一天之内的训练周期将成为常态。以这样的速度，微调的累积效应将很快帮助小模型克服体量上的劣势。

更多的人进来使用，就会产生更多的数据。这些互联网原生内容的常态化训练，远比一家公司仅凭一己之力去做数据的采集和标注要简单得多。

共享出Llama的Meta 表示，收集的数据代表着根据经验采样的人类偏好，由人类标注员选择自己更喜欢两条模型输出中的哪一条。人类给出的反馈意见随后将用于训练奖励模型，该模型会不断学习人类标注员的偏好模式，再据此自动执行偏好决策。

开源的好处显而易见，闭源的道理也逻辑扎实。

元创资本的研究显示，相较于开源来说，闭源模型相对成熟、数据质量更有保障，同时也省去了部署的麻烦，费用相对较低，仅需支付token的费用。

当然最重要的是，对于厂商来说，闭源还有着商业的考量。根据权威杂志《Fast Company》预测，OpenAI 2023年的收入将达到2亿美元，包括提供API数据接口服务、聊天机器人订阅服务费等。

对垒刚开始

上个月，猎豹移动CEO傅盛与投资人朱啸虎的口水战引发热议。核心冲突就在于行业对于大模型的价值思考，在于大模型能不能解决问题。

如今，以OpenAI为代表的大公司、强算力、强算法，共同砌成了一道普通创业者和开发人员难以突破的围墙，以至于当市场上出现其他类似开源的应用时，人们都认为是大模型行业的垄断要被打破了。

实际上，自OpenAI推出ChatGPT引发全球跟风以来，英伟达的股价便迎来了暴涨，主要源于厂商对算力芯片的强烈需求。换句话说，即使开源了人人都有大模型，那算力、算法和数据训练的工作还是需要有人来做。并且开源也仅仅相当于开放了设计图纸，你可以在图纸上进行调优，但并不代表就能完整造出一幢建筑。

就比如一些大模型产品刚上线时，经常出现语义理解不准确，产出结果令人啼笑皆非的现象。背后原因就是对高质量数据的筛选和训练得过少，导致数据的准确性直接影响人工智能的产出结果。

但训练数据并不是一时的，涉及到数据的采集、清洗、标注的另一条产业链。在过去的很长一段时间内，这个环节都是由专门的数据处理公司来做，也就是说，需要进行长期的人力投入。

有业内的数据优化工程师表达了类似看法，大模型本身的泛化能力仍受限于数据。如果说ChatGPT要替代某个职业或岗位的话，最简单的一个判定标准即是，是否具备数量足够多、质量非常好的数据。同理，想要通过开源去打破垄断的模型，还需要对数据进行足够的优化，对基础设施的投入足够得多。

大模型的开闭源之争，终究不会是靠某一个或几个产品的出现而终结，更多的还要顶尖人才参与、技术迭代和资金支持。想要打破垄断，还需要考虑时间的因素以及对高质量数据的筛选。

开或闭，从来不是最根本的问题，产品体验与市场需求的匹配，才是起决定作用的胜负手

Tags：点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

AI是万灵药？Meta要把大模型塞进AR眼镜里

寻找下一块“屏幕”，这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网，智能手机让移动互联网无处不在之后，这前后两次造富神话的出现，也让所有人都在期待下...【详细内容】

2024-04-09　　Search: 点击:(2)　　评论:(0)　　加入收藏

考研调剂第一次失败后，考生还能继续调剂吗

考研调剂失败后，考生仍然有机会继续调剂。如果考生在第一次调剂过程中没有收到复试通知，可以在时间允许的情况下继续申请其他院校的调剂，并参加复试。考生需要密切关注各高校的...【详细内容】

2024-04-09　　Search: 点击:(2)　　评论:(0)　　加入收藏

高职单招是什么意思？

高职单招是什么意思？2024高考：高职单招和高考的区别在哪里？...【详细内容】

2024-04-09　　Search: 点击:(3)　　评论:(0)　　加入收藏

在饭局上喝酒，要学会3句“万能开场白”，让大家对你刮目相看

在饭局上喝酒，是一个社交场合的重要环节。作为一个有见识的人，学会几句“万能开场白”不仅能活跃气氛，还能让人们对你刮目相看。以下就是三个可以用于各种场合的万能开场白，希望...【详细内容】

2024-04-09　　Search: 点击:(2)　　评论:(0)　　加入收藏

汽车不停能开多少公里？老司机：别超过极限，否则伤车又伤人！

在如今这个汽车普及的时代，私家车已经成为了不少家庭的必备品。它不仅代表着一种出行的便利，更是生活品质的提升。然而，正如一枚硬币的两面，私家车的广泛使用也带来了一系列问题...【详细内容】

2024-04-09　　Search: 点击:(2)　　评论:(0)　　加入收藏

三证齐全，中国“飞的”不远了？

【环球时报记者丁雅栀李炫旻环球时报驻英国、德国特约记者纪双城青木】4月7日，中国民用航空局在广州为亿航智能EH216-S无人驾驶载人航空器系统颁发生产许可证，加上去年取...【详细内容】

2024-04-09　　Search: 点击:(3)　　评论:(0)　　加入收藏

小米SU7被大卸八块，雷军回应了

4月8日晚国内有一场汽车发布会，然后出现了令人不可思议的一幕。他们把小米SU7当为标杆进行对比，但却把小米SU7的参数给标错了。随后小米官方连发三条信息进行强硬回应，最后的结...【详细内容】

2024-04-09　　Search: 点击:(2)　　评论:(0)　　加入收藏

视频号，从抖音挖来一个“一姐”？

文｜王亚琪编辑｜斯问“你说你要尊严，一个月5000块钱的合同工资，能体现你的尊严吗？”“我那么多的人脉和资源，你如果够聪明的话，你踩着我肩膀往上爬不是更快吗？你拿着我每个月收来的房...【详细内容】

2024-04-09　　Search: 点击:(2)　　评论:(0)　　加入收藏

0首付、0利息！多家车企跟进“车贷新政”，但背后还有“隐性”要求

“您是全款购车，还是贷款购车。”4月7日，《每日经济新闻》记者进入北京某吉利银河4S店后被销售人员如此询问。“如果您选择贷款购车，现在很划算，可以有多种分期方案可选。比如，至...【详细内容】

2024-04-09　　Search: 点击:(2)　　评论:(0)　　加入收藏

真正0首付、0利息来了！“车贷新政”后，多家车企放大招，甚至出现高达3万元金融贴息

每经记者：段思瑶每经编辑：王月龙,裴健如“您是全款购车，还是贷款购车。”4月7日，《每日经济新闻》记者进入北京某吉利银河4S店后被销售人员如此询问。“如果您选择贷款购车，现在...【详细内容】

2024-04-09　　Search: 点击:(1)　　评论:(0)　　加入收藏

▌简易百科推荐

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(1)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(1)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(2)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(2)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(4)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(5)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

第一批用 Kimi 做内容的网红已经杀疯了

作者：王东东文章来自：斗战圣佛小组技术信仰派 VS 市场信仰派朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是：大模型有没有戏。技术派...【详细内容】

2024-04-04　　　　斗战圣佛小组　　Tags:Kimi 　点击:(4)　　评论:(0)　　加入收藏

昆仑万维发布面向人工智能时代的六条人才宣言

过去的一年多，是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里，我们见证了人工智能的快速发展和广泛的影响，人工智能已经迅速地融入了我们的生活，深刻...【详细内容】

2024-04-03　　　　砍柴网　　Tags:昆仑万维　点击:(7)　　评论:(0)　　加入收藏

推荐资讯

AI是万灵药？Meta要把大	考研调剂第一次失败后
高职单招是什么意思？	在饭局上喝酒，要学会3
汽车不停能开多少公里	三证齐全，中国“飞的”
小米SU7被大卸八块，雷	视频号，从抖音挖来一个