Google内部文档泄露：开源大模型太可怕了，OpenAI也顶不住！

时间：2023-05-05 11:40:15 来源：作者：码农翻身

今天看到一篇文章，说是google泄露了一份文档《我们没有护城河，AI target=_blank class=infotextkey>OpenAI也没有》，描述了某位Google员工（非Google公司）对开源AI的看法，观点很有意思，大致的意思是这样的：

ChatGPT大火以后，各大厂商都对LLM趋之若鹜，疯狂投入。

Google也在努力，希望能翻盘，但是大家都无法赢得这场军备竞赛，因为第三方正在悄悄地吃掉这个大蛋糕。

这个第三方就是开源大模型。

开源大模型已经做到了：

1. 在Pixel 6上以每秒5个token的速度运行基础的模型。

2. 一个晚上就可以在个人电脑上微调个性化的AI：

虽然OpenAI和Google的模型在质量上有优势，但是差距正以惊人的速度在缩小：

开源模型更快，可定制，更私密，功能更强。

开源大模型用100美元和13B的参数做事情，几周内搞定；而Google 在1000万美元和540B的参数下，在几个月内苦苦挣扎。

当免费的，不受限制的替代品在质量上和封闭的模型有一拼的时候，人们肯定会抛弃封闭的模型。

这一切都从Facebook开源LLaMA开始，3月初，开源社区得到了这个真正有能力的基础模型，虽然没有instruction ，conversation tuning，没有RLHF，社区立刻就意识到了这个东西的重要性。

随后的创新简直是疯狂的，甚至以天为单位：

2-24 ：Facebook 推出LLaMA，此时仅授权给研究机构，政府组织使用

3-03 ：LLaMA在互联网上泄露，虽然不允许商用，但是突然之间，任何人都可以玩了。

3-12 ：在Raspberry Pi上运行LLaMA，速度很慢，不实用

3-13：斯坦福发布了Alpaca，为LLaMA增加了instruction tuning，更“吓人”的是，斯坦福的Eric J. Wang 使用一块RTX 4090 显卡，只用5 个小时就训练了一个和Alpaca 水平相当的模型，将这类模型对算力的需求降到了消费级。

3-18：5天以后，Georgi Gerganov使用4位quantization技术在macBook CPU 上运行 LLaMA，它是第一个“无 GPU”解决方案。

3-19：仅仅过了一天，加州大学伯克利分校、CMU、斯坦福大学、加州大学圣地亚哥分校的研究人员联合推出Vicuna，号称达到了 OpenAI ChatGPT 和 Google Bard 90% 以上的质量，同时在超过 90% 的情况下优于 LLaMA 和 Stanford Alpaca 等其他模型。

3-25：Nomic 创建了GPT4all，它既是模型，又是一个生态系统，我们第一次看到多个模型聚集在一个地方

......

仅仅在一个月的时间内，instruction tuning、quantization、quality improvements、human evals、multimodality、RLHF等都出现了。

更重要的是，开源社区解决了可扩展的问题，训练的门槛从大公司降低到了一个人，一个晚上和一台功能强大的个人电脑。

所以作者在最后说：OpenAI也和我们一样犯了错，也顶不住开源的冲击。我们要建立生态系统，让开源为Google工作。

Google已经在Android和Chrome上应用了这种范式，并且获得了巨大的成功。应该让自己成为大模型开源的领导者，继续巩固自己作为思想领袖和引领者的地位。

说实话，这一个多月来大语言模型的发展真是让人眼花缭乱，目不暇接，每天都处于被轰炸状态。

这让我想起了早些年互联网刚起步的时候，今天冒出一个激动人心的网站，明天又冒出一个。还有移动互联网爆发的时候，今天一个App火了，明天另外一个app又火了......

从我个人来讲，我也不希望这些大语言模型被控制在巨头手中，我们只能“寄生”在这些巨头模型上，调用一下它的API，开发一点儿应用，这是很不爽的。最好是百花齐放，平民化，让大家都能建立自己私有的模型。

现在训练的成本小公司应该可以承受了，如果程序员有这个训练的能力，结合下特定的行业和领域，也许是不错的机会。

程序员要想熟练掌握私有化大模型，除了原理之外，还是得自己动手练，我们星球也有几十个人在组队练习，虽然开源社区极大地降低了成本，但是要想训练出一个有用的模型，这玩意儿对硬件环境要求还是太高，显卡很贵，RTX4090怎么着也得上万，肉疼，去云端租一个GPU训练价格更是不可控，训练失败，钱就白白扔掉了，这不像学习一门语言或者框架，下载几个安装包就搞定，几乎是零成本。

希望门槛进一步降低吧！

Tags：开源大模型点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

开源大模型正在“杀死”闭源？

文丨郝鑫编丨刘雨琦“OpenAI不足为惧，开源会慢慢赶上来。”彼时Hugging Face创始人Clem Delangue的一句预言，正在迅速成为现实。ChatGPT横空出世7个多月后，7月19日，Llama 2宣布...【详细内容】

2023-10-07　　Search: 开源大模型点击:(392)　　评论:(0)　　加入收藏

开源大模型LLaMA 2会扮演类似Android的角色么？

图片来源@视觉中国文 | 李智勇在AI大模型没有商业模式？等文章中，我多次表达过这样一个观点：不要把大模型的未来应用方式比喻成公有云，大模型最终会是云端操作系统的核心（新通用计...【详细内容】

2023-07-22　　Search: 开源大模型点击:(189)　　评论:(0)　　加入收藏

开源大模型新SOTA！支持免费商用，比LLaMA65B小但更强

丰色发自凹非寺量子位 | 公众号 QbitAI 号称“史上最强的开源大语言模型”出现了。它叫Falcon（猎鹰），参数400亿，在1万亿高质量token上进行了训练。最终性能超越650亿的LLaM...【详细内容】

2023-05-29　　Search: 开源大模型点击:(78)　　评论:(0)　　加入收藏

Google内部文档泄露：开源大模型太可怕了，OpenAI也顶不住！

今天看到一篇文章，说是Google泄露了一份文档《我们没有护城河，OpenAI也没有》，描述了某位Google员工（非Google公司）对开源AI的看法，观点很有意思，大致的意思是这样的：ChatGPT大火以...【详细内容】

2023-05-05　　Search: 开源大模型点击:(437)　　评论:(0)　　加入收藏

▌简易百科推荐

行业大模型快速落地的一年，如何做？

生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看，无论是“文生文”的大语言模型，还是“文生图”的多模态模型，更多的是辅助人们进行一些简单的办公，或者提供一...【详细内容】

2024-04-10　　　　钛媒体APP　　Tags:行业大模型　点击:(3)　　评论:(0)　　加入收藏

互联网充斥“针对小白的AI课”，能相信吗？普通人不学AI课程会被淘汰？

早前，一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主，向用户大力推介“所有人都需要学”的AI入门课程。不过，这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】

2024-04-10　　　　九派新闻　　Tags:AI课　点击:(7)　　评论:(0)　　加入收藏

藏在AI背后的“吃电狂魔”

人工智能时代的能耗黑洞据估算，到2027年，人工智能行业每年将消耗85~134太瓦时的电力，相当于瑞典或荷兰一年的总用电量。马斯克判断，电力缺口最早可能会在2025年发生，“明年你会看...【详细内容】

2024-04-09　　　　雪豹财经社　　Tags:AI 　点击:(3)　　评论:(0)　　加入收藏

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　小编也疯狂　　新浪网　　Tags:AI 　点击:(3)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　　　财联社　　Tags:AI产业　点击:(4)　　评论:(0)　　加入收藏

和“数字人”交朋友，当心隐私被出卖......

在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验？如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点？《中国消费者报》记者就此展开了调查APP里有个...【详细内容】

2024-04-09　　　　中国消费者报　　Tags:数字人　点击:(6)　　评论:(0)　　加入收藏

AI“复活”成产业链：成本可降至数百元

大模型应用落地，带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳实习生孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前，预估会有需求的庞立...【详细内容】

2024-04-09　　　　中国企业家　　Tags:AI“复活” 　点击:(3)　　评论:(0)　　加入收藏

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(5)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(6)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(8)　　评论:(0)　　加入收藏

推荐资讯

一篇文章教会你使用Py	聊聊Rust里面的数据类
C++中的外部模板及其	一篇文章带你了解Pyth
网络安全行业的春天何	Linux获取Redis 性能
Redis与缓存一致性问	10余所高校公布强基计