懂图片的GPT-4来了国内AI企业如何接招？

时间：2023-03-16 11:10:27 来源：每日经济新闻作者：

每经特约评论员盘和林

3月15日，AI target=_blank class=infotextkey>OpenAI发布了GPT-4，并迅速成为热点，引发大量关注。GPT-4核心提升可总结为两点：一点是基本智能水平提升。举例说，GPT3.0在全球多项考试中排名在倒数10%，而如今GPT-4在这些考试中能够战胜90%的人类，这种进步源自于数据训练和参数的积累。另一点是多模态模型，ChatGPT过去只能文本交流，现在用户可以发张图片给ChatGPT，而ChatGPT将以文字回应。另外，GPT-4的参数量是GPT3.0的10倍，参数达到百万亿级别，这为GPT-4的用户体验优化提供了保障。

识图能力应用前景广阔

之前上市的ChatGPT实质上等同于GPT3.5，未来，GPT-4的功能将以plus订阅的方式开展。新版本激发了用户热情，付款订阅渠道一度被挤爆。但实际上OpenAI在技术上仍有保留，外界不禁感慨：OpenAI到底领先对手几个身位？

之所以说OpenAI保守，主要是两个原因：

其一是ChatGPT在去年底推出的时候本身是旧版本，很多人发现ChatGPT无法回答2021年以后的问题，原因是ChatGPT2021年就发布了GPT3.0，而ChatGPT只是在GPT3.0的基础上略作优化的GPT3.5版本，而2021年以后新数据都去训练GPT-4，当然就无法覆盖这部分新知识。而GPT-4其实在2022年年中就基本完成，足见ChatGPT的发布是一个保守做法。

其二是GPT-4也是有保留的。原因是OpenAI有另一个热点AI产品，也就是DELL-E2。DELL-E2的功能是你输入一段文字，它生成一张图片。而GPT-4的功能是，你输入一张图片，它生成一段文字答案。如果两项AI功能结合，GPT将同时获得图片理解能力和图片表达能力。可以说NLP自然语言处理只是OpenAI在人工智能领域的一块业务，未来整合旗下的多个AI，功能内容还将进一步丰富。

当前GPT-4的识图能力应用前景也非常广阔。比方说医学影像资料本身是图片，未来普通人可以通过ChatGPT来实现医学影像自检，自己发现疾病。当然，这只是其中一项可能性。在很多行业领域，看懂图片是需要专业能力的，而GPT-4降低了这种识图门槛，比如医学影像、设计图纸、数学模型等，让普通人能够通过AI辅助介入到专业领域当中，所以GPT-4未来很可能成长为生产力工具。

国内企业要“结硬寨”

中国大模型生成式AI企业怎么办？

首先，国内生成式AI企业要走积累的路子。生成式AI需要持续大规模算力投入，微软为GPT提供超过3万张A100芯片的算力支持，一张A100价格要20多万元人民币，而算力训练每次都要消耗大量能源。GPT-4百万亿的参数也需要投入大量人力财力来完成积累。而在数据方面投入的价值也很高，GPT从一开始就重视“小数据”，也就是高质量数据，而高质量数据是GPT领先于其他生成式AI的核心竞争力。与之相对应的，数据质量提升是需要钱的。综上可以看出，算力、数据、算法调参这三个方面，OpenAI前期烧钱的规模是海量的，而GPT-4也是一步步技术积累的最终结果。所谓台上一分钟，台下十年功，一点也不夸张。

其次，国内生成式AI企业要在基础科学上做积累。大模型算法的道理并不复杂，复杂的是算法细节，自从微软收购OpenAI后，OpenAI的算法不可能开源，所以“等、靠、要”的做法已经行不通，国内AI企业要在算法技术上投入研发，构建中国AI企业自身的算法能力，然而算法的精益也要依靠基础科学的进步，比如基础数学研究。所以要积极在学术上加强投入，而不应该仅仅聚焦在应用科学层面。

再者，国内生成式AI企业不要盲目地推出对标产品。前车之鉴就是谷歌，在OpenAI推出产品后，谷歌匆忙应战，结果发布会的若干个小瑕疵导致谷歌股价暴跌。国内生成式AI企业要清楚认识到，这一次ChatGPT的成功和过去其他概念有所不同，其成功基础在于用户的认可，用户是会拿着ChatGPT和其他竞品比较的，这就让后来者实际上更难做，要求也更高。如果生成式AI方面没有达到ChatGPT的效果，则往往会暴露自己能力上的短板。反过来说，国内生成式AI企业也可以另辟蹊径，GPT-4并不是万能的，在其短板领域完全可有一番作为。

综上，国内AI企业还是要重视积累，包括参数积累、数据训练积累以及算力积累。科技的道路，弯道超车的机会有，但不多，诸如新能源车我国就实现了弯道超车，但大多数科技领域开展的是阵地战，要尝试“结硬寨，打呆仗”的做法，夯实中国生成式AI发展的基础，推出成熟度较高的产品。

(作者系浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员，工信部信息通信经济专家委员会委员）

Tags：GPT-4 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

IT之家 4 月 7 日消息，本周早些时候，《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天，《纽约时报》详细介绍了 AI 公司处理此问题的一些方法，其中涉及到...【详细内容】

2024-04-07　　Search: GPT-4 点击:(7)　　评论:(0)　　加入收藏

微软AI程序员登场，10倍AI工程师真来了？996自主生成代码，性能超GPT-4 30%

新智元报道编辑：桃子润【新智元导读】全球首个AI程序员Devin诞生之后，让码农纷纷恐慌。没想到，微软同时也整出了一个AI程序员——AutoDev，能够自主生成、执行代码等...【详细内容】

2024-03-18　　Search: GPT-4 点击:(17)　　评论:(0)　　加入收藏

前端不存在了？盲测64%的人更喜欢GPT-4V的设计，杨笛一等团队新作

3 月 9 日央视的一档节目上，百度创始人、董事长兼 CEO 李彦宏指出，以后不会存在「程序员」这种职业了，因为只要会说话，人人都会具备程序员的能力。「未来的编程语言只会剩下两种...【详细内容】

2024-03-11　　Search: GPT-4 点击:(9)　　评论:(0)　　加入收藏

多模态大模型，阿里通义千问能和GPT-4V掰手腕了

通义千问的图像推理能力，最近有了大幅提升。2024 年，大模型领域要卷什么？如果没有思路的话，不妨看看各家大厂都在押注什么方向。最近一段时间，先是 OpenAI 推出 GPT-4V，让大模型...【详细内容】

2024-01-29　　Search: GPT-4 点击:(76)　　评论:(0)　　加入收藏

微软Copilot Pro来了：个人用户也能在Word里用GPT-4，20美元/月

面向个人用户的微软Copilot会员版来了。一个月多交20刀（约合人民币142元），Microsoft 365个人版/家庭版用户就能在Word、Excel、PPT等Office全家桶中用上GPT-4。就像这样，不用在C...【详细内容】

2024-01-16　　Search: GPT-4 点击:(90)　　评论:(0)　　加入收藏

“GPT-4变傻”不只是OpenAI的苦恼，所有大模型与人类交往越久就会越蠢？

　许多大模型在处理早期数据时展现出的优异表现，实际上是受到了‘任务污染’的影响，回答问题全靠记，而非纯粹基于学习理解能力。　　ChatGPT发布一年多，已经在全世界...【详细内容】

2024-01-05　　Search: GPT-4 点击:(48)　　评论:(0)　　加入收藏

GPT-4V开源平替！清华浙大领衔，LLaVA等开源视觉模型大爆发

新智元报道编辑：Aeneas【新智元导读】GPT-4V的开源替代方案来了！极低成本，性能却类似，清华、浙大等中国顶尖学府，为我们提供了性能优异的GPT-4V开源平替。如今，GPT-4 Vision在语言...【详细内容】

2024-01-03　　Search: GPT-4 点击:(53)　　评论:(0)　　加入收藏

谷歌Gemini扳回一局！多模态能力和GPT-4V不分伯仲｜港中文128页全面测评报告

量子位 | 公众号 QbitAI谷歌扳回一局！在Gemini开放API不到一周的时间，港中文等机构就完成评测，联合发布了多达128页的报告，结果显示：在37个视觉理解任务上，Gemini-Pro表现出了和GP...【详细内容】

2023-12-22　　Search: GPT-4 点击:(120)　　评论:(0)　　加入收藏

GPT-4V 都搞不明白的未来推理有解法了！来自华科大 & 上科大

多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当前最强大的 GPT-4V（如下图所示），也无法很好地解决...【详细内容】

2023-12-18　　Search: GPT-4 点击:(58)　　评论:(0)　　加入收藏

OpenAI 宣布修复GPT-4变懒问题，将在离线评估及AB测试后更新模型

IT之家 12 月 11 日消息，OpenAI 在上周遭到部分用户投诉，许多用户声称，他们在使用 ChatGPT 或 GPT-4 API 时，会遇到回应速度慢、敷衍回答、拒绝回答、中断会话等一系列问题，OpenA...【详细内容】

2023-12-12　　Search: GPT-4 点击:(50)　　评论:(0)　　加入收藏

▌简易百科推荐

Meta推出新版自研AI芯片：性能较上代提高三倍，降低对英伟达依赖

AI（人工智能）芯片紧缺之际，越来越多科技巨头选择自行研发。当地时间4月10日，社交巨头Meta公布了自主研发芯片MTIA的最新版本。MTIA是Meta专门为AI训练和推理工作设计的定制芯片...【详细内容】

2024-04-11　　　　澎湃新闻　　Tags:Meta 　点击:(1)　　评论:(0)　　加入收藏

英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电

新华财经上海4月11日电当地时间4月9日，英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称，相比英伟达的H100 GPU，Gaudi3 AI芯片的模型...【详细内容】

2024-04-11　　　　上海证券报　　Tags:英特尔　点击:(2)　　评论:(0)　　加入收藏

AI“复活”亲人成生意，哪些红线待划定？

提供一张照片、一段10多秒的音频，即可让逝者在视频中“活”过来——AI“复活”亲人成生意，哪些红线待划定？本报记者陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】

2024-04-11　　　　工人日报　　Tags:AI 　点击:(2)　　评论:(0)　　加入收藏

科技巨头狂撒千亿美元 “买照片”，只为训练AI模型？

高质量的数据，越来越值钱。你能想象，那些被遗忘在网盘的陈年老图，有朝一日能价值千金？就在最近，路透社报道称，苹果公司正与图像托管网站Photobucket协商，希望得到这家公司近130亿张...【详细内容】

2024-04-10　　　　镁客网　　Tags:AI模型　点击:(0)　　评论:(0)　　加入收藏

谷歌推出适用于安卓设备的“查找我的设备”网络

IT之家 4 月 9 日消息，谷歌今日推出了适用于安卓设备的“查找我的设备”网络，其功能类似于苹果的“查找”网络，旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到，与苹果的“...【详细内容】

2024-04-09　　　　IT之家　　Tags:安卓　点击:(2)　　评论:(0)　　加入收藏

你的自拍和聊天记录，正被硅谷大厂砸数十亿美元疯抢

2026年的数据荒越来越近，硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元，希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过，如果有一天AI忽然吐出了我们的...【详细内容】

2024-04-09　　　　新智元　　Tags:硅谷　点击:(2)　　评论:(0)　　加入收藏

谷歌搜索史上最大变革！考虑对AI搜索收费

快科技4月7日消息，据国外媒体报道，谷歌正计划对由生成式人工智能驱动的新高级功能收费，这将是谷歌搜索业务历史上最大的一次变革。自2000年以来，谷歌的搜索产品一直依靠广告盈利...【详细内容】

2024-04-08　　　　快科技　　Tags:谷歌搜索　点击:(8)　　评论:(0)　　加入收藏

为训练AI，OpenAI等科技巨头花式淘数据

[环球时报特约记者甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频，形成对话文本数据，供其最新的AI学习...【详细内容】

2024-04-08　　　　环球网　　Tags:AI 　点击:(9)　　评论:(0)　　加入收藏

训出GPT-5短缺20万亿token！OpenAI被曝计划建「数据市场」

全网真的无数据可用了！外媒报道称，OpenAl、Anthropic等公司正在努力寻找足够的信息，来训练下一代人工智能模型。前几天，OpenAI和微软被曝出正在联手打造超算「星际之门」，解决算...【详细内容】

2024-04-08　　　　新智元　　Tags:GPT-5 　点击:(2)　　评论:(0)　　加入收藏

当“机器人”有了“AI大脑” 人形机器人时代来了吗

数智风向标当“机器人”有了“AI大脑”人形机器人时代来了吗简单明了的口令下达后，机器人便开始搬箱子、运小球，在各类不同的地形行走……这些身上布满芯片和传...【详细内容】

2024-04-08　　　　中国青年报　　Tags:机器人　点击:(5)　　评论:(0)　　加入收藏

推荐资讯

新增融券再启动暂停键	16个Redis常见使用场
一篇文章教会你使用Py	聊聊Rust里面的数据类
C++中的外部模板及其	一篇文章带你了解Pyth
网络安全行业的春天何	Linux获取Redis 性能