您当前的位置：首页 > 新闻资讯 > 科技

GPT-4V多模态能力惊人！公式截图直出代码，「龙与魔法世界」瞬间生成，OpenAI总裁激动转发

时间：2023-10-17 14:30:18 来源：新智元作者：

+ 加入收藏

最近，GPT-4一直在默默更新，加入了多模态，语音交互等功能。

但是与年初AI target=_blank class=infotextkey>OpenAI每次发布的新功能，都能引得外界一阵惊呼的阵仗相比，现在GPT-4的声量似乎小了很多。

不知道是不是担心自己产品发布太过于耀眼，导致监管和官司不断找上门，OpenAI除了3周前更新了文生图模型DALL-E 3外，在发布了GPT-4之后的7个月内，官方没有公开发布任何新的产品和功能。

GPT-4V多模态能力惊人！公式截图直出代码，「龙与魔法世界」瞬间生成，OpenAI总裁激动转发

但是OpenAI总裁Greg Brockman自己却在X（推特）上，不断转发利用新版的GPT-4来实现的各种天马行空的功能。

利用GPT-4V的多模态能力和代码能力，直接把一个写在书上的数学公式转化成一段Python/ target=_blank class=infotextkey>Python代码。

而利用GPT-4刚更新不久的语音功能，有人开始把它当成商务谈判的教练来进行模拟练习了。

就在这个帖子下面，这位帝国理工学院商学院的学习设计师留言称，他们已经开始使用GPT-4的语音功能为MBA设计培训课程了。

直接用ChatGPT集成的的DALLE 3来为游戏设计师生成世界观和原画设定图。

只要几行Prompt，一个飞龙世界的文字描述和原画风格图就出来了。

直接用DALLE 3来生成自己想要的GIF文件。

一颗玉米如何成为爆米花。

一只跳舞的狗子。

我们就一起来看看如何利用GPT-4来完成这一系列的功能。

GPT-4理综版

网友发现，只要通过截图，可以将几乎任何数学公式，通过GPT-4转化为Python代码。

当然，因为模型还是存在出现幻觉的可能，所有的结果不能直接拿过来就用，还是要认真检查其中的错漏。

比如截图中第六行的代码，「d_hat(i, j)」应该是「d_hat(i)」。

虽然有小错误，但是网友们依然对这个功能给与了非常高的评价。

这位MIT博士，AI初创公司的创始人认为，如果没有额外的上下文，GPT-4无法识别这个函数，但它确实知道它正在做什么……非常酷。

另一位开发了一个金融AI工具的开发人员称，这个用例非常棒！有无穷的想象空间。

并且他给出了两个具体的用例。

可以截图研究论文中的复杂数学方程并在本地快速运行。

2. 可以截屏（任何内容）并让GPT生成代码来实现 UI。

同样，除了数学公式，它还可以直接读取分子式，直接输出制备方法。

给它投喂一个耳机的电路图，它就能告诉你组装这个设备的大致步骤。

GPT-4V对于多模态的良好支持，结合它的编码能力，以及广博的知识面，可以组合出几乎无穷的使用方案。

几句Prompt 生成龙与魔法的世界

另外一位网友分享了它通过ChatGPT创造了一个和龙有关的奇幻世界的过程。

GPT-4生成了和龙有关的概念、解剖结构，甚至龙的栖息地。

龙的头部特写。

龙的骨架和解刨图。

以及龙的生存环境原画和描述。

首先，需要指定出你想要的图像样式。

作者想要那种技术信息图表风格的美术风格，他使用了这个Prompt，几乎就是普通的英语描述。

「Can you generate me a technical engineer's drawing of a dragon, with labels of its various parts? Use a wide aspect ratio：」

就得到了下面的结果：

接下来，生成龙头的特写。

然后让他生成栖息地的环境原画图和介绍。

如果不满意，就再进一步细化你的要求，让GPT-4来满足。

作为游戏设计师，想要设计一个和龙有关的场景，直接动手就能出可以使用的结果。

另外一位网友根据这个用例的启发，生成了一个和藏红花相关的介绍。

「Can you generate me a technical engineer's drawing of a saffron, with labels of its various parts? Use a wide aspect ratio.」

用这个提示词生成了一个藏红花的结构图。

再生成了一幅藏红花束的特写。「Can you generate a close up of saffron strand in wide aspect ratio?」

藏红花田的远景图片。「Please generate an aerial view of saffron field in wide aspect ratio.」

最后生成了藏红花的剖面图。「Anatomy of saffron strand in wide aspect ratio.」

一个非常复杂的潜艇结构图！

高达的结构示意图。

头部的详细结构图。

足部的详细结构图。

武器的结构图。

面包机的超详细结构图。

网友纷纷表示，完全停不下来。

Tags：GPT-4V 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

前端不存在了？盲测64%的人更喜欢GPT-4V的设计，杨笛一等团队新作

3 月 9 日央视的一档节目上，百度创始人、董事长兼 CEO 李彦宏指出，以后不会存在「程序员」这种职业了，因为只要会说话，人人都会具备程序员的能力。「未来的编程语言只会剩下两种...【详细内容】

2024-03-11　　Search: GPT-4V 点击:(9)　　评论:(0)　　加入收藏

多模态大模型，阿里通义千问能和GPT-4V掰手腕了

通义千问的图像推理能力，最近有了大幅提升。2024 年，大模型领域要卷什么？如果没有思路的话，不妨看看各家大厂都在押注什么方向。最近一段时间，先是 OpenAI 推出 GPT-4V，让大模型...【详细内容】

2024-01-29　　Search: GPT-4V 点击:(71)　　评论:(0)　　加入收藏

GPT-4V开源平替！清华浙大领衔，LLaVA等开源视觉模型大爆发

新智元报道编辑：Aeneas【新智元导读】GPT-4V的开源替代方案来了！极低成本，性能却类似，清华、浙大等中国顶尖学府，为我们提供了性能优异的GPT-4V开源平替。如今，GPT-4 Vision在语言...【详细内容】

2024-01-03　　Search: GPT-4V 点击:(53)　　评论:(0)　　加入收藏

谷歌Gemini扳回一局！多模态能力和GPT-4V不分伯仲｜港中文128页全面测评报告

量子位 | 公众号 QbitAI谷歌扳回一局！在Gemini开放API不到一周的时间，港中文等机构就完成评测，联合发布了多达128页的报告，结果显示：在37个视觉理解任务上，Gemini-Pro表现出了和GP...【详细内容】

2023-12-22　　Search: GPT-4V 点击:(118)　　评论:(0)　　加入收藏

GPT-4V 都搞不明白的未来推理有解法了！来自华科大 & 上科大

多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。即便是当前最强大的 GPT-4V（如下图所示），也无法很好地解决...【详细内容】

2023-12-18　　Search: GPT-4V 点击:(58)　　评论:(0)　　加入收藏

GPT-4V多模态能力惊人！公式截图直出代码，「龙与魔法世界」瞬间生成，OpenAI总裁激动转发

最近，GPT-4一直在默默更新，加入了多模态，语音交互等功能。但是与年初OpenAI每次发布的新功能，都能引得外界一阵惊呼的阵仗相比，现在GPT-4的声量似乎小了很多。不知道是不是担心自...【详细内容】

2023-10-17　　Search: GPT-4V 点击:(166)　　评论:(0)　　加入收藏

▌简易百科推荐

谷歌推出适用于安卓设备的“查找我的设备”网络

IT之家 4 月 9 日消息，谷歌今日推出了适用于安卓设备的“查找我的设备”网络，其功能类似于苹果的“查找”网络，旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到，与苹果的“...【详细内容】

2024-04-09　　　　IT之家　　Tags:安卓　点击:(2)　　评论:(0)　　加入收藏

你的自拍和聊天记录，正被硅谷大厂砸数十亿美元疯抢

2026年的数据荒越来越近，硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元，希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过，如果有一天AI忽然吐出了我们的...【详细内容】

2024-04-09　　　　新智元　　Tags:硅谷　点击:(2)　　评论:(0)　　加入收藏

谷歌搜索史上最大变革！考虑对AI搜索收费

快科技4月7日消息，据国外媒体报道，谷歌正计划对由生成式人工智能驱动的新高级功能收费，这将是谷歌搜索业务历史上最大的一次变革。自2000年以来，谷歌的搜索产品一直依靠广告盈利...【详细内容】

2024-04-08　　　　快科技　　Tags:谷歌搜索　点击:(7)　　评论:(0)　　加入收藏

为训练AI，OpenAI等科技巨头花式淘数据

[环球时报特约记者甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频，形成对话文本数据，供其最新的AI学习...【详细内容】

2024-04-08　　　　环球网　　Tags:AI 　点击:(7)　　评论:(0)　　加入收藏

训出GPT-5短缺20万亿token！OpenAI被曝计划建「数据市场」

全网真的无数据可用了！外媒报道称，OpenAl、Anthropic等公司正在努力寻找足够的信息，来训练下一代人工智能模型。前几天，OpenAI和微软被曝出正在联手打造超算「星际之门」，解决算...【详细内容】

2024-04-08　　　　新智元　　Tags:GPT-5 　点击:(1)　　评论:(0)　　加入收藏

当“机器人”有了“AI大脑” 人形机器人时代来了吗

数智风向标当“机器人”有了“AI大脑”人形机器人时代来了吗简单明了的口令下达后，机器人便开始搬箱子、运小球，在各类不同的地形行走……这些身上布满芯片和传...【详细内容】

2024-04-08　　　　中国青年报　　Tags:机器人　点击:(3)　　评论:(0)　　加入收藏

报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

IT之家 4 月 7 日消息，本周早些时候，《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天，《纽约时报》详细介绍了 AI 公司处理此问题的一些方法，其中涉及到...【详细内容】

2024-04-07　　　　IT之家　　Tags:OpenAI 　点击:(5)　　评论:(0)　　加入收藏

量子计算会和经典计算一样融入人们的日常生活

作为2024中国网络媒体论坛打造的创新活动之一，“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场，本源量子计算科技（合肥）股份有限公司（以下简称“...【详细内容】

2024-04-03　　　　人民网　　Tags:量子计算　点击:(8)　　评论:(0)　　加入收藏

ChatGPT官宣免注册，全球互联网变天！OpenAI将取代谷歌搜索？

新智元报道编辑：编辑部【新智元导读】OpenAI这份愚人节礼物，实在是太大了：今天起，ChatGPT不用注册，可以直接使用。用户狂欢，竞品颤抖，我们仿佛已经听到，谷歌搜索引擎这位巨人轰然倒...【详细内容】

2024-04-02　　　　新智元　　Tags:ChatGPT 　点击:(8)　　评论:(0)　　加入收藏

谷歌为了结集体诉讼，同意删除 Chrome 无痕模式下收集的用户数据

IT之家 4 月 2 日消息，根据华尔街日报报道，谷歌为了结追溯到 2020 年的集体诉讼案，近日同意删除通过 Chrome 浏览器“无痕（Incognito）模式”下收集的用户数据。这起诉讼原告认为，...【详细内容】

2024-04-02　　　　IT之家　　Tags:Chrome 　点击:(7)　　评论:(0)　　加入收藏

推荐资讯

A股分拆上市密集改道：	探访“中国黄金第一家
藏在AI背后的“吃电狂	看1280份年报：大消费复
美联储年内可能不降息	热门黄金ETF瞬间跌停！
亏本卖！李嘉诚这又在唱	变味的重整：揭秘市值“

无相关信息

站内最新

栏目相关

· 谷歌推出适用于安卓设备的“查找我的设备”网络

· 你的自拍和聊天记录，正被硅谷大厂砸数十亿美元疯抢

· 谷歌搜索史上最大变革！考虑对AI搜索收费

· 为训练AI，OpenAI等科技巨头花式淘数据

· 训出GPT-5短缺20万亿token！OpenAI被曝计划建「数据市场」

· 当“机器人”有了“AI大脑” 人形机器人时代来了吗

· 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

· 量子计算会和经典计算一样融入人们的日常生活

· ChatGPT官宣免注册，全球互联网变天！OpenAI将取代谷歌搜索？

· 谷歌为了结集体诉讼，同意删除 Chrome 无痕模式下收集的用户数据

· 哥伦比亚大学华人开发「人脸机器人」，照镜子自主模仿人类表情超逼真

· 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录

· GPT商店热度不尽人意仅用在写论文和炒股票上较受欢迎

· 距实现全球安全量子通信更近一步：量子点源产生近乎完美纠缠光子对

· 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API

· 马斯克脑机接口再造奇迹：瘫痪小伙意念玩赛车击败正常人

· 国家数据局局长刘烈宏：充分发挥数据要素价值培育新质生产力

· 谷歌Chrome巨变：第三方Cookie的终结将重塑互联网格局

· 百度+苹果，“AI手机元年”真的来了？

· 百度AI“咬”了一口苹果大模型商用有戏了？

站内热门