OpenAI新功能揭秘：多模态时代的到来

时间：2023-11-15 11:45:54 来源：51CTO 作者：

作者 | 崔皓

摘要

本文介绍了AI target=_blank class=infotextkey>OpenAI的最新进展，重点关注其在多模态技术领域的突破。文章首先探讨了GPT-4 Turbo模型的优化和多模态功能的融合，如图像生成和文本到语音转换。随后，作者深入解析多模态技术的工作原理，特别是文本到图像的转换过程。通过实际应用和编程实例，展示了如何利用这些技术对图像和视频内容进行识别，以及将识别内容转换为语音，体现了多模态技术在实际应用中的广泛潜力和影响力。

开篇

OpenAI最近在其平台上宣布了一系列引人注目的新增和改进功能，这些更新旨在进一步推动人工智能的边界扩展。这些更新不仅包括了性能更强大且成本更低的新型GPT-4 Turbo模型，而且还引入了多模态能力，这将极大地扩展开发者和研究人员的创新空间。以下是这些更新的要点：

1.GPT-4 Turbo模型：这个新模型代表了大规模语言模型的最新进展。它不仅性能更强大，而且价格更亲民。这一模型支持高达128K的上下文窗口，意味着可以处理更长的对话和文本。GPT-4 Turbo的出现，显著提升了开发者利用大型语言模型潜能的能力，让模型成为了一个真正的“全才”。

2.多模态功能：在多模态领域的最新进展尤为引人注目。OpenAI平台上的新功能包括了视觉能力的提升、图像创造（DALL·E 3）以及文本到语音（TTS）技术。这些多模态功能的结合不仅开启了新的应用场景，还为用户提供了一个更加丰富和互动的体验。

3.助手API（Assistants API）：OpenAI新推出的助手API让开发者更加便捷地构建目标明确的AI应用。这个API提供了调用模型和工具的简化方式，从而使开发复杂的辅助性AI应用成为可能，无论是为了业务流程自动化，还是为了增强用户体验。

看到这些功能的加入，让人热血澎湃，我迫不及待地登陆GPT尝鲜这些功能。特别是多模态的功能让我印象深刻，这里我将实践操作以及代码的分析与大家做一个分享。

多模态初探

多模态技术是一个日益流行的领域，它结合了不同类型的数据输入和输出，如文本、声音、图像和视频，以创造更丰富、更直观的用户体验。以下是多模态技术的几个关键方面：

1.综合多种感知模式：多模态技术整合了视觉（图像、视频）、听觉（语音、音频）、触觉等多种感知模式。这种集成使得AI系统能够更好地理解和解释复杂的环境和情境。

2.增强的用户交互：通过结合文本、图像和声音，多模态技术提供了更自然、更直观的用户交互方式。例如，用户可以通过语音命令询问问题，同时接收图像和文本形式的答案。

3.上下文感知能力：多模态系统能够分析和理解不同类型数据之间的关系，从而提供更准确的信息和响应。例如，在处理自然语言查询时，系统能够考虑相关的图像或视频内容，从而提供更为丰富的回答。

4.创新应用：多模态技术的应用范围广泛，包括但不限于自动化客服、智能助手、内容创作、教育、医疗和零售等领域。它允许创建新型的应用程序，这些应用程序能够更好地理解和响应用户的需求。

5.技术挑战：虽然多模态技术提供了巨大的潜力，但它也带来了诸如数据融合、处理不同数据类型的复杂性以及确保准确性和效率的挑战。

6. OpenAI的多模态实例：在OpenAI的框架下，多模态功能的一个显著例子是DALL·E 3，它是一个先进的图像生成模型，可以根据文本描述创建详细和创造性的图像。此外，文本到语音（TTS）技术则将文本转换为自然 sounding的语音，进一步丰富了人机交互的可能性。

多模态原理解析

前面我们对多模态进行了基本的描述，多模态是指能够理解和处理多种类型数据（如文本、图像、声音等）的技术。实现文本-图片-声音-视频之间的转换。转化是表象，实质需要理解。

在人工智能领域，多模态方法通常结合了自然语言处理（NLP）、计算机视觉（CV）和其他信号处理技术，以实现更全面的数据理解和处理能力。

为了说明多模态的工作原理，我们这里举一个从文字转图片的例子，帮助大家理解。我们将整个过程展示如下：

OpenAI新功能揭秘：多模态时代的到来

1. 文本特征提取：

首先，文本输入通过一个文本模型（例如一个预训练的语言模型）来提取文本特征。这个过程涉及将文本转换成一个高维空间的向量，这个向量能够表示文本的语义内容。

2. 融合模型：

在某些情况下，确实会存在一个专门的融合模型，它是在训练阶段通过学习如何结合不同模态的数据而得到的。这个融合模型将在推理阶段使用。

在其他情况下，融合模型可能是隐含的。例如，在条件生成模型中，文本特征向量直接用作生成图像的条件，而不需要显式的融合步骤。

3.条件生成：

融合模型（或者直接从文本模型得到的特征向量）用于为图像生成模型设定条件。这个条件可以理解为指导生成模型“理解”文本内容，并据此生成匹配的图像。

4.图像生成：

最后，图像生成模型（如DALL·E或其他基于生成对抗网络的模型）接收这个条件向量，并生成与之相匹配的图像。这个过程通常涉及到大量的内部计算，模型会尝试生成与条件最匹配的图像输出。

整个流程可以简化为：文本输入 → 文本特征提取 → 特征融合（如果有）→ 条件生成 → 图像输出。在这个过程中，“融合模型”可能是一个独立的模型，也可能是条件生成模型的一部分。关键点是，推理时的特征融合是基于在训练阶段学到的知识和参数进行的。

多模型体验

了解了多模型实现原理之后，我们来登陆ChatGPT体验一下，现在在ChatGPT4中已经集成了DALLE 3 的功能，我们只需要输入指令就可以生成对应的图片。如下所示，我们通过文字描述一只可爱的猫咪，ChatGPT 就能够帮我完成图片的生成。

OpenAI新功能揭秘：多模态时代的到来

不止于此，OpenAI还能够识别图片，当你提供图片之后，OpenAI会根据图片描述其中的内容，如下图我们从网络上找到一张小猫的图片，丢给OpenAI让它识别一下。

OpenAI新功能揭秘：多模态时代的到来

这次我们通过调用OpenAI的API，来实现上述功能。毕竟作为程序员不敲敲代码，只是用工具输入文字还是不太过瘾。

这段代码使用 Python/ target=_blank class=infotextkey>Python 和 OpenAI 库来与 OpenAI 的 GPT-4 API 交互。目的是创建一个聊天会话，其中用户可以向模型发送图像地址。代码通过URL地址，读取图像并且对其进行识别，最终输出理解的文字。

复制

import os

import openai

# 导入所需库：os 用于读取环境变量，openai 用于与 OpenAI API 交互。

openai.api_key = os.getenv('OPENAI_API_KEY')

# 从环境变量获取 OpenAI 的 API 密钥并设置。这样可以避免将密钥硬编码在代码中，提高安全性。

response = openai.ChatCompletion.create(

model="gpt-4-vision-preview",

# 指定使用的 GPT-4 模型版本。这里用的 'gpt-4-vision-preview' 表示一个特别的版本，可能包含处理图像的能力。

messages=[

{

"role": "user",

"content": [

{"type": "text", "text": "这张图片表达了什么意思？"},

{

"type": "image_url",

# 用户消息 (messages)，包括一段文本和一个图像的 URL

"image_url": "http://www.jituwang.com/uploads/allimg/160327/257860-16032H3362484.jpg"

}

# 响应的最大长度 (max_tokens)

max_tokens=200,

print(response.choices[0])

虽然代码比较简单，我们这里还是解释一下。

导入库：代码首先导入 os 和 openai。os 库用于读取环境变量中的 API 密钥，而 openai 库用于执行与 OpenAI API 的交互。

创建聊天请求：

Model：指定了要使用的 OpenAI 模型为 "gpt-4-vision-preview"，这个版本的大模型具备处理图像的能力。
Messages：这是一个字典列表，模拟了用户与 AI 聊天的过程。在这个例子中，用户通过文本询问一张图片的含义，并提供了图片的 URL。
max_tokens：定义了模型回答的最大长度，这里设置为 200 tokens。

执行之后，结果是一段JSON文本，我们使用编辑器打开，如下图所示，程序识别出图片的内容，是一只白色的小猫，并且对动作和表情都进行了精确的描述。

OpenAI新功能揭秘：多模态时代的到来

从识别图片到识别视频

实际上OpenAI这次提供的功能不只是对图片的识别，还可以对其进行扩展，将对图片识别的能力推广到视频上。如下图所示，假设一段1秒钟的视频是由24帧图片组成，如果我们能够将每张图片进行识别，并且将识别的信息进行总结生成摘要是不是就可以对视频进行识别了呢？

OpenAI新功能揭秘：多模态时代的到来

这个想法不错，但是需要通过实践去验证，我们使用一段代码加入早已准备好的视频，通过OpenCV组件加载视频，并且对视频的内容进行读取。将读取之后的视频内容，分成一帧一帧的图片，通过对图片的识别达到对视频识别的目的。

代码如下：

1.导入组件库

复制

# 导入IPython用于显示功能

from IPython.display import display, Image, Audio

# 导入cv2，我们使用OpenCV库来读取视频文件

import cv2

# 导入库用于数据编码

import

# 导入time库用于控制显示时间

import time

# 导入openai库，用于调用OpenAI的API

import openai

# 导入os库，用于操作系统级别的接口，如环境变量

import os

# 导入requests库，用于发起HTTP请求

import requests

当然，我会按照您的要求调整代码注释的位置，使其位于相关代码行的上方。

视频处理

打开一个视频文件（"the-sea.mp4"），读取其中的每一帧，并将这些帧转换成 JPEG 格式后编码为字符串。这种处理方式在需要以文本格式存储或传输图像数据的场景中非常有用，如在网络通信中发送图像数据。

复制

import cv2

# 导入 OpenCV 库

video = cv2.VideoCapture("the-sea.mp4")

# 使用 OpenCV 打开视频文件 "the-sea.mp4"

Frames = []

# 初始化一个空列表，用于存储转换为编码的帧

while video.isOpened():

# 当视频成功打开时，循环读取每一帧

success, frame = video.read()

# 读取视频的下一帧，'success' 是一个布尔值，表示是否成功读取帧，'frame' 是读取的帧

if not success:

break

# 如果未能成功读取帧（例如视频结束），则退出循环

_, buffer = cv2.imencode(".jpg", frame)

# 将读取的帧（frame）编码为 JPEG 格式，'_' 是一个占位符，表示我们不需要第一个返回值

Frames.Append(.b64encode(buffer).decode("utf-8"))

# 将 JPEG 编码的帧转换为编码，并将其解码为 UTF-8 字符串，然后添加到列表 'Frames' 中

video.release()

print(len(Frames), "frames read.")

导入和初始化：首先导入所需的 OpenCV 库，并创建一个空列表 Frames 用于存储编码后的帧。

读取视频帧：通过 while 循环和 video.read() 方法逐帧读取视频。如果读取成功，将帧编码为 JPEG 格式，然后将这些 JPEG 格式的帧转换为编码，并添加到列表中。

资源管理和输出：循环结束后，使用 video.release() 释放视频文件，随后打印出读取的帧数，作为处理的结果。这提供了对视频内容处理情况的直观了解。

显示视频帧

遍历一个包含编码的图像帧列表，连续显示这些帧，从而实现视频播放的效果。

复制

from IPython.display import display, Image

import time

# 导入必要的库：IPython.display 中的 display 和 Image 用于显示图像，time 用于控制播放速度

display_handle = display(None, display_id=True)

# 创建一个显示句柄，用于在之后更新显示的图像。'display_id=True' 允许之后通过该句柄更新显示的内容

for img in Frames:

# 遍历包含编码图像帧的列表

display_handle.update(Image(data=.b64decode(img.encode("utf-8"))))

# 使用 display 句柄更新显示的图像。首先将编码的字符串解码回二进制数据，然后创建一个 Image 对象并显示

time.sleep(0.025)

# 在每帧之间暂停 0.025 秒，以便模拟视频播放的效果

初始化显示句柄：首先创建一个 display_handle，它是一个可以更新的显示对象。这样做可以在之后循环中更新显示的图像，而不是创建新的图像显示。

遍历和显示图像帧：使用 for 循环遍历 Frames 列表中的每一个编码的图像帧。在循环内部，使用 display_handle.update() 方法来更新当前显示的图像。这里涉及将编码的字符串解码为二进制数据，并使用 Image 对象将其转换为可显示的图像。

控制播放速度：在每次更新图像后，使用 time.sleep(0.025) 来暂停一段时间（0.025秒），这样可以在图像帧之间创建短暂的延迟，使得连续播放的视频效果更加平滑。

查看视频效果如下，我们截取了视频中的一张图片，可以看出是一段描述海上日落的视频。

OpenAI新功能揭秘：多模态时代的到来

识别视频内容

使用 OpenAI 的 API 来描述一个视频帧的内容。首先设置请求的参数，包括模型、API 密钥、请求的提示信息，然后调用 API 并打印返回的内容。

复制

import os

import openai

# 导入所需的库：os 用于访问环境变量，openai 用于与 OpenAI 的 API 进行交互

PROMPT_MESSAGES = [

{

"role": "user", # 标记消息的发送者角色为用户

"content": [

"这是我想上传的视频帧。能否帮我描述这张视频帧的内容。",

{"image": Frames[0], "resize": 768}, # 选择列表中的第一帧图像，缩放尺寸为 768 像素

]

# 设置提示信息，以指导模型进行视频帧的内容描述

params = {

"model": "gpt-4-vision-preview", # 指定使用的模型版本

"messages": PROMPT_MESSAGES, # 使用前面设置的提示信息

"api_key": os.environ["OPENAI_API_KEY"], # 从环境变量中获取 API 密钥

"headers": {"Openai-Version": "2020-11-07"}, # 设置 API 版本头信息

"max_tokens": 300, # 设定请求的最大令牌数

}

# 设置 API 调用的参数

result = openai.ChatCompletion.create(params)

# 使用提供的参数发起 API 调用

print(result.choices[0].message.content)

# 打印 API 返回的内容，即模型对视频帧内容的描述

设置提示信息：PROMPT_MESSAGES 包含了 API 请求的核心信息，其中包括用户角色标记和要处理的内容。这里的内容是请求模型描述视频帧的内容，视频帧作为编码的字符串传入。

配置 API 调用参数：在 params 字典中配置了 API 调用所需的所有参数，包括模型名称、提示信息、API 密钥、API 版本和请求的最大令牌数。

发起 API 调用：使用 openai.ChatCompletion.create 方法发起 API 调用，传入之前配置的参数。这个调用将请求模型根据提供的视频帧内容进行描述。

输出结果：最后，打印出 API 返回的结果，即模型对视频帧内容的描述。

展示最终结果，如下：

复制

这张图片展示了一幅美丽的日落景象。太阳正从水平线上缓缓下降，天空被染成了橙色和红色的温暖色调。太阳的余晖在云层间穿透，形成了壮观的光线和阴影效果。海面平静，太阳的反射在水面上画出了一道闪耀的光路。远处的群山轮廓在天空的对比下显得剪影般的轮廓分明。整体上，这是一幅宁静、和谐、引发深思的图像。

看来OpenAI不仅描绘了视频中的画面，还对其的内涵进行了引申，这是要赶超人类的节奏了。

从识别内容到语音播报

好了到现在，我们已经完成了从图片到文字，视频到文字的转换了。假设我们要将视频上传到网站时，并且对视频进行解释，此时不仅需要文字更需要一段专业的语音播报。好吧！我是想展示下面的功能，如何将视频识别的文字转化成语音播报。

下面这段代码使用 Python 和 OpenAI 的语音合成 API 来将文本转换为语音，即将视频生成的文本（描述日落景象的文本）转换成语音。然后，它接收并汇总响应中的音频数据，并使用 Audio 对象来播放这段音频。

复制

import requests

from IPython.display import Audio

import os

# 导入所需的库：requests 用于发起 HTTP 请求，Audio 用于在 Jupyter Notebook 中播放音频，os 用于读取环境变量

# 向 OpenAI 的语音合成 API 发送 POST 请求

response = requests.post(

"https://api.openai.com/v1/audio/speech",

headers={

"Authorization": f"Bearer {os.environ['OPENAI_API_KEY']}",

json={

"model": "tts-1", # 指定使用的语音合成模型

"input": result.choices[0].message.content, # 要转换为语音的文本

"voice": "onyx", # 选择的语音类型

audio = b""

# 初始化一个空字节串，用于累积音频数据

# 逐块读取响应中的音频数据

for chunk in response.iter_content(chunk_size=1024 * 1024):

audio += chunk

# 使用 response.iter_content 方法按块读取音频内容，每块最大为 1 MB，并将其累加到 audio 变量中

Audio(audio)

# 使用 IPython 的 Audio 对象播放累加的音频数据

准备和发起请求：首先导入所需的库，并准备发起一个 POST 请求到 OpenAI 的语音合成 API。请求头部包含了 API 密钥（从环境变量获取），请求体包含了模型名称、要转换的文本内容以及语音类型。

接收音频数据：从 API 响应中逐块读取音频数据。这里使用了 1 MB 作为每个数据块的大小限制。通过循环，将这些数据块累加到一个字节串 audio 中。

播放音频：最后，使用 Audio 对象来播放累积的音频数据。这允许在 Jupyter Notebook 环境中直接播放音频。

音频结果如下：

OpenAI新功能揭秘：多模态时代的到来

大家可以尝试上面的代码，生成自己的语音文件。

总结

文章通过详尽地探讨OpenAI的多模态功能，展示了人工智能领域的最新进展。从GPT-4 Turbo模型的介绍到多模态技术的应用实例，不仅提供了技术的理论背景，还通过具体的代码示例，展现了如何将这些技术实际应用于图像生成、视频内容识别和语音转换。这不仅彰显了AI技术的前沿动向，也为读者提供了实践AI技术的洞见和启发。

作者介绍

崔皓，51CTO社区编辑，资深架构师，拥有18年的软件开发和架构经验，10年分布式架构经验。

Tags：OpenAI 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

为训练AI，OpenAI等科技巨头花式淘数据

[环球时报特约记者甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频，形成对话文本数据，供其最新的AI学习...【详细内容】

2024-04-08　　Search: OpenAI 点击:(6)　　评论:(0)　　加入收藏

报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

IT之家 4 月 7 日消息，本周早些时候，《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天，《纽约时报》详细介绍了 AI 公司处理此问题的一些方法，其中涉及到...【详细内容】

2024-04-07　　Search: OpenAI 点击:(4)　　评论:(0)　　加入收藏

ChatGPT官宣免注册，全球互联网变天！OpenAI将取代谷歌搜索？

新智元报道编辑：编辑部【新智元导读】OpenAI这份愚人节礼物，实在是太大了：今天起，ChatGPT不用注册，可以直接使用。用户狂欢，竞品颤抖，我们仿佛已经听到，谷歌搜索引擎这位巨人轰然倒...【详细内容】

2024-04-02　　Search: OpenAI 点击:(7)　　评论:(0)　　加入收藏

无需注册！OpenAI宣布放开ChatGPT使用限制

工智能初创公司OpenAI宣布，即日起用户无须注册即可开始使用ChatGPT的功能。OpenAI在最新公告中写道：“让ChatGPT等工具广泛可用，让人们能够体验到人工智能的好处，这是我们使命的...【详细内容】

2024-04-02　　Search: OpenAI 点击:(6)　　评论:(0)　　加入收藏

开发者再分享 OpenAI Sora 生成的短视频：树叶大象、彩虹瀑布等

IT之家 3 月 19 日消息，OpenAI 今年 2 月推出 Sora 模型之后，迅速成为 AI 圈内头条，能够基于用户的一句话，生成最长 1 分钟的视频，效果接近实拍。OpenAI 目前并未向公众发布 Sora...【详细内容】

2024-03-19　　Search: OpenAI 点击:(12)　　评论:(0)　　加入收藏

奥特曼承认OpenAI名不符实：我们需要大量资金

OpenAI首席执行官萨姆·奥特曼最近在一次网络直播中表示，OpenAI可能不是这家人工智能公司最理想的名字，至少事后看来是这样。他在与莱克斯·弗里德曼的一次播客访...【详细内容】

2024-03-19　　Search: OpenAI 点击:(8)　　评论:(0)　　加入收藏

别等OpenAI了，全球首个类Sora抢先开源！所有训练细节/模型权重全公开，成本仅1万美元

【导读】OpenAI Sora还没用上，国产Sora刚刚正式宣布全面开源！「Open-Sora 1.0」所有的训练细节模型权重全面开源，1万美元64块GPU复现，训练成本直降46%。图片来源：由无界AI生成不...【详细内容】

2024-03-18　　Search: OpenAI 点击:(18)　　评论:(0)　　加入收藏

与OpenAI合作13天后，Figure人形机器人展示与人类对话能力

人形机器人与AI的结合加快了，Figure AI的机器人开始与人类对话。北京时间3月13日深夜，一段人形机器人视频在社交媒体上热传，主角是Figure AI的人形机器人。2月底，Figure AI刚刚...【详细内容】

2024-03-14　　Search: OpenAI 点击:(9)　　评论:(0)　　加入收藏

AI最强大模型易主，OpenAI前景成疑？

GPT-4这次翻车了，Anthropic发布的Claude 3系列模型成功逆袭上位，从性能上实现超越，大模型榜首一夜易主？Claude 3到底靠什么战胜了OpenAI 的GPT-4，快和小夏一起看看，大模型的“新王...【详细内容】

2024-03-07　　Search: OpenAI 点击:(18)　　评论:(0)　　加入收藏

刚刚曝光的 Claude3，直击 OpenAI 最大弱点

作为 OpenAI GPT3 研发负责人的创业项目，Anthropic 被视为最能与 OpenAI 抗衡的一家创业公司。当地时间周一，Anthropic 发布了一组 Claude 3 系列大模型，称其功能最强大的模型...【详细内容】

2024-03-05　　Search: OpenAI 点击:(30)　　评论:(0)　　加入收藏

▌简易百科推荐

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(4)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(4)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(7)　　评论:(0)　　加入收藏

第一批用 Kimi 做内容的网红已经杀疯了

作者：王东东文章来自：斗战圣佛小组技术信仰派 VS 市场信仰派朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是：大模型有没有戏。技术派...【详细内容】

2024-04-04　　　　斗战圣佛小组　　Tags:Kimi 　点击:(4)　　评论:(0)　　加入收藏

昆仑万维发布面向人工智能时代的六条人才宣言

过去的一年多，是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里，我们见证了人工智能的快速发展和广泛的影响，人工智能已经迅速地融入了我们的生活，深刻...【详细内容】

2024-04-03　　　　砍柴网　　Tags:昆仑万维　点击:(7)　　评论:(0)　　加入收藏

AI干掉声优？音频大模型追逐“图灵时刻”

七十年前，“人工智能之父”图灵提出，如果人无法判断屏幕的另一侧究竟是人还是机器，就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般，指引着AI行业的工作者们不...【详细内容】

2024-04-03　　　　第一财经网　　Tags:AI 　点击:(5)　　评论:(0)　　加入收藏

生成式人工智能有哪些新趋势？

相较于去年，当下我们所能体验的人工智能技术的范围已经大幅提升。从搜索引擎、电商平台再到社媒平台，只要是以搜索结果为导向的内容，都会出现它的身影。但其实，人工智能的应用场...【详细内容】

2024-04-03　　品谈教师帮　　　　Tags:人工智能　点击:(6)　　评论:(0)　　加入收藏

AI世界的新难题：互联网的信息不够用了！

高质量数据的紧缺正成为AI发展的重要障碍。4月1日，据媒体报道，随着OpenAI、Google等企业不断深入发展AI技术，科技巨头们遇到了一个新问题：现有的互联网信息量可能不足以支撑他们...【详细内容】

2024-04-02　　硬AI　　　　Tags:AI 　点击:(6)　　评论:(0)　　加入收藏

今天起，ChatGPT无需注册就能用了！

　来源：量子位　　　　金磊克雷西发自凹非寺　　就在刚刚，OpenAI狠狠地open了一把：从今天起，ChatGPT打开即用，无需再注册帐号和登录了！　　像这样，直接登录网站，然后就可以开启对...【详细内容】

2024-04-02　　　　量子位　　　Tags:ChatGPT 　点击:(7)　　评论:(0)　　加入收藏

AI时代，面对死亡有了第二种选择？

今年春节期间，罗佩玺瞒着妈妈用AI技术“复活”了外婆，她将妈妈现在的模样和外婆留下的老照片合成在一起。时隔60多年，妈妈和外婆终于又“见面”了，这是她送给妈妈的生日礼物。收...【详细内容】

2024-04-02　　　　中国青年报　　Tags:AI时代　点击:(7)　　评论:(0)　　加入收藏

推荐资讯

访问网站显示不安全是	掌握独立站SEO策略，提
快手蓝色小钥匙跳转微	微信朋友圈如何置顶
Facebook新用户扩展怎	详解微信里面的分期可
微信表情包更新：原创设	微信朋友圈功能大改版