您当前的位置:首页 > 电脑百科 > 人工智能

大模型助力高效创建知识图谱

时间:2023-09-28 11:44:08  来源:51CTO  作者:

作者 | 崔皓

审校 | 重楼

摘要

本文探讨了知识图谱与大型语言模型如何联手提升行业应用。你将了解知识图谱的开发流程,尤其是实体识别、关系抽取和图的构建三个关键环节。通过实战示例,文章将展示如何利用自然语言处理(NLP)和大型语言模型生成知识图谱。此外,文章还将介绍一个开源的知识图谱项目GraphGPT。

开篇

众所周知,知识图谱是一种以图结构组织和表示信息或知识的方式。在这样的结构中,节点表示实体(如人、地点、事物等),边则代表实体之间的各种关系。知识图谱能够帮助我们更有效地组织和检索信息,从而在搜索、推荐系统、自然语言理解和多种应用场景中发挥关键作用。随着大模型发展愈来愈快,利用大模型生成知识图谱的方式也悄然兴起。本文通过实战的方式带大家利用大语言模型生成知识图谱。

知识图谱的应用与开发

知识图谱的应用

说起知识图谱可能大家并不陌生,它在各个领域都发挥着重要的作用。

1. 医疗健康

疾病诊断与治疗: 通过分析疾病、症状、药物之间的关系,知识图谱可以帮助医生做出更准确的诊断和治疗方案。

药物研发: 知识图谱可以整合各种生物医学信息,加速新药的研发过程。

2. 金融行业

风险管理与评估: 知识图谱能够整合个人或企业的多维度信息,从而更准确地评估贷款或投资的风险。

反欺诈: 通过分析交易模式和行为,知识图谱可以有效地检测和预防欺诈活动。

3. 电商和推荐系统

个性化推荐:知识图谱可以根据用户行为和偏好,以及商品属性进行更精准的个性化推荐。

供应链优化: 通过分析供应链中各环节的数据,知识图谱可以帮助企业优化存货管理和物流。

知识图谱的开发

知识图谱通过连接庞大且复杂的数据点,为多个行业提供了高度相关和实用的洞见。这使得它成为现代信息时代不可或缺的一部分。

知识图谱开发过程也比较繁琐,需要经过如下步骤:

数据收集: 从各种来源(如文本、数据库、网站等)收集原始数据。

数据清洗: 对收集的数据进行预处理,包括去除噪声、标准化等。

实体识别: 识别文本中的重要实体(如名词或专有名词)。

关系抽取: 确定实体之间的关系(如“是”、“有”、“属于”等)。

构建图: 使用识别出的实体和关系构建知识图谱。

验证与更新: 通过人工或自动方式对知识图谱进行验证和动态更新。

三元组

虽然上述过程的每个步骤都很重要,但是“实体识别”,“关系抽取”,“构建图”这三个步骤是整个开发过程的重中之重。我们需要使用三元组的方式完成识别,抽取和构建。

在大语言模型如GPT或BERT出现之前,知识图谱主要依赖于规则匹配、词性标注、依存解析和各类机器学习方法来抽取三元组(实体1、关系、实体2)。这些传统方法各有优缺点,如需大量人工规则、标记数据或计算资源,泛化能力和准确性也有限。

例如:对下面三句话进行三元组的抽取

1. 小红是我的同学。

2. 小红是小明的邻居。

3. 小明是我的篮球队队友。

我可以使用NLP方式对其进行处理,代码如下:

from snownlp import SnowNLP

# 初始化三元组列表
triplets = []

# 待处理的文本列表
sentences = [
    "小红是我的同学。",
    "小红是小明的邻居。",
    "小明是我的篮球队队友。"
]
# 遍历每个句子进行处理
for sentence in sentences:
    # 使用SnowNLP进行自然语言处理
    s = SnowNLP(sentence)
    
    # 从句子中抽取名词和动词
    words = [word for word, tag in s.tags if tag in ('nr', 'n', 'v')]
    
    # 假设我们的三元组格式为: (实体1, 关系, 实体2)
    # 在这个简单的例子里,我们只取前两个名词作为实体1和实体2,动词作为关系
    if len(words) >= 3:
        triplets.Append((words[0], words[2], words[1]))

# 输出抽取出来的三元组
print(triplets)
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.

这里对代码稍微做一下解释:

  • 先初始化一个空的triplets列表,用于存放抽取出来的三元组。
  • 然后,定义了一个sentences列表,包含三个待处理的句子。
  • 使用for循环遍历这些句子。
  • 使用SnowNLP对每个句子进行自然语言处理。
  • 通过s.tags获取词性标注,并抽取出名词('n')和人名('nr')以及动词('v')。
  • 如果一个句子中包含至少三个这样的词(两个实体和一个关系),则形成一个三元组并添加到triplets列表中。

上述代码结果如下:

[('是', '邻居', '小明'), ('小明', '篮球队', '是')]
  • 1.

通过结果可以看出自然语言处理(NLP)任务存在的问题:

1. 三元组的构造不准确:例如第一个三元组`('是', '邻居', '小明')`,其中“是”并不是一个实体,而应该是一个关系。

2. 丢失了一些关键信息:例如第三个句子"我和小明是篮球队的队友"并没有正确抽取为三元组。

这些问题揭示了一般NLP任务(尤其是基于规则或浅层NLP工具的任务)存在的一些局限性:

1. 词性标注和句法分析的不准确性:依赖于词性标注和句法分析工具的准确性,一旦工具出错,后续的信息抽取也会受到影响。

2. 缺乏深度语义理解:仅仅通过词性标注和浅层句法分析,难以准确地抽取复杂或模糊的关系。

3. 泛化能力差:对于不同类型或结构的句子,可能需要不断地调整规则或模型。

4. 对上下文信息的利用不足:这种方法通常只考虑单个句子内的信息,而忽视了上下文信息,这在复杂文本中是非常重要的。

大语言模型如何助力知识图谱

大语言模型,如GPT或BERT,是基于深度学习的自然语言处理模型,具有出色的文本理解和生成能力。它们能够理解自然语言,从而使复杂的查询和推理变得更加简单。相比于传统方法,大模型有以下几点优势:

  • 文本理解能力:可以准确地抽取和理解更复杂、模糊或多义的实体和关系。
  • 上下文敏感性:大模型能够理解词语在不同上下文中的不同含义,这对于精准抽取实体和关系至关重要。这种上下文敏感性让模型能够理解复杂和模糊的句子结构。
  • 强大的泛化能力:由于在大量多样化数据上进行了训练,这些模型能够很好地泛化到新的、未见过的数据。这意味着即使面对具有复杂结构或不常见表达方式的文本,它们也能准确地进行实体和关系抽取。

同样的例子,我们看看大模型是如何做的。代码如下:

from snownlp import SnowNLP

# 初始化三元组列表
triplets = []

# 待处理的文本列表
from langchAIn.llms import OpenAI

llm = OpenAI(model_name="gpt-3.5-turbo")
texts = '''小红是我的同学。小红是小明的邻居。小明是我的篮球队队友。'''
#知识图谱索引创建
from langchain.indexes import GraphIndexCreator
#知识图谱问答的chain
from langchain.chains import GraphQAChain
#知识图谱三元素的一个类。 三元素:主 谓 宾。
from langchain.graphs.NETworkx_graph import KnowledgeTriple

#创建图谱的索引,解析文本内容
index_creator = GraphIndexCreator(llm=llm)
#创建图谱的索引,显示对象之间的关系
f_index_creator = GraphIndexCreator(llm=llm)
final_graph = f_index_creator.from_text('')

#对文本进行切割
for text in texts.split("."):
  #将切割以后的文本生成三元组
  triples = index_creator.from_text(text)
  for (node1, node2, relation) in triples.get_triples():
    #将三元组的信息放到final_graph中用以显示
    final_graph.add_triple(KnowledgeTriple(node1, node2,relation ))
    print("=================")
    print(node1)
    print(relation)
    print(node2)
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.

上面这段代码用于构建知识图谱。它用到了三个主要的模块:`OpenAI`、`GraphIndexCreator` 和 `GraphQAChain`,以及一个辅助类:`KnowledgeTriple`。主要内容包括:

  1. OpenAI 初始化:`llm = OpenAI(model_name="gpt-3.5-turbo")` 。初始化了 `gpt-3.5-turbo` 的大型语言模型(LLM)。
  2. 输入文本:`texts = '小红是我的同学。小红是小明的邻居。小明是我的篮球队队友。'` 定义要处理的文本,其中包含多个句子。
  3. 创建图谱索引:`index_creator = GraphIndexCreator(llm=llm)` 使用 `GraphIndexCreator` 类来创建一个图索引生成器,它会用到先前初始化的大型语言模型。
  4. 初始化最终图:`final_graph = f_index_creator.from_text('')` 初始化了一个空的知识图谱,用于存放最终的三元组信息。
  5. 文本切割和三元组生成: `for text in texts.split("."):`这个循环通过句号切割文本,然后对每一个非空句子生成三元组。
  6. `triples = index_creator.from_text(text)`通过 `index_creator` 的 `from_text` 方法,为每个句子生成三元组。
  7. 三元组存储和输出:`final_graph.add_triple(KnowledgeTriple(node1, node2,relation ))`将生成的三元组添加到 `final_graph` 知识图谱中。

下面是运行结果:

=================
小红
是
我的同学
=================
小红
是
小明的邻居
=================
小明
是
我的篮球队队友
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.

看起来是不是比上面NLP处理的结果要好些。

如果我们将texts变量进行修改:

texts = '''小鸟国,正式名称飞禽国度(ISO:飞禽国度),是位于新世界南部的国家。它以领土面积而言是世界第七大国家;是人口最多的国家,一直是世界上人口最多的民主国家。小鸟国南临翡翠海,西南濒临蓝色海洋,东南濒临碧玉海,与翼足国家在西部接壤;北部与巨翼国、鸣虫国和象牙国相邻;东部与彩虹国和翡翠国接壤。在翡翠海中,小鸟国位于双岛国家和翡翠群岛,与彩虹国、碧玉国和绿洲国共享海上边界。翡翠海是7大文明遗迹之一,在天门东边'''
  • 1.

用一个特别复杂的例子来表示,这个例子是我们虚拟的一个国家,并且描述了和这个国家相关的一些其他国家,看上去比较复杂。此时,我们加入图表的方式,通过节点和边展示这样的复杂关系。加入如下代码:

import networkx as nx
import matplotlib.pyplot as plt

#创建一个空的有向图
G = nx.DiGraph()
#将上面得到的三元组放到图像的边中
#source - node1 , target - node2 , relation - relation
G.add_edges_from((source, target, {'relation': relation}) for source, relation, target in final_graph.get_triples())

#指定图像的大小和分辨率
plt.figure(figsize=(8,3), dpi=500)
#通过spring算法定义节点的布局
pos = nx.spring_layout(G, k=3, seed=0)

edge_labels = nx.get_edge_attributes(G, 'relation')
nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels, font_size=8,font_family='simhei')

#定义显示中文字体
nx.draw_networkx(G, font_family = 'simhei')
#关闭坐标轴显示
plt.axis('off')
plt.show()
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.

这段代码使用了`networkx`和`matplotlib.pyplot`库来可视化一个有向图(即知识图谱),其中的节点和边是从之前抽取的三元组(实体-关系-实体)中得到的。

1. 创建空的有向图: `G = nx.DiGraph()`

2. 添加边到图中:

`G.add_edges_from((source, target, {'relation': relation}) for source, relation, target in final_graph.get_triples())`

把之前从文本中抽取出的三元组添加到图`G`中作为边。每一条边都有一个起点(`source`),一个终点(`target`)以及一个表示两者关系的标签(`relation`)。

3. 设置图像大小和分辨率:

`plt.figure(figsize=(8,3), dpi=500)`

设置了图像的大小(8x3)和分辨率(500 DPI)。

4. 定义节点布局:

`pos = nx.spring_layout(G, k=3, seed=0)`

使用“spring”布局算法来确定图中每个节点的位置。`k`是一个用于设置节点间距的参数,`seed`是随机数生成器的种子。

5. 获取边标签并绘制:

`edge_labels = nx.get_edge_attributes(G, 'relation')`

`nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels, font_size=8, font_family='simhei')`

获取了图中每一条边的标签(即`relation`)并进行了绘制。

6. 绘制图:

`nx.draw_networkx(G, font_family = 'simhei')`

绘制了整个图,其中使用了`simhei`字体以支持中文字符。

7. 关闭坐标轴显示并展示图像:

`plt.axis('off')`

`plt.show()`

关闭了坐标轴的显示,并展示了最终的图像。

看看结果如何:

=================
小鸟国
是
新世界南部的国家
=================
小鸟国
以
领土面积而言是世界第七大国家
=================
小鸟国
是
人口最多的国家
=================
小鸟国
是
世界上人口最多的民主国家
=================
小鸟国
南临
翡翠海
=================
小鸟国
西南濒临
蓝色海洋
=================
小鸟国
东南濒临
碧玉海
=================
小鸟国
与翼足国家
在西部接壤
=================
小鸟国
北部与巨翼国、鸣虫国和象牙国
相邻
=================
小鸟国
东部与彩虹国和翡翠国
接壤
=================
小鸟国
在翡翠海中
位于双岛国家和翡翠群岛
=================
小鸟国
与彩虹国、碧玉国和绿洲国
共享海上边界
=================
翡翠海
是
7大文明遗迹之一
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.

大模型助力高效创建知识图谱

生成的知识图谱围绕着小鸟国把与之相关的地方都连接起来了。

接着针对上面的知识图谱提出问题,如下代码:

chain = GraphQAChain.from_llm(llm, graph=final_graph, verbose=True)
chain.run('翡翠海在哪里?')
  • 1.
  • 2.

结果返回:

> Entering new  chain...
Entities Extracted:
翡翠海
Full Context:
翡翠海 7大文明遗迹之一 是
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

知识图谱通过三元组的方式告诉我们 “翡翠海”(实体1),“7大文明遗迹之一”(实体2),“是”(关系)。

开箱即用的GraphGPT

有了上面的实战经验,告诉我们利用大模型能够更好地进行知识图谱的处理,并且可以针对知识图谱的内容进行提问。如果觉得自己开发这样一套系统比较麻烦的同学,可以尝试使用Github上面开源的GraphGPT。

我把地址放在这里,https://github.com/varunshenoy/GraphGPT

GraphGPT 是一个用于将非结构化自然语言转换成知识图谱的项目。它可以接受各种类型的输入,例如电影剧情梗概、维基百科页面或视频转录,然后生成一个可视化图表来展示实体(Entities)之间的关系。GraphGPT 支持连续的查询,可以用于更新现有图谱的状态或创建全新的结构。

安装步骤

下载依赖项

运行npm install 来下载所需的依赖,当前只需要react-graph-vis。

获取OpenAI API密钥

确保您拥有一个OpenAI API密钥,这将用于在运行查询时输入。

启动项目

运行npm run start,GraphGPT应该会在新的浏览器标签页中打开。

通过这些步骤,您应该能够运行GraphGPT并开始将自然语言文本转换为知识图谱。

运行代码

根据上面的步骤运行代码之后,会在本地http://localhost:3000 打开一个网站,网站中需要输入知识图谱的文本,以及OpenAI 的Key。

大模型助力高效创建知识图谱

我们尝试输入要生成知识图谱的文字,然后点击“Generate”按钮,然后生成图形的关系。

大模型助力高效创建知识图谱

代码描述

这个开源项目是通过js 实现了大模型的调用,从而生成知识图谱。从下图的代码结构上看,主要的业务逻辑在App.js 文件和prompts 目录下面。

大模型助力高效创建知识图谱

在这个React应用中,主要的目的是通过GPT模型生成一个基于输入自然语言的知识图谱。我们把主要的函数(App.js)进行解释:

  • 导入依赖import './App.css'; // 导入CSS样式import Graph from "react-graph-vis"; // 导入react-graph-vis库,用于图的可视化
    import React, { useState } from "react"; // 导入React和useState钩子
  • 定义常量const DEFAULT_PARAMS = {...}; // GPT模型的默认参数
    const SELECTED_PROMPT = "STATELESS"; // 默认使用的提示类型const options = {...}; // 图的布局和样式选项
  • 主要函数组件 - Appfunction App() { const [graphState, setGraphState] = useState({...}); // 使用useState管理图的状态
    const clearState = () => {...}; // 清除图的状态
    const updateGraph = (updates) => {...}; // 更新图的状态
    const queryStatelessPrompt = (prompt, apiKey) => {...}; // 查询无状态的提示
    const queryStatefulPrompt = (prompt, apiKey) => {...}; // 查询有状态的提示
    const queryPrompt = (prompt, apiKey) => {...}; // 根据选择的提示类型进行查询
    const createGraph = () => {...}; // 创建图 return (<div className='container'> ... </div>); // 返回应用的JSX结构
    }
  • 清除图的状态 - clearStateconst clearState = () => {
    setGraphState({
    nodes: [],
    edges: []
    });
    };
    这个函数清除图的所有节点和边。
  • 更新图的状态 - updateGraphconst updateGraph = (updates) => {
    var current_graph = JSON.parse(JSON.stringify(graphState)); // 深拷贝当前图的状态
    // ...
    setGraphState(current_graph); // 设置新的图状态
    };
    这个函数负责根据提供的更新信息(节点、边、颜色等)来更新图的状态。
  • 与GPT API进行交互 - queryStatelessPrompt 和 queryStatefulPrompt这两个函数与GPT模型进行交互,获取模型生成的文本,并用这些信息更新图。
  • 创建图 - createGraph
const createGraph = () => {
 // ...
 queryPrompt(prompt, apiKey); // 调用queryPrompt进行图的生成
};
```
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

这个函数获取用户输入的提示和API密钥,然后调用`queryPrompt`函数生成图。

另外,又针对两种prompt状态生成两种不同的prompt文件:stateful.prompt和stateless.prompt都用于处理知识图谱中的实体和关系。stateful.prompt是状态感知的,会根据当前图的状态来添加或修改节点和边。适用于需要持续更新的场景。相对地,stateless.prompt是无状态的,只根据给定的提示生成一系列更新,与当前图的状态无关。适用于一次性或独立的更新任务。两者主要的区别在于是否需要考虑图的当前状态。

总结

文章阐述了知识图谱和大模型在现代信息处理和决策中无可替代的地位。从医疗诊断到金融风险评估,再到个性化推荐,知识图谱展示了其强大的应用潜力。同时,大型语言模型如GPT也在知识图谱的生成和查询中扮演了关键角色。借助大语言模型可以高效地创建知识图谱,还能灵活地进行实时更新和查询。本文对于任何希望将大数据和AI技术融入实际应用的人来说,都具有指导意义。

作者介绍

崔皓,51CTO社区编辑,资深架构师,拥有18年的软件开发和架构经验,10年分布式架构经验。



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器&hellip;&hellip;随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(18)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
Kimi爆了 国产大模型应用元年还远吗?
国产大模型应用Kimi近日可谓横空出世。根据Similarweb数据,Kimi智能助手的周度访问量由23年12月初的15万提升至近期(3.10-3.16)的超过200万,APP端下载量也快速提升,从2月初的效率...【详细内容】
2024-03-22  Search: 大模型  点击:(14)  评论:(0)  加入收藏
国产大模型开卷“比谁长”?Kimi爆火点燃长文本竞争赛道
来源:财联社近日,又一现象级AI应用Kimi爆火出圈,在用户端和资本市场都掀起波澜,引发多个Kimi相关概念股异常波动。海天瑞声(688787.SH)、中广天择(603721.SH)等上市公司纷纷回应“无...【详细内容】
2024-03-22  Search: 大模型  点击:(5)  评论:(0)  加入收藏
AI大模型之争远未落幕
吕归亚自2022年年底OpenAI发布聊天机器人ChatGPT3.0后,各大科技公司纷纷跟进推出各自的产品。经历了一年多高速推进且“万众瞩目”的发展后, ChatGPT依旧是行业内的标杆级存在...【详细内容】
2024-03-20  Search: 大模型  点击:(19)  评论:(0)  加入收藏
▌简易百科推荐
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(1)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(1)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中&mdash;&mdash;为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(1)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(2)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(2)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按&emsp;&emsp;从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下&hellip;&hellip;一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(5)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条