您当前的位置：首页 > 电脑百科 > 人工智能

人工智能、机器学习领域13个常见概念

时间：2021-09-07 15:15:49 来源：华章科技作者：阿米特·V. 乔希

+ 加入收藏

作者：阿米特·V. 乔希（Ameet V Joshi）

来源：华章科技

01 人工智能

艾伦·图灵（Alan Turing）对人工智能的定义如下：

如果窗帘后面有一台机器，并且有人正在与之互动（无论以何种方式，例如音频或打字等），并且如果该人觉得他正在与另一个人互动，那么这台机器就是人工智能的。

这是定义AI的一种非常独特的方式。它并不直接针对智能的概念，而是专注于类人的行为。事实上，这一目标的范围甚至比单纯的智能更为广泛。从这个角度来看，AI并不意味着要建造一台可以立即解决任何问题的超智能机器，而是要建造一台能模仿人类行为的机器。

然而，仅仅制造模仿人类的机器听起来并不有趣。从现代角度来看，每当我们谈到AI时，指的是能够执行以下一项或多项任务的机器：理解人类语言，执行涉及复杂操纵的机械任务，在很短的时间内解决可能涉及大量数据的基于计算机的复杂问题，并以类人的方式回复答案，等等。

电影《2001：太空漫游》中描述的超级计算机HAL非常接近现代AI的观点。它是一台机器，能够处理各种来源的大量数据，并以极快的速度生成对其的见解和总结，并且能够以类人的交互方式（如语音对话）将这些结果传达给人类。

从类人行为的角度来看，人工智能有两个方面。一方面，机器是智能的并且能够与人类交流，但是没有任何运动功能。HAL就是这类人工智能的例子。另一方面，涉及与类人的运动能力的物理交互，这涉及机器人领域。

02 机器学习

术语“机器学习”或简称ML（machine Learning），是亚瑟·塞缪尔（Arthur Samuel）在1959年用机器解决跳棋游戏的背景下提出的。该术语指的是一种计算机程序，它可以学习产生一种行为，而这种行为不是由程序的作者明确编程实现的。相反，它能够显示出作者可能完全没有意识到的行为。

这种行为的学习基于三个因素：

程序消耗的数据；
量化当前行为和理想行为之间的误差或某种形式的距离的度量；
使用量化误差指导程序在后续事件中产生更好行为的反馈机制。

可以看出，第二个和第三个因素很快使这个概念变得抽象，并强调其深层的数学根源。机器学习理论中的方法对于构建人工智能系统至关重要。

机器学习算法大致分为三种类型：

监督学习算法
无监督学习算法
强化学习算法。

让我们详细了解每种类型。

03 监督学习

为简单起见，让我们将机器学习系统看作一个黑盒，在给定一些输入时会产生些输出。如果我们已经有一个历史数据，该历史数据包含一组输入的一组输出，则基于这些数据的学习称为监督学习。

监督学习的一个经典示例是分类。假设我们已经测量了3种不同类型的花（ Setosa山鸢尾、 Versicolor变色鸢尾、 Virginica弗吉尼亚鸢尾）的4种不同的属性（尊片长度、尊片宽度、花瓣长度和花瓣宽度）。

我们对每种花的25种不同示例进行了测量。然后，这些数据将用作训练数据，其中有可用于训练模型的输入（4个测量的属性）和相应的输出（花的类型）。然后以监督的方式训练合适的机器学习模型。一旦模型被训练好，就可以根据萼片和花瓣的尺寸对任何花（在三种已知类型之间）进行分类。

04 无监督学习

在无监督学习范式中，标记数据是不可用的。无监督学习的一个经典例子是“聚类”。考虑与前面小节中描述的相同示例，在该示例中，我们对三种类型的花的萼片和花瓣尺寸进行了测量。但是，在本例中，我们没有每组测量的花的确切名称。我们所拥有的只是一组测量值。此外，我们被告知这些测量值属于三种不同类型的花。

在这种情况下，可以使用无监督学习技术自动识别三组测量值（所属的）类簇。但是，由于标签未知，我们所能做的就是将每个类簇称为flower-type-1、flower-type-2和flower-type-3。如果给出一组新的测量值，我们可以找到它们最接近的类簇，并将它们归类为其中之一。

05 强化学习

强化学习是一种特殊的学习方法，需要与监督和无监督方法分开对待。强化学习涉及来自环境的反馈，因此它并不是完全无监督的，但是，它也没有一组可用于训练的标记样本，因此不能将其视为有监督的。在强化学习方法中，系统不断地与环境进行交互以寻求产生期望的行为，并从环境中获取反馈。

06 静态学习

划分机器学习方法的另一种方式是根据它们处理的数据类型进行分类。接收静态标记数据的系统称为静态学习方法。处理随时间不断变化的数据的系统称为动态方法。每种方法都可以是有监督的，也可以是无监督的，但是，强化学习方法始终是动态的。

静态学习是指对作为单个快照获取的数据进行学习，并且数据的属性随时间保持不变。一旦在数据上训练了模型（使用监督学习或无监督学习），就可以在将来的任何时间将训练后的模型应用于类似的数据，而且该模型仍然有效，并将按预期执行。典型的例子是不同动物的图像分类。

07 动态学习

这也称为基于时间序列的学习。这类问题中的数据对时间敏感，会随着时间不断变化。因此，模型训练不是一个静态的过程，而是需要不断地（或在每个合理的时间窗口之后）对模型进行训练，以保持有效。

此类问题的典型例子是天气预报或股票市场预测。一年前训练过的模型对于预测明天的天气或预测明天任何股票的价格将完全无用。两种类型的根本区别在于状态的概念。在静态模型中，模型的状态是不变的，而在动态模型中，模型的状态是时间的函数，它在不断变化。

08 维数

在处理各种数据集时，维数通常是一个令人困惑的概念。从物理角度看，维度是空间维度：长度、宽度和高度。（为了简单起见，我们不把时间当作第四维度来深入研究物理学。）在任何现实生活的场景中，我们遇到的都不超过这三个维度。

但是，当我们处理用于机器学习的数据时，通常有几十个、数百个甚至更多个维度。为了理解这些高维度，我们需要研究维度的基本性质。

空间维度的定义使得每个维度都与其他两个维度垂直或正交。这种正交性对于三维空间中的所有点都有唯一表示至关重要。如果维度不是互相正交的，则空间中的相同点可以具有多种表示形式，并且基于此的整个数学计算将失败。

例如，如果我们将三个坐标设置为长度、宽度和高度，并具有任意的原点（原点的精确位置仅会更改坐标值，但不会影响唯一性属性，因此只要它在整个计算过程中保持不变，任何原点的选择都是可以的。）

坐标（0,0,0）标记原点本身的位置。坐标（1,1,1）将标记一个点空间，该点空间在每个维度中均距原点1个单位，并且是唯一的。没有其他坐标系可以表示空间中的相同位置。

现在，让我们将这个概念扩展到更高的维度。在数学上添加更多的维度相对容易，但是很难在空间上可视化它们。如果我们添加第四个维度，则它必须与之前的所有三个维度都正交。在这样的四维空间中，原点的坐标为（0,0,0,0）。三维空间中的点（1,1,1）可以在四维空间中具有坐标（1,1,1,0）。

只要确保正交性，就可以保证坐标的唯一性。同样地，我们可以有任意数量的维度，所有的数学计算仍然成立。

考虑前面描述的鸢尾花数据示例。输入有4个特征：萼片和花瓣的长度和宽度。由于这4个特征相互独立，所以它们可以看作是正交的。因此，当使用鸢尾花数据解决问题时，我们实际上是在处理四维输入空间。

09 维数灾难

即使从数学的角度来看，增加任意数量的维度都是可以的，但是仍然存在一个问题。随着维度的增加，数据的密度呈指数下降。

例如，如果我们在训练数据中有1000个数据点，并且数据具有3个独有的特征。假设所有特征的值在1～10之间。所有这1000个数据点都位于一个大小为10×10×10的立方体中。因此，密度为1000/1000或每单位立方体1个样本。如果有5个独有的特征而不是3个，那么数据的密度很快就会下降到每单位5维立方体0.01个样本。

数据的密度很重要，因为数据的密度越高，找到一个好模型的可能性就越大，模型准确性的置信度就越高。如果密度很低，则使用该数据的训练模型的置信度就会很低。因此，尽管高维在数学上是可以接受的，但是人们需要注意维数，以便能够开发出具有高置信度的良好的机器学习模型。

10 奥卡姆剃刀原理

在开发和应用机器学习模型时，总是会遇到多种可能的解决方案和多种可能的方法来获得答案。很多时候，对于哪种解决方案或哪种方法比其他方法更好，没有任何理论指导。在这种情况下，奥卡姆剃刀原理的概念（有时也称为简约原则）可以有效地应用。该原理指出：

一个人不应该做出超过最低需求的假设，或者换句话说，当一个解决方案有多种选择时，最简单的方法就是最好的。

这个原理不完全是一个定理，不能作为一个定量规则或方程来应用。但是，在现实生活中做出这样的决定时，它是一个强有力的有效的概念指南。

还需要注意的是，这条规则创建了一种折中的形式，一方面，我们拥有更多复杂性形式的信息，另一方面，我们却拥有更少的简单性形式的信息。人们不应该过于简单化问题，以致丢失一些核心信息。奥卡姆剃刀原理的另一个衍生方面是更简单的解决方案往往具有更多的泛化能力。

11 “没有免费的午餐”定理

在设计机器学习系统时，需要注意的另一个有趣的概念来自Wolpert和Macready的论文，其形式是“没有免费的午餐”定理或优化中的NFL定理。该定理实质上指出：

如果一个算法在某类问题上表现得更好，那么它会以在其他类别的问题上性能下降的形式付出代价。换句话说，对于所有类型的问题，你都无法拥有单一最佳的解决方案。

这个定理需要更多地作为指导原则而不是定律，因为在所有可能的问题类别中，一个设计良好的算法完全有可能胜过其他设计不太好的算法。但是，在实际情况下可以从这个定理推断出，我们不能对所有的问题都采用同一个解决方案，并期望它在所有的情况下都能很好地工作。

12 收益递减规律

收益递减规律通常出现在经济和商业场景中。它指出，随着现有员工人数的增加，增加更多的员工来完成一项工作开始产生越来越少的收益。

从机器学习的角度来看，这一规律可以应用于特征工程。从给定的数据集中，人们只能提取一定数量的特征，在此之后，性能上的收益开始减少，付出的努力是不值得的。在某些方面，它与奥卡姆剃刀原理一致，并增加了更多的细节。

13 专家系统

在机器学习开始真正意义上的商业化之前，很少有其他系统已经突破常规计算的边界。其中一个显著的应用是专家系统。

艾伦·图灵的定义标志着机器智能被认可的时代的开始，人工智能领域也随之诞生。然而，在早期（一直到20世纪80年代），机器智能或机器学习领域仅限于所谓的专家系统或基于知识的系统。专家系统领域的顶尖专家之一，Edward Feigenbaum博士，曾经这样定义专家系统：

一种智能计算机程序，使用知识和推理过程来解决很难解决的以至于需要大量的人类专业知识才能解决的问题。

这种系统能够替代某些领域的专家。这些机器经过编程，用于执行基于复杂逻辑运算的复杂启发式任务。

尽管这些系统能够取代特定领域的专家，但如果我们将其与人类智能进行比较，就会发现它们并不是真正意义上的“智能”系统。原因是系统被“硬编码”为仅解决特定类型的问题，如果需要解决一个更简单但完全不同的问题，这些系统将很快变得完全无用。

尽管如此，这些系统还是非常流行和成功的，特别是在需要重复但高度精确的性能的领域，例如诊断、检查、监测和控制。

关于作者：Ameet V.Joshi，博士，目前是微软的一名数据科学经理。他于2006年在密歇根州立大学获得博士学位。他拥有超过15年的机器学习算法开发方面的经验，涉及各种不同的工业领域，包括管道检查、家庭能源分解、微软Cortana智能和CRM中的商务智能。

本文摘编自《机器学习与人工智能：从理论到实践》，经出版方授权发布。

Tags：人工智能点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

人工智能会超过人类吗？顶尖科学家：人工智能在常识判断方面具有局限

11月2日召开的世界顶尖科学家数字未来论坛上，2013年诺贝尔化学奖得主迈克尔·莱维特、2014年诺贝尔生理学或医学奖得主爱德华·莫索尔、2007年图灵奖得主约瑟夫·斯发斯基、1986年图灵奖得主约翰·霍普克罗夫特、2002...【详细内容】

2021-11-03　　Tags: 人工智能点击:(39)　　评论:(0)　　加入收藏

学了这些基础算法，人工智能就算入门了

说起人工智能，大家总把它和科幻电影中的机器人联系起来，而实际上这些科幻场景与现如今的人工智能没什么太大关系。人工智能确实跟人类大脑很相似，但它们的显著差异在于人工智能...【详细内容】

2021-09-17　　Tags: 人工智能点击:(57)　　评论:(0)　　加入收藏

人工智能、机器学习领域13个常见概念

作者：阿米特·V. 乔希（Ameet V Joshi）来源：华章科技 01 人工智能艾伦·图灵（Alan Turing）对人工智能的定义如下：如果窗帘后面有一台机器，并且有人正在与之互动（无论以何...【详细内容】

2021-09-07　　Tags: 人工智能点击:(74)　　评论:(0)　　加入收藏

如何进入人工智能行业，需要哪些知识体系？

人工智能看似是这几年才流行起来的一个新技术行业，但是人工智能不是一门新学科，它的学科发展已经有了60多年的历史了。如果想要入门人工智能行业，那么你需要学习的知识将会非...【详细内容】

2021-06-16　　Tags: 人工智能点击:(125)　　评论:(0)　　加入收藏

人工智能发展简史——从理论走向应用

起源阶段（1943-1969）1943年，神经科学家麦卡洛克(W.S.McCilloch) 和数学家皮兹（W.Pitts）建立了神经网络和数学模型，称为M-P模型，即两个人的名字的合称McCulloch-Pitts。这个模型是对...【详细内容】

2021-06-15　　Tags: 人工智能点击:(132)　　评论:(0)　　加入收藏

人工智能神经网络中的基础概念有哪些？

理解什么是人工智能，以及机器学习和深度学习如何影响它，是一种不同凡响的体验。在 Mate Labs 我们有一群自学有成的工程师，希望本文能够分享一些学习的经验和捷径，帮助机器学习...【详细内容】

2021-06-09　　Tags: 人工智能点击:(128)　　评论:(0)　　加入收藏

世界十大最顶尖人工智能国家有哪些？

韩国著名研究机构IITP（2019年）曾经对外发布了一组调研数据，通过科研专家进行的问卷调查，将全世界范围内的AI强国来了一次评分排座次，最终结果显示中国位列全球第三，第一、二名分别...【详细内容】

2021-05-18　　Tags: 人工智能点击:(402)　　评论:(0)　　加入收藏

人工智能在网络安全领域中的应用场景

人工智能在各个行业中广泛应用，并且对很多行业都起到了一定的改善作用，同时在各个行业中的应用场景也是大不相同的。那么人工智能在网络安全领域中的应用场景有哪些？人工智能在...【详细内容】

2021-05-12　　Tags: 人工智能点击:(183)　　评论:(0)　　加入收藏

人工智能再发达，这三种职业也不会被代替，薪资高有前途

未来20年，这种工作不可代替，无需担心会失业随着人工智能的发展，已经有很多职业被代替了，尤其是电销行业，在过去需要人工来拨打推销电话，每天差不多最多能够拨打200通电话，这种工作...【详细内容】

2021-05-10　　Tags: 人工智能点击:(139)　　评论:(0)　　加入收藏

15张图表带你速览2021人工智能最新趋势

「中国人工智能研究论文总数已经超过了美国，成为全球第一」「人工智能初创企业获得的资本青睐越来越少」「主流NLP系统也存在种族歧视」这些话题都出自斯坦福大学Human-Cent...【详细内容】

2021-04-20　　Tags: 人工智能点击:(202)　　评论:(0)　　加入收藏

▌简易百科推荐

可解释的AI (XAI)：如何使用LIME 和 SHAP更好地解释模型的预测

作为数据科学家或机器学习从业者，将可解释性集成到机器学习模型中可以帮助决策者和其他利益相关者有更多的可见性并可以让他们理解模型输出决策的解释。在本文中，我将介绍两个...【详细内容】

2021-12-17　　deephub　　　　Tags:AI 　点击:(15)　　评论:(0)　　加入收藏

AI系统中（机器学习算法）导致偏差的原因总结

基于算法的业务或者说AI的应用在这几年发展得很快。但是，在实际应用的场景中，我们经常会遇到一些非常奇怪的偏差现象。例如，Facebook将黑人标记为灵长类动物、城市图像识别系统...【详细内容】

2021-11-08　　数据学习DataLearner　　　　Tags:机器学习　点击:(32)　　评论:(0)　　加入收藏

人工智能会超过人类吗？顶尖科学家：人工智能在常识判断方面具有局限

2021-11-03　　张淑贤　　证券时报　　Tags:人工智能　点击:(39)　　评论:(0)　　加入收藏

火爆业界的边缘计算，到底是什么？

鉴于物联网设备广泛部署、5G快速无线技术闪亮登场，把计算、存储和分析放在靠近数据生成的地方来处理，让边缘计算有了用武之地。边缘计算正在改变全球数百万个设备处理和传输...【详细内容】

2021-10-26　　　　计算机世界　　Tags:边缘计算　点击:(45)　　评论:(0)　　加入收藏

这725个机器学习术语表，太全了

这是几位机器学习权威专家汇总的725个机器学习术语表，非常全面了，值得收藏！英文术语中文翻译 0-1 Loss Function 0-1损失函数 Accept-Reject Samplin...【详细内容】

2021-10-21　　Python部落　　　　Tags:机器学习　点击:(43)　　评论:(0)　　加入收藏

程序员10 个入门级的机器学习开源项目

要开始为开源项目做贡献，有一些先决条件：1. 学习一门编程语言：由于在开源贡献中你需要编写代码才能参与开发，你需要学习任意一门编程语言。根据项目的需要，在后期学习另一种语言...【详细内容】

2021-10-20　　TSINGSEE青犀视频　　　　Tags:机器学习　点击:(37)　　评论:(0)　　加入收藏

Logistic Regression：最基础的神经网络

SimpleAI.人工智能、机器学习、深度学习还是遥不可及？来这里看看吧~ 从基本的概念、原理、公式，到用生动形象的例子去理解，到动手做实验去感知，到著名案例的学习，到用所学来实现...【详细内容】

2021-10-19　　憨昊昊　　　　Tags:神经网络　点击:(47)　　评论:(0)　　加入收藏

直击痛点 NLP技术的价值和落地｜超级观点

语言是人类思维的基础，当计算机具备了处理自然语言的能力，才具有真正智能的想象。自然语言处理（Natural Language Processing, NLP）作为人工智能（Artificial Intelligence, AI）的核心技术之一，是用计算机来处理、理解以及运...【详细内容】

2021-10-11　　　　36氪　　Tags:NLP 　点击:(48)　　评论:(0)　　加入收藏

边缘计算是个啥？为什么说发展5G离不开它？

边缘计算是什么？近年来，物联网设备数量呈线性增长趋势。根据艾瑞测算， 2020年，中国物联网设备的数量达74亿，预计2025年突破150亿个。同时，设备本身也变得越来越智能化，AI与互联网在...【详细内容】

2021-09-22　　汉智兴科技　　　　Tags: 　点击:(54)　　评论:(0)　　加入收藏

学了这些基础算法，人工智能就算入门了

2021-09-17　　异步社区　　　　Tags:人工智能　点击:(57)　　评论:(0)　　加入收藏

推荐资讯

远程软件发展迅猛，ToDe	倒计时！企业QQ即将下架
极简Windows11与iPhon	iPhone信号问题，花10元
惊人数据：App Store中4	个人所得税递延纳税报
非常实用的 Python 库	等离子电视技术先进，为