您当前的位置:首页 > 生活百科 > 职场

如何在面试中解释各种机器学习模型

时间:2020-06-23 10:53:09  来源:  作者:

从回归到SVM再到XGBoost的模型汇总

如何在面试中解释各种机器学习模型

> Created by katemangostar — www.freepik.com

 

在准备任何面试时,我想共享一个资源,为每个机器学习模型提供简要的说明。 它们的含义并不广泛,相反。 希望通过阅读本文,您将了解如何以简单的方式交流复杂的模型。

涵盖类型

· 线性回归

· 岭回归

· 套索回归

· 逻辑回归

· K最近的邻居

· 朴素贝叶斯

· 支持向量机

· 决策树

· 随机森林

· AdaBoost

· 梯度提升

· XGBoost

线性回归

线性回归涉及使用最小二乘法找到代表数据集的"最佳拟合线"。 最小二乘方法涉及找到一个线性方程,该方程使残差平方和最小。 残差等于实际负预测值。

举个例子,红线比绿线是最适合的更好的线,因为它离点更近,因此残差较小。

如何在面试中解释各种机器学习模型

> Image created by Author

 

岭回归

Ridge回归,也称为L2正则化,是一种引入少量偏差以减少过度拟合的回归技术。 它通过最小化残差平方和加罚分来实现,罚分等于λ乘以斜率平方。 Lambda是指罚分的严重性。

如何在面试中解释各种机器学习模型

 


如何在面试中解释各种机器学习模型

> Image Created by Author

 

如果没有罚分,则最佳拟合线的斜率会变陡,这意味着它对X的细微变化更敏感。通过引入罚分,最佳拟合线对X的细微变化变得较不敏感。 背后的岭回归。

套索回归

套索回归,也称为L1正则化,与Ridge回归相似。 唯一的区别是,罚分是使用斜率的绝对值计算的。

如何在面试中解释各种机器学习模型

 

逻辑回归

Logistic回归是一种分类技术,也可以找到"最合适的直线"。 但是,与线性回归不同的是,线性回归使用最小二乘方找到最佳拟合线,逻辑回归使用最大似然法找到最佳拟合线(逻辑曲线)。 这样做是因为y值只能是1或0。 观看StatQuest的视频,了解如何计算最大可能性。

如何在面试中解释各种机器学习模型

> Image Created by Author

 

K最近邻居

如何在面试中解释各种机器学习模型

> Image Created by Author

 

K最近邻居是一种分类技术,通过查看最近的分类点对新样本进行分类,因此称为" K最近"。 在上面的示例中,如果k = 1,则未分类的点将被分类为蓝点。

如果k的值太低,则可能会出现异常值。 但是,如果它太高,可能会忽略只有几个样本的类。

朴素贝叶斯

朴素贝叶斯分类器是一种受贝叶斯定理启发的分类技术,其陈述以下等式:

如何在面试中解释各种机器学习模型

 

由于朴素的假设(因此得名),变量在给定类的情况下是独立的,因此可以如下重写P(X | y):

如何在面试中解释各种机器学习模型

 

另外,由于我们要求解y,所以P(X)是一个常数,这意味着我们可以从方程中将其删除并引入比例。

因此,将每个y值的概率计算为给定y时xn的条件概率的乘积。

支持向量机

支持向量机是一种分类技术,可找到称为超平面的最佳边界,该边界用于分隔不同的类别。 通过最大化类之间的余量来找到超平面。

如何在面试中解释各种机器学习模型

> Image Created by Author

 

决策树

如何在面试中解释各种机器学习模型

 

决策树本质上是一系列条件语句,这些条件语句确定样本到达底部之前所采取的路径。 它们直观且易于构建,但往往不准确。

随机森林

随机森林是一种集成技术,这意味着它将多个模型组合为一个模型以提高其预测能力。 具体来说,它使用自举数据集和变量的随机子集(也称为装袋)构建了数千个较小的决策树。 拥有1000棵较小的决策树,随机森林使用"多数获胜"模型来确定目标变量的值。

如何在面试中解释各种机器学习模型

 

例如,如果我们创建一个决策树,第三个决策树,它将预测0。但是,如果我们依靠所有4个决策树的模式,则预测值为1。这就是随机森林的力量。

AdaBoost

AdaBoost是一种增强算法,类似于"随机森林",但有两个重要区别:

· AdaBoost通常不是由树木组成,而是由树桩组成的森林(树桩是只有一个节点和两片叶子的树)。

· 每个树桩的决定在最终决定中的权重不同。 总误差较小(准确度较高)的树桩具有较高的发言权。

· 创建树桩的顺序很重要,因为每个后续树桩都强调了在前一个树桩中未正确分类的样本的重要性。

梯度提升

Gradient Boost与AdaBoost类似,因为它可以构建多棵树,其中每棵树都是从前一棵树构建的。 与AdaBoost可以构建树桩不同,Gradient Boost可以构建通常具有8至32片叶子的树木。

更重要的是,Gradient与AdaBoost的不同之处在于构建决策树的方式。 梯度提升从初始预测开始,通常是平均值。 然后,基于样本的残差构建决策树。 通过采用初始预测+学习率乘以残差树的结果来进行新的预测,然后重复该过程。

XGBoost

XGBoost本质上与Gradient Boost相同,但是主要区别在于残差树的构建方式。 使用XGBoost,可以通过计算叶子与前面的节点之间的相似性得分来确定残差树,以确定哪些变量用作根和节点。

谢谢阅读!

希望在阅读完本文后,您将通过突出重点了解一下如何总结各种机器学习模型。 同样,这并不意味着要深入解释每篇文章的复杂性。 根据上面的总结,请随意学习所有不完全有意义的模型!

特伦斯·辛

ShinTwin的创始人| 让我们在LinkedIn上建立联系| 项目组合在这里。

(本文翻译自Terence S的文章《How to Explain Each machine Learning Model at an Interview》,参考:
https://towardsdatascience.com/how-to-explain-each-machine-learning-model-at-an-interview-499d82f91470)



Tags:机器学习模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
来源:Datawhale本文约5200字,建议阅读9分钟。本文用手绘图的方式讲解了机器学习模型构建的全流程。 周末在家无聊闲逛github,发现一个很有趣的开源项目,作者用手绘图的方式讲解...【详细内容】
2020-08-16  Tags: 机器学习模型  点击:(76)  评论:(0)  加入收藏
从回归到SVM再到XGBoost的模型汇总> Created by katemangostar — www.freepik.com 在准备任何面试时,我想共享一个资源,为每个机器学习模型提供简要的说明。 它们的含义...【详细内容】
2020-06-23  Tags: 机器学习模型  点击:(172)  评论:(0)  加入收藏
论文摘要任何给定的人工智能系统都不能被接受,除非它的可信度被证明。值得信赖的人工智能系统的一个重要特征是没有算法偏见。“个体歧视”存在于给定个体与另一个体仅在“...【详细内容】
2020-06-21  Tags: 机器学习模型  点击:(72)  评论:(0)  加入收藏
▌简易百科推荐
毕业后不重视自己的档案,等到考研、考编、考公务员、单位入职等需要用到档案时,才想起来查询自己的档案。但是,很多人查询档案没有经验,不知道该从何查起。下面给大家介绍查询个...【详细内容】
2021-12-23  帮帮团人力资源    Tags:个人档案   点击:(14)  评论:(0)  加入收藏
评职称可谓是工程人事业发展中的一件大事了,可以说一般想要在行业中持续地、更好地发展的人都会选择评个中级职称! 怎么评广东省建筑中级职称? 在评审时工程业绩最为重要。那...【详细内容】
2021-12-23  资深职称老师—小丽    Tags:职称   点击:(4)  评论:(0)  加入收藏
职场中,事情做得漂亮,不一定结局漂亮;但是善于谋人,把人打通了,出手一般就是巅峰。人情社会尤其如此,说到底工作是人定的,好不好也是人说的,有人为你说话,你就是能力强。没人看到你,工...【详细内容】
2021-12-22  胖子说职场经验    Tags:职场   点击:(4)  评论:(0)  加入收藏
一、在国企,能改变命运的只有你自己。你想改变,就总有办法。你认命,就不要埋怨命运不公。多少领导一样是从基层爬上去的。也许你会说,他们背后有人。我也不反对,但总有那么20%左...【详细内容】
2021-12-21  职场真谛    Tags:国企   点击:(6)  评论:(0)  加入收藏
又到年底了,有更好的工作选择?想跳槽?社保咋处理?以及社保需要注意的小问题是什么?一文全理清!一、打工人离职手册之社保全指南 二、需要注意的社保小问题 ...【详细内容】
2021-12-17  恒企会计网校    Tags:离职指南   点击:(6)  评论:(0)  加入收藏
在个案辅导中,也经常遇到公务员面试前的准备和辅导。首先,我其实挺想吐槽公考的笔试和考试机制的,让我先一吐为快。公务员考察的面非常多,从表达能力这种表面的,到价值观这种底层...【详细内容】
2021-12-14  为好优姐姐    Tags:公务员面试   点击:(12)  评论:(0)  加入收藏
公务员面试形式进行了创新,增加了结构化小组面试这一形式,在结构化的基础上增加了考试互评和回应的环节,这一改变增加了考试难度,也给许多考试造成了困惑,那今天就结构化小组的点...【详细内容】
2021-12-14  红河华图教育    Tags:公务员面试   点击:(14)  评论:(0)  加入收藏
在各级党政机构之中,我们经常会听到一个称呼——“常务副职”,例如县政府有常务副县长,组织部有常务副部长等等。其实,常务副职只是一个约定俗成的简称,其准确名称叫做...【详细内容】
2021-12-14  瑛杰小猪  今日头条  Tags:常务副职   点击:(19)  评论:(0)  加入收藏
在职场,什么都可以没有,就是不能没有情商。没有情商的人,在职场注定难成大器。人际关系搞不定,说话口无遮拦,为人处世更是不够圆滑,处处受限,处处是破绽。尤其是和领导相处,连对方的...【详细内容】
2021-12-14  第一桶金学派    Tags:领导   点击:(8)  评论:(0)  加入收藏
在职场,除了个人的工作能力以外,还要学会去不断的积累自己的人际关系。因为有了关系,就有了渠道,有了机会,有了方法,有了财富……越是和厉害的人交往,你自己也会变得越...【详细内容】
2021-12-10  第一桶金学派    Tags:职场   点击:(12)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条