您当前的位置：首页 > 电脑百科 > 人工智能

21 个必须知道的机器学习开源工具

时间：2019-12-04 11:31:37 来源：作者：

+ 加入收藏

作者 | SebastianScholl

译者 | 刘静，责编 | 郭芮

出品 | CSDN（ID：CSDNnews）

以下为译文：

你肯定已经了解流行的开源工具，如R、Python、Jupyter笔记本等。但是，除了这些流行的工具之外还有一个世界——一个隐藏在机器学习工具下的地方。这些并不像他们的同行那样出色，但可以成为许多机器学习任务的救星。

在本文中，我们将介绍21种用于机器学习的开源工具。我强烈建议你花一些时间浏览我提到的每个类别。除了我们通常在课程和视频中学到的东西之外，还有很多需要学习的地方。

1.向非程序员的开源机器学习工具

对于来自非编程和非技术背景的人来说，机器学习看起来很复杂。这是一个广阔的领域，我可以想象第一步可能会多么令人生畏。没有编程经验的人能否在机器学习中取得成功？

事实证明，你可以！这里有一些工具可以帮助你跨越鸿沟并进入著名的机器学习世界：

优步路德维希：路德维希允许我们训练和测试深度学习模型，而无需编写代码。您需要提供的只是一个包含数据的CSV文件，一个用作输入的列的列表，以及一个用作输出的列的列表——Ludwig将完成剩下的工作。
KNIME：KNIME允许您使用拖放界面创建整个数据科学工作流程。这种可视化实现整个模型工作流的方法非常直观，在处理复杂的问题陈述时非常有用。

Orange：您不必知道如何编码以便能够使用Orange挖掘数据，处理数据并获得洞察力。

有许多有趣的免费和开源软件可以提供很好的机器学习功能，而无需编写（大量）代码。

另一方面，你可以考虑一些开箱即用的付费服务，例如google AutoML、Azure Studio、Deep Cognition和Data Robot。

2.用于模型部署的开源机器学习工具

部署机器学习模型是最容易被忽视但重要的任务之一，它几乎肯定会在采访中出现，所以你可能也很熟悉这个话题。

以下是一些框架，可以更轻松地将你的项目部署到现实世界的设备中。

MLFlow：MLFlow被设计用于使用任何机器学习库或算法，并管理整个生命周期，包括实验、重现性和机器学习模型的部署。

Apple的CoreML：CoreML是一个流行的框架，它可用于将机器学习模型集成到你的IOS / Apple Watch / Apple TV / macOS应用程序中。关于CoreML的最好的部分是你不需要有关神经网络或机器学习的广泛知识，双赢！

TensorFlow Lite：TensorFlow Lite是一组工具，可帮助开发人员在移动设备（Android和iOS），嵌入式和物联网设备上运行TensorFlow模型。
TensorFlow.JS - TensorFlow.JS可以成为你在网络上部署机器学习模型的首选。它是一个开源库，可让你在浏览器中构建和训练机器学习模型。

适用于大数据的开源机器学习工具

大数据是一个研究如何分析、系统地从数据集中提取信息，或者处理传统数据处理应用软件无法处理的太大或太复杂的数据集的领域。想象一下，每天处理数百万条推文进行情感分析。这是一项艰巨的任务，不是吗？

别担心！这里有一些工具可以帮助你处理大数据。

Hadoop：使用大数据最重要和最相关的工具之一是Hadoop项目。Hadoop是一个框架，它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。

Spark：Apache Spark被认为是Hadoop用于大数据应用程序的自然继承者。这个开源大数据工具的关键点在于它填补了Apache Hadoop在数据处理方面的空白。有趣的是，Spark可以处理批量数据和实时数据。
Neo4j：对于所有与数据相关的大问题，Hadoop可能不是明智的选择。例如，当你需要处理大量网络数据或图形相关问题（如社交网络或人口统计模式）时，图形数据库可能是最佳选择。

4.用于计算机视觉，NLP和音频的开源机器学习工具

“如果我们想要机器思考，我们需要教他们看。”——Fei-Fei Li博士的计算机视觉。

SimpleCV：如果你从事任何计算机视觉项目，必须使用OpenCV。但你有遇到过SimpleCV吗？SimpleCV可以访问几个高性能的计算机视觉库，如OpenCV——无需首先了解位深度、文件格式、色彩空间、缓冲区管理、特征值或矩阵与位图存储，这使计算机视觉变得简单。

Tesseract OCR：你是否使用过创意应用程序，通过使用智能手机的相机扫描文档或购物账单，或者仅仅通过给支票拍照就可以把钱存入银行账户？所有这些应用程序都称之为OCR或光学字符识别软件。Tesseract就是这样一种OCR引擎，能够识别100多种语言，也可以训练识别其他语言。
Detectron：Detectron是Facebook AI Research的软件系统，它实现了最先进的物体检测算法，包括Mask R-CNN。它是用Python编写的，由Caffe2深度学习框架提供支持。

StanfordNLP：StanfordNLP是一个Python自然语言分析包，关于这个库的最好的部分就是它支持超过70种人类语言！

BERT即服务：你们所有的NLP爱好者都会听说过BERT这一来自谷歌的突破性NLP架构，但你可能还没有遇到过这个非常有用的项目。Bert-as-a-service使用BERT作为句子编码器，并通过ZeroMQ将其作为服务托管，允许你仅用两行代码将句子映射到固定长度的表示形式。
Google Magenta：此库提供了用于处理源数据（主要是音乐和图像）的实用程序，使用此数据来训练机器学习模型，最后从这些模型生成新内容。
LibROSA：LibROSA是一个用于音乐和音频分析的Python包。它提供了创建音乐信息检索系统所需的构建块。当我们使用深度学习等语音到文本的应用程序时，它在音频信号预处理中被大量使用。

5.用于强化学习的开源工具

当谈到机器学习时，RL是最近的热门话题。强化学习（RL）的目标是培养能够与环境互动并解决复杂任务的智能代理，实现机器人、自动驾驶汽车等领域的实际应用。以下是一些对RL最有用的培训环境：

谷歌研究足球：谷歌研究足球环境是一个新颖的RL环境，代理商的目标是掌握世界上最受欢迎的运动——足球。这种环境为你提供了大量的控制来训练RL代理。
OpenAI Gym：Gym是一个用于开发和比较强化学习算法的工具包。它支持教学代理从步行到玩乒乓球或弹球戏等游戏。在下面的gif图片中，你可以看到一个正在学习走路的机器人。

Unity ML代理：Unity机器学习代理工具包（ML-Agents）是一个开放源码Unity插件，可以将游戏和模拟作为培训智能代理的环境。通过一个简单易用的Python API，可以使用强化学习、模仿学习、神经进化或其他机器学习方法来训练agent。

Malmo项目：Malmo平台是一个基于Minecraft构建的复杂AI实验平台，旨在支持人工智能的基础研究，由Microsoft开发。

6.最后指出

正如上面的一组工具可以明显看出，当我们考虑数据科学和人工智能相关的项目时，开源是一条正确的道路。我可能只是触及了冰山一角，但是有许多工具可用于各种任务，使你作为数据科学家的生活更轻松，你只需要知道在哪里查找即可。

你认为哪些工具应该列在这个清单上？在下面写下你的最爱，以便社区了解！

原文：https://medium.com/analytics-vidhya/21-must-know-open-source-tools-for-machine-learning-you-probably-arent-using-but-should-f605b94d9b06

本文为 CSDN 翻译，转载请注明来源出处。

【END】

Tags：机器学习点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

AI系统中（机器学习算法）导致偏差的原因总结

基于算法的业务或者说AI的应用在这几年发展得很快。但是，在实际应用的场景中，我们经常会遇到一些非常奇怪的偏差现象。例如，Facebook将黑人标记为灵长类动物、城市图像识别系统...【详细内容】

2021-11-08　　Tags: 机器学习点击:(32)　　评论:(0)　　加入收藏

这725个机器学习术语表，太全了

这是几位机器学习权威专家汇总的725个机器学习术语表，非常全面了，值得收藏！英文术语中文翻译 0-1 Loss Function 0-1损失函数 Accept-Reject Samplin...【详细内容】

2021-10-21　　Tags: 机器学习点击:(43)　　评论:(0)　　加入收藏

程序员10 个入门级的机器学习开源项目

要开始为开源项目做贡献，有一些先决条件：1. 学习一门编程语言：由于在开源贡献中你需要编写代码才能参与开发，你需要学习任意一门编程语言。根据项目的需要，在后期学习另一种语言...【详细内容】

2021-10-20　　Tags: 机器学习点击:(37)　　评论:(0)　　加入收藏

人工智能、机器学习领域13个常见概念

作者：阿米特·V. 乔希（Ameet V Joshi）来源：华章科技 01 人工智能艾伦·图灵（Alan Turing）对人工智能的定义如下：如果窗帘后面有一台机器，并且有人正在与之互动（无论以何...【详细内容】

2021-09-07　　Tags: 机器学习点击:(76)　　评论:(0)　　加入收藏

字节跳动开源云原生机器学习平台 Klever

字节跳动基础架构团队基于火山引擎机器学习平台 Clever 及其丰富的行业落地经验，推出开源项目 Klever，以工程化的方式降低智能技术落地门槛，助力企业快速打造智能业务。作者：陈...【详细内容】

2021-02-19　　Tags: 机器学习点击:(170)　　评论:(0)　　加入收藏

机器学习算法中如何执行回归数据的特征选择

特征选择是识别和选择与目标变量最相关的输入变量子集的过程。特征选择最简单的情况可能是存在数字输入变量和用于回归预测建模的数字目标的情况。这是因为可以计算出每个输...【详细内容】

2021-01-15　　Tags: 机器学习点击:(117)　　评论:(0)　　加入收藏

轻松理解机器学习算法：Adaboost算法

1、集成学习及Boosting算法集成学习属于机器学习，它是一种“训练思路”，并不是某种具体的方法或者算法。集成学习的核心思想是把已有的算法进行结合，从而得到更好的效果。集成...【详细内容】

2020-12-29　　Tags: 机器学习点击:(176)　　评论:(0)　　加入收藏

Python迁移学习：机器学习算法

“终有一天，人工智能会像我们看待非洲平原上低级生物的化石一样看待我们。在人工智能眼中，人类只是直立行走的猿猴，用着粗糙的语言和简陋的工具，从诞生起就注定会灭绝。”&mdash...【详细内容】

2020-12-17　　Tags: 机器学习点击:(147)　　评论:(0)　　加入收藏

一款强大的机器学习可视化IDE

专注Python、AI、大数据，请关注公众号七步编程！人工智能方向的项目，和数据可视化是紧密相连的。模型训练过程中梯度下降过程是什么样的？损失函数的走向如何？训练模型的准确度怎么...【详细内容】

2020-10-15　　Tags: 机器学习点击:(357)　　评论:(0)　　加入收藏

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

在数据领域，很多人都在说机器学习，但是只有很少的人能说清楚怎么回事。网上关于机器学习的文章，大多都是充斥各种定理的厚重学术三部曲(我搞定半个定理都够呛)，或是关于人工智能...【详细内容】

2020-09-25　　Tags: 机器学习点击:(111)　　评论:(0)　　加入收藏

▌简易百科推荐

可解释的AI (XAI)：如何使用LIME 和 SHAP更好地解释模型的预测

作为数据科学家或机器学习从业者，将可解释性集成到机器学习模型中可以帮助决策者和其他利益相关者有更多的可见性并可以让他们理解模型输出决策的解释。在本文中，我将介绍两个...【详细内容】

2021-12-17　　deephub　　　　Tags:AI 　点击:(16)　　评论:(0)　　加入收藏

AI系统中（机器学习算法）导致偏差的原因总结

2021-11-08　　数据学习DataLearner　　　　Tags:机器学习　点击:(32)　　评论:(0)　　加入收藏

人工智能会超过人类吗？顶尖科学家：人工智能在常识判断方面具有局限

11月2日召开的世界顶尖科学家数字未来论坛上，2013年诺贝尔化学奖得主迈克尔·莱维特、2014年诺贝尔生理学或医学奖得主爱德华·莫索尔、2007年图灵奖得主约瑟夫·斯发斯基、1986年图灵奖得主约翰·霍普克罗夫特、2002...【详细内容】

2021-11-03　　张淑贤　　证券时报　　Tags:人工智能　点击:(39)　　评论:(0)　　加入收藏

火爆业界的边缘计算，到底是什么？

鉴于物联网设备广泛部署、5G快速无线技术闪亮登场，把计算、存储和分析放在靠近数据生成的地方来处理，让边缘计算有了用武之地。边缘计算正在改变全球数百万个设备处理和传输...【详细内容】

2021-10-26　　　　计算机世界　　Tags:边缘计算　点击:(45)　　评论:(0)　　加入收藏

这725个机器学习术语表，太全了

2021-10-21　　Python部落　　　　Tags:机器学习　点击:(43)　　评论:(0)　　加入收藏

程序员10 个入门级的机器学习开源项目

2021-10-20　　TSINGSEE青犀视频　　　　Tags:机器学习　点击:(37)　　评论:(0)　　加入收藏

Logistic Regression：最基础的神经网络

SimpleAI.人工智能、机器学习、深度学习还是遥不可及？来这里看看吧~ 从基本的概念、原理、公式，到用生动形象的例子去理解，到动手做实验去感知，到著名案例的学习，到用所学来实现...【详细内容】

2021-10-19　　憨昊昊　　　　Tags:神经网络　点击:(47)　　评论:(0)　　加入收藏

直击痛点 NLP技术的价值和落地｜超级观点

语言是人类思维的基础，当计算机具备了处理自然语言的能力，才具有真正智能的想象。自然语言处理（Natural Language Processing, NLP）作为人工智能（Artificial Intelligence, AI）的核心技术之一，是用计算机来处理、理解以及运...【详细内容】

2021-10-11　　　　36氪　　Tags:NLP 　点击:(49)　　评论:(0)　　加入收藏

边缘计算是个啥？为什么说发展5G离不开它？

边缘计算是什么？近年来，物联网设备数量呈线性增长趋势。根据艾瑞测算， 2020年，中国物联网设备的数量达74亿，预计2025年突破150亿个。同时，设备本身也变得越来越智能化，AI与互联网在...【详细内容】

2021-09-22　　汉智兴科技　　　　Tags: 　点击:(55)　　评论:(0)　　加入收藏

学了这些基础算法，人工智能就算入门了

说起人工智能，大家总把它和科幻电影中的机器人联系起来，而实际上这些科幻场景与现如今的人工智能没什么太大关系。人工智能确实跟人类大脑很相似，但它们的显著差异在于人工智能...【详细内容】

2021-09-17　　异步社区　　　　Tags:人工智能　点击:(57)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游