程序员10 个入门级的机器学习开源项目

时间：2021-10-20 09:35:28 来源：作者：TSINGSEE青犀视频

要开始为开源项目做贡献，有一些先决条件：

1. 学习一门编程语言：由于在开源贡献中你需要编写代码才能参与开发，你需要学习任意一门编程语言。根据项目的需要，在后期学习另一种语言很容易。

2. 熟悉版本控制系统：这些软件工具有助于将所有更改保存在一个地方，以便在需要时在稍后阶段调用它们。基本上，它们会跟踪在源代码中随时间所做的每一次修改。一些流行的版本控制系统是 Git、Mercurial、CVS 等。其中，Git 是业界最流行和广泛使用的。今天我们来介绍适合AI程序员入门的10个开源机器学习项目。

1. Caliban

这是科技巨头google的机器学习项目。它用于在隔离且可重现的计算环境中开发机器学习研究工作流和笔记本。它解决了一个大问题。当开发人员在构建数据科学项目时，很多时候很难构建一个可以在现实生活中展示项目的测试环境。因此，Caliban 是解决此问题的潜在解决方案。

Caliban 可以轻松地在本地开发任何 ML 模型，在机器上运行代码，然后在云端环境中尝试完全相同的代码以在大型机器上执行。因此，Dockerized 研究工作流在本地和云端都变得简单。

2. Kornia

Kornia 是 PyTorch 的计算机视觉库。它用于解决一些通用的计算机视觉问题。Kornia 建立在 PyTorch 之上，依靠它的效率和 CPU 能力来计算复杂的函数。

Kornia 是一组用于训练神经网络模型和执行图像变换、图像过滤、边缘检测、对极几何、深度估计等的库。

3. Analytics Zoo

Analytics Zoo 是一个统一的数据分析和人工智能平台，它将 TensorFlow、Keras、PyTorch、Spark、Flink 和 Ray 程序整合到一个集成管道中。这可以有效地从笔记本电脑扩展到大型集群以处理大数据的生产。该项目由 Intel-analytics 维护。

Analytics Zoo 通过以下方式帮助 AI 解决方案：

帮助轻松制作 AI 模型原型。
缩放得到有效管理。
有助于将自动化流程添加到您的 ML 管道中，例如特征工程、模型选择等。

4. MLJAR 人类自动化机器学习

Mljar 是一个创建原型模型和部署服务的平台。为了找到最佳模型，Mljar 搜索不同的算法并执行超参数调整。它通过在云中运行所有计算并最终创建集成模型来提供有趣的快速结果。然后它会从 AutoML 培训中构建一份报告。这不是很酷吗？

Mljar 有效地训练用于二元分类、多类分类、回归的模型。

它提供两种接口：

它可以在您的网络浏览器上运行 ML 模型
在 Mljar API 上提供 Python 包装器。

从 Mljar 收到的报告包含表格，其中包含有关每个模型分数和训练每个模型所需时间的信息。性能显示为散点图和箱线图，因此很容易直观地检查哪些算法在所有算法中表现最佳。

5.DeepDetect

DeepDetect 是一个用 C++ 编写的机器学习 API 和服务器。如果想使用最先进的机器学习算法并希望将它们集成到现有应用程序中，那么 DeepDetect 很适合你。

DeepDetect 支持各种各样的任务，如分类、分割、回归、对象检测、自动编码器。它支持图像、时间序列、文本和更多类型数据的有监督和无监督深度学习。但是 DeepDetect 依赖于外部机器学习库，例如：

深度学习库：Tensorflow、Caffe2、Torch。
梯度提升库：XGBoost。
使用 T-SNE 进行聚类。

6. Dopamine

Dopamine 是科技巨头 Google 的一个开源项目。它是用 Python 编写的。它是一个快速原型强化学习算法的研究框架。

Dopamine 的设计原则是：

轻松实验：Dopamine 使新用户可以轻松运行实验。
它紧凑而可靠。
它还有助于结果的重现性。
它很灵活，因此使新用户可以轻松尝试新的研究思路。

7. TensorFlow

Tensorflow 是 GitHub 上最著名、最受欢迎和最好用的机器学习开源项目之一。它是一个开源软件库，用于使用数据流图进行数值计算。它有一个非常易于使用的 Python 接口，并且没有其他语言中不需要的接口来构建和执行计算图。

TensorFlow 提供稳定的 Python 和 C++ API。 Tensorflow 有一些惊人的用例，例如：

在语音/声音识别中
文本库应用程序
图像识别
视频检测
…还有很多！

提到图像识别与视频检测技术，不得不提目前在各个领域很火的AI+视频技术，将AI检测、智能识别技术融合到各个视频应用场景中，如：安防监控、视频中的人脸检测、人流量统计、危险行为（攀高、摔倒、推搡等）检测识别等。典型的示例如EasyCVR视频融合云服务，具有AI人脸识别、车牌识别、语音对讲、云台控制、声光告警、监控视频分析与数据汇总的能力。

8.PredictionIO

它建立在最先进的开源堆栈之上。该机器学习服务器专为数据科学家设计，可为任何 ML 任务创建预测引擎。它的一些惊人功能是：

它有助于在可定制的生产模板上快速构建和部署引擎作为 Web 服务。
部署为 Web 服务后，即可实时响应动态查询。
它支持机器学习和数据处理库，如 OpenNLP、Spark MLLib。
它还简化了数据基础设施管理

9.Scikit-learn

它是一个基于 Python 的免费软件机器学习工具库。它提供了用于分类、回归、聚类算法的各种算法，包括随机森林、梯度提升、DBSCAN。

这是建立在必须预先安装的 SciPy 之上，以便可以使用 sci-kit learn。它还提供以下模型：

集成方法
特征提取
参数调优
流形学习
特征选择
降维

注意：要学习 scikit-learn 遵循文档：
https://scikit-learn.org/stable/

10. Pylearn2

Pylearn2 是所有 Python 开发人员中最流行的机器学习库。它基于 Theano。你可以使用数学表达式来编写它的插件，而 Theano 则需要优化和稳定。

它有一些很棒的功能，例如：

用于训练模型本身的“默认训练算法”
模型估计标准
分数匹配
交叉熵
对数似然
数据集预处理
对比度归一化
ZCA美白
补丁提取（用于实现类卷积算法）

Tags：机器学习点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

AI系统中（机器学习算法）导致偏差的原因总结

基于算法的业务或者说AI的应用在这几年发展得很快。但是，在实际应用的场景中，我们经常会遇到一些非常奇怪的偏差现象。例如，Facebook将黑人标记为灵长类动物、城市图像识别系统...【详细内容】

2021-11-08　　Tags: 机器学习点击:(32)　　评论:(0)　　加入收藏

这725个机器学习术语表，太全了

这是几位机器学习权威专家汇总的725个机器学习术语表，非常全面了，值得收藏！英文术语中文翻译 0-1 Loss Function 0-1损失函数 Accept-Reject Samplin...【详细内容】

2021-10-21　　Tags: 机器学习点击:(43)　　评论:(0)　　加入收藏

程序员10 个入门级的机器学习开源项目

要开始为开源项目做贡献，有一些先决条件：1. 学习一门编程语言：由于在开源贡献中你需要编写代码才能参与开发，你需要学习任意一门编程语言。根据项目的需要，在后期学习另一种语言...【详细内容】

2021-10-20　　Tags: 机器学习点击:(37)　　评论:(0)　　加入收藏

人工智能、机器学习领域13个常见概念

作者：阿米特·V. 乔希（Ameet V Joshi）来源：华章科技 01 人工智能艾伦·图灵（Alan Turing）对人工智能的定义如下：如果窗帘后面有一台机器，并且有人正在与之互动（无论以何...【详细内容】

2021-09-07　　Tags: 机器学习点击:(74)　　评论:(0)　　加入收藏

字节跳动开源云原生机器学习平台 Klever

字节跳动基础架构团队基于火山引擎机器学习平台 Clever 及其丰富的行业落地经验，推出开源项目 Klever，以工程化的方式降低智能技术落地门槛，助力企业快速打造智能业务。作者：陈...【详细内容】

2021-02-19　　Tags: 机器学习点击:(170)　　评论:(0)　　加入收藏

机器学习算法中如何执行回归数据的特征选择

特征选择是识别和选择与目标变量最相关的输入变量子集的过程。特征选择最简单的情况可能是存在数字输入变量和用于回归预测建模的数字目标的情况。这是因为可以计算出每个输...【详细内容】

2021-01-15　　Tags: 机器学习点击:(117)　　评论:(0)　　加入收藏

轻松理解机器学习算法：Adaboost算法

1、集成学习及Boosting算法集成学习属于机器学习，它是一种“训练思路”，并不是某种具体的方法或者算法。集成学习的核心思想是把已有的算法进行结合，从而得到更好的效果。集成...【详细内容】

2020-12-29　　Tags: 机器学习点击:(176)　　评论:(0)　　加入收藏

Python迁移学习：机器学习算法

“终有一天，人工智能会像我们看待非洲平原上低级生物的化石一样看待我们。在人工智能眼中，人类只是直立行走的猿猴，用着粗糙的语言和简陋的工具，从诞生起就注定会灭绝。”&mdash...【详细内容】

2020-12-17　　Tags: 机器学习点击:(147)　　评论:(0)　　加入收藏

一款强大的机器学习可视化IDE

专注Python、AI、大数据，请关注公众号七步编程！人工智能方向的项目，和数据可视化是紧密相连的。模型训练过程中梯度下降过程是什么样的？损失函数的走向如何？训练模型的准确度怎么...【详细内容】

2020-10-15　　Tags: 机器学习点击:(355)　　评论:(0)　　加入收藏

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

在数据领域，很多人都在说机器学习，但是只有很少的人能说清楚怎么回事。网上关于机器学习的文章，大多都是充斥各种定理的厚重学术三部曲(我搞定半个定理都够呛)，或是关于人工智能...【详细内容】

2020-09-25　　Tags: 机器学习点击:(111)　　评论:(0)　　加入收藏

▌简易百科推荐

可解释的AI (XAI)：如何使用LIME 和 SHAP更好地解释模型的预测

作为数据科学家或机器学习从业者，将可解释性集成到机器学习模型中可以帮助决策者和其他利益相关者有更多的可见性并可以让他们理解模型输出决策的解释。在本文中，我将介绍两个...【详细内容】

2021-12-17　　deephub　　　　Tags:AI 　点击:(15)　　评论:(0)　　加入收藏

AI系统中（机器学习算法）导致偏差的原因总结

2021-11-08　　数据学习DataLearner　　　　Tags:机器学习　点击:(32)　　评论:(0)　　加入收藏

人工智能会超过人类吗？顶尖科学家：人工智能在常识判断方面具有局限

11月2日召开的世界顶尖科学家数字未来论坛上，2013年诺贝尔化学奖得主迈克尔·莱维特、2014年诺贝尔生理学或医学奖得主爱德华·莫索尔、2007年图灵奖得主约瑟夫·斯发斯基、1986年图灵奖得主约翰·霍普克罗夫特、2002...【详细内容】

2021-11-03　　张淑贤　　证券时报　　Tags:人工智能　点击:(39)　　评论:(0)　　加入收藏

火爆业界的边缘计算，到底是什么？

鉴于物联网设备广泛部署、5G快速无线技术闪亮登场，把计算、存储和分析放在靠近数据生成的地方来处理，让边缘计算有了用武之地。边缘计算正在改变全球数百万个设备处理和传输...【详细内容】

2021-10-26　　　　计算机世界　　Tags:边缘计算　点击:(45)　　评论:(0)　　加入收藏

这725个机器学习术语表，太全了

2021-10-21　　Python部落　　　　Tags:机器学习　点击:(43)　　评论:(0)　　加入收藏

程序员10 个入门级的机器学习开源项目

2021-10-20　　TSINGSEE青犀视频　　　　Tags:机器学习　点击:(37)　　评论:(0)　　加入收藏

Logistic Regression：最基础的神经网络

SimpleAI.人工智能、机器学习、深度学习还是遥不可及？来这里看看吧~ 从基本的概念、原理、公式，到用生动形象的例子去理解，到动手做实验去感知，到著名案例的学习，到用所学来实现...【详细内容】

2021-10-19　　憨昊昊　　　　Tags:神经网络　点击:(47)　　评论:(0)　　加入收藏

直击痛点 NLP技术的价值和落地｜超级观点

语言是人类思维的基础，当计算机具备了处理自然语言的能力，才具有真正智能的想象。自然语言处理（Natural Language Processing, NLP）作为人工智能（Artificial Intelligence, AI）的核心技术之一，是用计算机来处理、理解以及运...【详细内容】

2021-10-11　　　　36氪　　Tags:NLP 　点击:(48)　　评论:(0)　　加入收藏

边缘计算是个啥？为什么说发展5G离不开它？

边缘计算是什么？近年来，物联网设备数量呈线性增长趋势。根据艾瑞测算， 2020年，中国物联网设备的数量达74亿，预计2025年突破150亿个。同时，设备本身也变得越来越智能化，AI与互联网在...【详细内容】

2021-09-22　　汉智兴科技　　　　Tags: 　点击:(54)　　评论:(0)　　加入收藏

学了这些基础算法，人工智能就算入门了

说起人工智能，大家总把它和科幻电影中的机器人联系起来，而实际上这些科幻场景与现如今的人工智能没什么太大关系。人工智能确实跟人类大脑很相似，但它们的显著差异在于人工智能...【详细内容】

2021-09-17　　异步社区　　　　Tags:人工智能　点击:(57)　　评论:(0)　　加入收藏

推荐资讯

远程软件发展迅猛，ToDe	倒计时！企业QQ即将下架
极简Windows11与iPhon	iPhone信号问题，花10元
惊人数据：App Store中4	个人所得税递延纳税报
非常实用的 Python 库	等离子电视技术先进，为