您当前的位置:首页 > 电脑百科 > 程序开发 > 编程百科

几款开源的OCR识别项目,收藏备用

时间:2023-03-17 11:50:10  来源:今日头条  作者:自学编程之道

随着科技的发展,OCR场景随处可见,很多App也集成如身份证识别,银行卡识别的功能,包括微信都支持截图文件中的文字提取。现在,各大厂商均有提供各种场景的OCR识别的API。但是,有时候我们也想自己来折腾一下。这时候,就可以借助一些主流开源框架来快速达到我们的目的。

OCR引擎

tesseract

Tesseract,一款由HP实验室开发由google维护的开源OCR引擎,开源,免费,支持多语言,多平台;

 

 

​https://github.com/tesseract-ocr/tesseract.git​

tesseract.js

js版本的Tesseract OCR,支持一百多种语言,使用也是非常简单,可以用npm安装,也可以直接在页面引用js

 

 

 

 

​https://github.com/naptha/tesseract.js.git​

PaddleOCR

PaddleOCR是百度开源一套OCR,旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。

 

 

 

 

 

 

 

​https://github.com/PaddlePaddle/PaddleOCR.git​

EasyOCR

EasyOCR是用Python/ target=_blank class=infotextkey>Python编写基于Tesseract的OCR识别库,用于图像识别输出文本,目前支持80多种语言。

 

 

​https://github.com/JaidedAI/EasyOCR.git​

mmocr

MMOCR 是基于 PyTorch 和 mmdetection 的开源工具箱,专注于文本检测,文本识别以及相应的下游任务,如关键信息提取。

 

 

​https://github.com/open-mmlab/mmocr.git​

simple-ocr-opencv

基于opencv 和numpy开源的OCR识别引擎

 

 

​https://github.com/goncalopp/simple-ocr-opencv.git​

OCR工具

OCRmyPDF

OCRmyPDF是基于tesseract-ocr开发、训练的文字识别提取的开源项目

 

 

​https://github.com/ocrmypdf/OCRmyPDF.git​

Umi-OCR

基于 PaddleOCR 实现的一款开源的文字识别工具,

 

 

一般开源项目,识别率肯定没有商用的那么高,只有通过训练自己的字库来提高识别率。文字识别场景,有时候就会涉及到图片处理,这里又会关联到其它强大的图像处理开源项目,如:OpenCV。这些项目中,PaddleOCR相对来说会更符合我们常见的业务场景,也支持我们自己去训练。



Tags:OCR   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
随着科技的发展,OCR场景随处可见,很多APP也集成如身份证识别,银行卡识别的功能,包括微信都支持截图文件中的文字提取。现在,各大厂商均有提供各种场景的OCR识别的API。但是,有时候...【详细内容】
2023-03-17  Tags: OCR  点击:(0)  评论:(0)  加入收藏
说实话,这应该是微信 10 年来推出的最实用功能之一了。在微信里收到的图片,也支持你直接选取文字复制。除了功能实用,另一方面,微信早已成了电脑上必装软件,微信截图也是很多人默...【详细内容】
2022-11-30  Tags: OCR  点击:(104)  评论:(0)  加入收藏
Tesserocr 是 Python 的一个 OCR 识别库,但其实是对Tesseract 做的一层 Python API 封装,所以它的核心是 Tesseract,所以在安装 Tesserocr 之前我们需要先安装 Tesseract,本节我...【详细内容】
2022-11-08  Tags: OCR  点击:(122)  评论:(0)  加入收藏
这些年,随着移动互联网的的发展,越来越多的企业都推出了自己的移动APP,这些APP多数都涉及到个人身份证信息的输入认证(即实名认证),如果手动去输入身份证号码和姓名,速度非常慢,且用...【详细内容】
2022-08-12  Tags: OCR  点击:(98)  评论:(0)  加入收藏
在本文中将使用Python演示如何解析文档(如pdf)并提取文本,图形,表格等信息。文档解析涉及检查文档中的数据并提取有用的信息。它可以通过自动化减少了大量的手工工作。一种流...【详细内容】
2022-07-19  Tags: OCR  点击:(160)  评论:(0)  加入收藏
本文的目的是演示一个专门设计用于对收据照片执行OCR(光学字符识别)操作并自动从中提取关键业务信息的 API,例如企业名称和地址、电话号码、收据总额等等。在页面的下方,我提供...【详细内容】
2022-07-15  Tags: OCR  点击:(198)  评论:(0)  加入收藏
百度的OCR应该业界做的最好的,往往是竞品的对标对象。PaddleOCR是一套丰富、领先、且实用的OCR工具库,支持80+语言识别,提供数据标注和合成工具,支持服务器、移动、嵌入式和物联...【详细内容】
2022-05-18  Tags: OCR  点击:(432)  评论:(0)  加入收藏
Odoo是世界排名第一的免费开源ERP平台,采用模块化方法运行的 Odoo 平台为企业提供了一个专用的客户关系管理模块,该模块将执行所有客户服务管理操作。客户关系管理的目的,一是...【详细内容】
2022-04-13  Tags: OCR  点击:(202)  评论:(0)  加入收藏
作者/蔡锡生 简介 gocraft/work是一款使用go开发的任务处理软件,通过redis存储任务队列,可以使用工作池同时处理多个任务。本文主要介绍任务注册和任务消费的源代码。 功能特...【详细内容】
2022-03-15  Tags: OCR  点击:(139)  评论:(0)  加入收藏
超轻量级中文ocr,支持竖排文字识别, 支持ncnn、mnn、tnn推理 ( dbnet(1.8M) + crnn(2.5M) + anglenet(378KB)) 总模型仅4.7M。开源项目中有web版本、android版本、PC版本,各种...【详细内容】
2022-03-14  Tags: OCR  点击:(370)  评论:(0)  加入收藏
▌简易百科推荐
随着科技的发展,OCR场景随处可见,很多APP也集成如身份证识别,银行卡识别的功能,包括微信都支持截图文件中的文字提取。现在,各大厂商均有提供各种场景的OCR识别的API。但是,有时候...【详细内容】
2023-03-17  自学编程之道  今日头条  Tags:OCR   点击:(0)  评论:(0)  加入收藏
Kubernetes(K8s)集群中最关键的组件之一是 API Server,它是所有集群管理活动的入口点。从本文开始,我们将对 K8s API Server 的代码进行详细分析,并探讨其应用入口点、框架以及与...【详细内容】
2023-03-17  k8s技术圈    Tags:APIServer   点击:(0)  评论:(0)  加入收藏
1. 前言本篇内容基于java环境下,介绍OpenCV 4.6.0v 中创建 Mat 对象时传递的 CvType 参数。如果你不太能理解CvType.CV_8UCX,CvType.CV_8SCX,CvType.CV_16UCX,CvType.CV_16SCX...【详细内容】
2023-03-17  Zinyan    Tags:OpenCV   点击:(0)  评论:(0)  加入收藏
IT之家 3 月 16 日消息,苹果相关代码片段继续引用了“realityOS”,这可能与即将推出的 Apple AR / VR 设备有关。苹果代码中对 realityOS 的引用已经出现了几个月,甚至还申请了...【详细内容】
2023-03-16   IT之家     Tags:GitHub   点击:(4)  评论:(0)  加入收藏
大家好,我是三友~~今天来跟大家聊一聊Java、Spring、Dubbo三者SPI机制的原理和区别。其实我之前写过一篇类似的文章,但是这篇文章主要是剖析dubbo的SPI机制的源码,中间只是简单...【详细内容】
2023-03-14  三友的java日记  微信公众号  Tags:SPI机制   点击:(9)  评论:(0)  加入收藏
​一、介绍在实际的软件项目开发过程中,我可以很负责任的跟大家说,如果你真的实际写代码的时间超过5年,你对增删改查这类简单的功能需求开发,可以说已经完全写吐了,至少我就是这...【详细内容】
2023-03-14   Java极客技术  微信公众号  Tags:代码生成器   点击:(6)  评论:(0)  加入收藏
什么是并发并发是指多个任务在同一时间段内同时运行,但不一定同时完成。在并发模式下,多个任务交替执行,操作系统通过时间片轮转或者优先级调度等方式来分配CPU资源,让多个任务...【详细内容】
2023-03-13  显微镜下的火鸡  今日头条  Tags:并发   点击:(4)  评论:(0)  加入收藏
Web 集群是指一组独立的服务器,它们通过某种方式协同工作来提供对外服务。在 Web 应用程序中,多台服务器通常会被组织成一个集群,以提高应用程序的性能和可用性。在这个集群中...【详细内容】
2023-03-13  理工男二号  今日头条  Tags:Web 集群   点击:(7)  评论:(0)  加入收藏
数据工程是有效管理大量数据的实践,从存储和处理到分析和可视化。因此,数据工程师必须精通数据结构和算法,以帮助他们有效地管理和操作数据。本文将探讨数据工程师应该熟悉的一...【详细内容】
2023-03-11  科技狠活与软件技术  今日头条  Tags:   点击:(5)  评论:(0)  加入收藏
通过本指南进入 Git 和 GitHub 的世界!了解如何通过 10 个简单步骤设置存储库和分支以及提交和推送更改。Git和 GitHub 已成为想要在软件项目上进行协作、跟踪更改和管理版...【详细内容】
2023-03-11  科技狠活与软件技术  今日头条  Tags:GitHub   点击:(36)  评论:(0)  加入收藏
站内最新
站内热门
站内头条