您当前的位置:首页 > 电脑百科 > 程序开发 > 语言 > Python

使用一行Python代码从图像读取文本

时间:2019-12-03 13:13:38  来源:  作者:

处理图像不是一项简单的任务。 对你来说,作为一个人,很容易看着某样东西然后马上知道你在看什么。 但电脑不是这样工作的。

对你来说太难的任务,比如复杂的算术,或者一般意义上的数学,是计算机毫不费力就能完成的。 但在这里, 情况正好相反 ——对你来说很琐碎的任务,比如识别图像中的猫或狗,对电脑来说真的很难。 在某种程度上,我们是天造地设的一对。 至少现在是这样。

虽然图像分类和涉及到一定程度计算机视觉的任务可能需要大量的代码和扎实的理解,但是从格式良好的图像中读取文本在Python中却是简单的,并且可以应用于许多现实生活中的问题。私信小编01 领取完整项目代码~

在今天的帖子中,我想证明这一点。 虽然会安装一些库,但不会花很多时间。 这些是你需要的库:

  • OpenCV
  • PyTesseract

OpenCV

现在,这个库将只用于加载图像,实际上你不需要事先对它有太多了解(尽管它可能有帮助,你将看到为什么)。

根据官方文件:

OpenCV(开源计算机视觉库)是一个开源的计算机视觉和机器学习软件库。 OpenCV的目的是为计算机视觉应用提供一个通用的基础结构,并加速机器感知在商业产品中的使用。 OpenCV是bsd许可的产品,OpenCV使企业可以轻松地使用和修改代码

简而言之,你可以使用OpenCV来做任何类型的 图像转换 ,这是一个相当简单的库。

如果你还没有安装它,那么它将只是终端中的一行:

pip install opencv-python

差不多就是这样。 在此之前,一切都很简单,但这种情况即将改变。

PyTesseract

这个库到底是什么东西?根据维基百科:

Tesseract是用于各种操作系统的光学字符识别引擎。它是免费软件,根据Apache许可2.0版发布,自2006年以来由google赞助开发。

我敢肯定,现在有更多复杂的库可用,但是我发现这个库运行良好。 根据我自己的经验,该库应该能够从任何图像中读取文本,但前提是该字体不会使你连连看都看不懂。

如果无法从你的图像中读取文字,花更多的时间使用OpenCV,应用各种过滤器使文本高亮。

现在安装在底部有些麻烦。 如果你使用的是linux,则全部归结为几个 sudo-apt get 命令:

sudo apt-get update
sudo apt-get install tesseract-ocr
sudo apt-get install libtesseract-dev

我用的是windows系统,所以这个过程有点乏味。

首先,打开这个URL:

https://github.com/UB-Mannheim/tesseract/wiki

下载32位或64位的安装程序:

使用一行Python代码从图像读取文本

 

安装本身很简单,只需单击几次Next。 是的,你还需要做一个 pip安装 :

pip install pytesseract

接下来要需要告诉Python Tesseract安装在何处。 在Linux机器上,我不需要这样做,但在Windows上是必需的。 默认情况下,它安装 Program Files 。

如果你做的一切正确,执行这些代码应该不会产生任何错误:

使用一行Python代码从图像读取文本

 

获取文本

让我们从一个简单的开始。 我找到了一些免版税的图片,里面有一些文字,第一个是这样的:

使用一行Python代码从图像读取文本

 

它应该是简单的一个,有可能Tesseract会读那些蓝色的“对象”作为括号。 让我们看看会发生什么:

使用一行Python代码从图像读取文本

 

我的猜测是正确的。 不过,这不是一个问题,你可以使用一些Python技巧轻松地解决这些问题。

下一个可能更棘手:

使用一行Python代码从图像读取文本

 

我希望它不会检测到硬币上的“B”:

使用一行Python代码从图像读取文本

 

看起来效果很好。

现在轮到你把它应用到你自己的问题上了。 如果文本与背景混合,OpenCV技能在这里可能是至关重要的。

在你离开之前

对计算机来说,从图像中读取文本是一项相当困难的任务。 想想看,电脑不知道字母是什么,它只对数字有效。 在引擎盖后面发生的事情一开始可能看起来像一个黑盒子,但我鼓励你进一步研究,如果这是你感兴趣的领域。

我并不是说PyTesseract每次都能很好地工作,但是我发现即使在一些比较复杂的图像上它也足够好。 但不是所有情况都很好,有时候需要一些图像处理需要使文本高亮让其相对于背景更加突出。



Tags:Python代码   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
前言本文提供将视频调整分辨率的Python代码,一如既往的实用主义。环境依赖ffmpeg环境安装,可以参考我的另一篇文章: windows ffmpeg安装部署_阿良的博客-CSDN博客ffmpy安装:pip...【详细内容】
2021-12-14  Tags: Python代码  点击:(15)  评论:(0)  加入收藏
大家好, 我是林路,今天就给大家介绍Python代码都是用的什么编辑器写的?Jupyter Notebook ,没有Pycharm,没有Vscode,没有Sublime text。 只有一款工具:Jupyter Notebook 。工欲善其...【详细内容】
2021-12-09  Tags: Python代码  点击:(27)  评论:(0)  加入收藏
判断一个程序员水平的高低,不能光看他的发量,也不能光看他的代码量,还要看他代码蕴含的思想,代码的质量。代码蕴含的思想主要体现在各种设计模式的运用上,而代码的质量就既要实现需求,又要保证代码的简洁优雅。保证代码质量...【详细内容】
2021-10-13  Tags: Python代码  点击:(68)  评论:(0)  加入收藏
今天的文章来自 盏茶作酒同学。他在老电脑中发现了一个加密的 zip 文件,于是用 Python 破解了文件密码。在破解的过程中出现了内存爆炸的问题,通过阅读 Python 源代码找到了解...【详细内容】
2021-04-16  Tags: Python代码  点击:(304)  评论:(0)  加入收藏
1 简介学习Dash中渲染网页静态表格的常用方法,并在最后的例子中教大家如何配合Dash,简简单单编写一个数据库查询应用~ 还特意在文末藏了惊喜哦!! 2 在Dash中渲染静态表格在Dash...【详细内容】
2021-04-07  Tags: Python代码  点击:(267)  评论:(0)  加入收藏
前言集成开发环境(IDE)允许开发人员用不同的编程语言运行代码,特别地,python IDE实际上是一种IDE,专门让您测试、运行和编辑用python语言编写的代码。当涉及到一个很大的项目时...【详细内容】
2020-10-09  Tags: Python代码  点击:(78)  评论:(0)  加入收藏
你以为我在搞AI?不,我在搞API... 事先准备既然调用人家API,那就需要API Key 和 Secret Key,不要紧张,只要你有手机,就可以获取,方法如下:输入如下网址,进入百度智能云首页:https://log...【详细内容】
2020-07-23  Tags: Python代码  点击:(70)  评论:(0)  加入收藏
如果你关注我已经有一段时间,那你就会知道我经常发布用于解决日常问题的Python代码片段。好吧,我想我终于可以在一篇包含这些资源链接的文章中聚合所有这些回复了。请注意,我...【详细内容】
2020-06-23  Tags: Python代码  点击:(43)  评论:(0)  加入收藏
前天看到有人说目前自己有很多txt 文件,领导要转成xls文件,问用python怎么实现。其实完成这个需求方法有很多,因为具体的txt格式不清楚,当然如果是有明确分隔符的会更好处理些,可...【详细内容】
2020-06-05  Tags: Python代码  点击:(57)  评论:(0)  加入收藏
作者 | 刘早起来源 | 早起Python(ID: zaoqi-python)大家好,在下载某些文件的时候你一定会不时盯着进度条,在写代码的时候使用进度条可以便捷的观察任务处理情况,除了使用print来...【详细内容】
2020-06-04  Tags: Python代码  点击:(47)  评论:(0)  加入收藏
▌简易百科推荐
大家好,我是菜鸟哥,今天跟大家一起聊一下Python4的话题! 从2020年的1月1号开始,Python官方正式的停止了对于Python2的维护。Python也正式的进入了Python3的时代。而随着时间的...【详细内容】
2021-12-28  菜鸟学python    Tags:Python4   点击:(1)  评论:(0)  加入收藏
学习Python的初衷是因为它的实践的便捷性,几乎计算机上能完成的各种操作都能在Python上找到解决途径。平时工作需要在线学习。而在线学习的复杂性经常让人抓狂。费时费力且效...【详细内容】
2021-12-28  风度翩翩的Python    Tags:Python   点击:(1)  评论:(0)  加入收藏
Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使...【详细内容】
2021-12-27  IT资料库    Tags:Python 库   点击:(2)  评论:(0)  加入收藏
菜单驱动程序简介菜单驱动程序是通过显示选项列表从用户那里获取输入并允许用户从选项列表中选择输入的程序。菜单驱动程序的一个简单示例是 ATM(自动取款机)。在交易的情况下...【详细内容】
2021-12-27  子冉爱python    Tags:Python   点击:(4)  评论:(0)  加入收藏
有不少同学学完Python后仍然很难将其灵活运用。我整理15个Python入门的小程序。在实践中应用Python会有事半功倍的效果。01 实现二元二次函数实现数学里的二元二次函数:f(x,...【详细内容】
2021-12-22  程序汪小成    Tags:Python入门   点击:(32)  评论:(0)  加入收藏
Verilog是由一个个module组成的,下面是其中一个module在网表中的样子,我只需要提取module名字、实例化关系。module rst_filter ( ...); 端口声明... wire定义......【详细内容】
2021-12-22  编程啊青    Tags:Verilog   点击:(9)  评论:(0)  加入收藏
运行环境 如何从 MP4 视频中提取帧 将帧变成 GIF 创建 MP4 到 GIF GUI ...【详细内容】
2021-12-22  修道猿    Tags:Python   点击:(6)  评论:(0)  加入收藏
面向对象:Object Oriented Programming,简称OOP,即面向对象程序设计。类(Class)和对象(Object)类是用来描述具有相同属性和方法对象的集合。对象是类的具体实例。比如,学生都有...【详细内容】
2021-12-22  我头秃了    Tags:python   点击:(9)  评论:(0)  加入收藏
所谓内置函数,就是Python提供的, 可以直接拿来直接用的函数,比如大家熟悉的print,range、input等,也有不是很熟,但是很重要的,如enumerate、zip、join等,Python内置的这些函数非常...【详细内容】
2021-12-21  程序员小新ds    Tags:python初   点击:(5)  评论:(0)  加入收藏
Hi,大家好。我们在接口自动化测试项目中,有时候需要一些加密。今天给大伙介绍Python实现各种 加密 ,接口加解密再也不愁。目录一、项目加解密需求分析六、Python加密库PyCrypto...【详细内容】
2021-12-21  Python可乐    Tags:Python   点击:(8)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条