前言
许多小伙伴已经可以使用 Python/ target=_blank class=infotextkey>Python 解决小问题。定义几个变量,洋洋洒洒写几段 if 和 for 都不喘气。
但是,面对一个稍微复杂的问题,总感觉哪里不对劲,好像代码怎么样都写不出来规整的样子。
是不是没有"面向对象"?
是不是要定义一些类,搞一些模块?
今天,我们就来探讨一下,为什么需要定义类。
它到底解决了什么问题,与函数有什么不一样。
函数就是编写行动计划
我们用一个文件数据拆分小需求作为例子。
需求很简单,把一个数据表,按指定字段把数据拆分到不同的表,过程中需要去掉一些无用的列和行。
如下代码:
写出这段代码的你很开心,运行后也能出来正确结果。
后来,又需要完成一样的需求,但是文件不一样,字段也不一样。
你发现这份代码的小问题。于是,你把经常需要变化的变量,写到最上方,以便每次可以更容易找到并修改它们。
这时候的你不知不觉学会了定义函数。稍微改造一下:
函数就像在写明天的工作计划,编写的时候是不执行。
此时的参数叫做形参,因为这时候它们没有具体的值。 当执行函数的时候,需要指定一个确定值给这些参数,所以这时候参数叫实参。
这些知识很简单,但是此时你必须要注意到,我们的代码组织上,有了巨大的变化——数据以及处理这些数据的相关逻辑,被封装到一个范围内。
接下来,需求要升级一下
类,另一种组织方式
因为执行过程中去掉了一些行,有时候你希望能够把这些记录单独输出文件,方便查看。
那不就又要多一个参数,用来指定输出文件名字或路径吗?
你开始意识到这个函数的参数有点多。因为它负责的事情太多了!
于是,你按流程顺序,拆分成不同的小函数。
现在执行的代码成这样子:
如何进行划分,是面向过程和面向对象的重要区别。这里为了便于理解,简单按流程划分。
现在加入需求"把过程中删除掉的行单独输出"的函数:
这实现方式你很满意,因为它负责的事情只有一件,所以实现代码足够简单
但你却发现了问题,因为加入到执行代码的时候:
新函数的第一个参数的实际值(实参),不知道在哪里。因为,它需要上一个函数"配合",返回去掉的数据。
于是,第二个函数要修改它的返回值才能满足:
重点:
这种使用函数,面向流程的组织方式就有这种缺点。因为每个小函数之间通过返回值强关联,同时需求变化很容易导致返回值变化,甚至是执行顺序的变化。
怎么解决?
为了让大家更容易理解,我一步步来推演。
首先,想办法干掉每个小函数之间的数据依赖。既然每个小函数都可能返回不同的东西,我们直接用一个容器去存放它们。
此时,每个小函数的第一个参数都是字典:
现在函数之间数据的依赖关系,由原来的
变成
现在我们已经很接近定义类!
但是,现在数据字典是一个外部的变量,如果需要同时处理多个操作,数据很容易乱套。
而且,每个小函数的第一个参数都是这个数据字典,不太好看。
下面我用一种 python 中很不常见的写法解决:
为了方便查看,省略了2个函数。
重点:
执行的代码现在成这样子:
可以在 new 函数中设定参数,用于保存过程中需要的数据
当然,这种方式有一些缺点,比如执行的时候无法得到智能提示,因为现在函数需要从字典中取出。但是它解决了之前说的流程数据依赖问题。
这种方式可以让你理解带数据状态的执行流程:每次要执行,都需要调用函数 new 。这个函数做了什么?就是创建了一个数据字典和一系列操作这个数据字典的相关函数
如果你看到这里,那么恭喜你,你已经学会了 python 中定义类。
我们用定义类的代码如下:
python 还会把我们定义的函数,加入到数据字典中。也就是说,每个小函数都可以通过 self.函数名() ,调用彼此
执行时候的代码:
是不是与之前我们用数据字典很类似。因为它们的内在本质是一样。
类有继承等特性。不过我们同样可以通过构造数据字典的方式做到。
不要忘记一键三连。你的点赞、收藏、关注,是我创作的动力。