最近看到网上有很多初学编程的小伙伴在问有哪些程序员必须要掌握算法,并且这些算法在面试的时候会被经常问到呢?如何能够系统性的学习算法?看着样子估计是要想往算法工程师方向努力了。那么下面我们就来带着这些问题来进行分享了。
深度优先搜索算法
深度优先搜索本质上其实是要从一个树状或者是网状的结构中去搜索到自己所需要的数据。深度优先的意思就是说按照一条线路一直往最深的地方查找,直到查找到最深处的时候发现没有继续往下的节点了,就回头,回到上一个岔路口,顺着新的岔路口继续往下按照同样的方式继续往最深处进行查找。
通过这种方式就可以将所有的最深节点的路径都走一遍,也就可以访问到整个树状结构或者是图状结构的所有节点。虽然算法是针对于树或者是图进行设计的,但是在实际问题中也有很多的体现。
这些实际的问题表面上与树或者是图没有太大的关系,但是依然采用的是深度优先搜索算法的思路。例如很多比较实际的数学问题,例如八皇后问题、数独等等。
那么我们如何将一个实际遇到的问题转化成深度优先搜索问题进行求解呢?
这就是在面试中问道算法有关问题的核心的考察内容,也是在学习一个算法的时候,需要去锻炼的点。很多的面试者都是对算法本身掌握的非常好了,但是一遇到面试官问道的实际问题,就不知道该如何应对了。
广度优先搜索
说完深度优先搜索就不得不说到与之对应的广度优先搜索了,与深度优先搜索一样,也是在树结构或者是图结构中进行应用,与深度优先不同的是,广度优先搜索在一开始进行遍历的时候,首先会将当前节点所连接的所有的节点都找到,然后在按照规则进行下一轮的查找。
也就是说广度优先搜索是一层一层的进行搜索,只有将当前节点所连接的最近的一层节点都走完了,才会继续去查找下一层的节点。然后持续迭代的走下去。
这有点像是剥开洋葱一样,你需要一层一层的剥开,要是想跳过一层的话就会导致洋葱损坏。
如果我们将深度优先和广度优先分别应用到查找迷宫的问题上,其区别也是非常明显的。深度优先,就是一直走,直到遇到墙的时候,回到岔路的位置继续进行查找。而广度优先则是首先在起点的时候就将所有的可能的路口都探寻一遍,然后找到最有可能有路口的路继续进行下一层次的探索。
这个时候就有人要问了,这两种算法到底哪种算法更好呢?只能说两种算法各有优缺点吧!广度优先最大的优点就是能够保证找到最短的路径,而深度优先不能。从迷宫问题就可以看出来,实际上在很多的著名的寻路算法中,很大一部分都是从广度优先搜索算法进行的扩展。例如著名的迪杰斯特拉算法、地图应用规划路径的算法等。
广度优先相比较于深度优先的缺点就是由于要存储上层节点信息,所以可能在就更容易占用内存。
但是在一般的面试过程中遇到这种问题的时候,一般树或者图的深度都不是太大,所以一般就不考虑这问题。
二分查找算法
说完广度,接下要说的就是二分查找算法,这个算法适用在一个已经排好序的结构中例如在一个Storted Array 或者是在一个二叉查找树中。在搜索的过程中需要先取判断中间的节点是否是我们要找的数据,如果是的话那么正好找到,如果不是的话就需要判断该节点的数据与当前要查找的数据的大小,如果比该节点数据大那么从后半段进行查找,还是按照第一次查找的方式进行,如果比节点数据小那么就从前半段,按照第一次查找的方式进行查找。
通过这种递归的方式进行,就可以快速的找到需要的节点数据了。这个算法也是一种比较常用的算法,在JAVA中的TreeMap和TreeSet它们所用到的查找算法就是二分查找,又比如,在数据库中使用到的B+树索引,文件系统中的文件索引等等都用到了二分查找算法。
分治算法
这个算法与二分查找法的共同的特点就是将输入的内容分成两部分来分别进行处理,但是与二分查找法不同的是,分治算法会将分而治之的两部分按照同样的规则进行处理。也就是说两部分是都需要进行处理的,而二分法是指处理满足要求的一半。
分治算法的经典应用就是归并排序算法,理解非常简单,就是想要给一个大的数组进行排序的话,首先我们可以将其分成两个小的数组,然后分别对这两个小的数组进行排序,然后在对两个小数组按照规则进行最终的排序。
当然除了在排序算法中见到分治的身影,其实在分布式系统中,也会经常用到分治算法相关的思想。其中最著名的应用就是在MapReduce中的应用,通过对输入数据拆分成多个小份让这些小份被多个机器进行并行处理,然后将最终结果的合并,从而最终实现对大数据的处理。
以上,是在面试中经常会被问到的一些算法,其实,在实际开发过程中,我们可能遇到的数据结构的种类,或者是碰到的算法会更多,例如List、Queue、Stack、HashTable、Binary Tree、Graph、Heap,还有一些高级的数据机构Union Find、Trie等等。
我们在学习这些算法数据结构的时候,只从理论上出发的话是远远不够的,例如你知道二叉树的一些特征,一些实现原理、一些计算方式的时候,其实并不能代表你就会使用它。还是要从实际的编程语言中入手。
例如在Java中最为经典的也是在面试中会经常会被问到的HashMap的底层实现逻辑?在HashMap的底层采用了红黑树结构,如果只是将红黑树的理论知识背的滚瓜烂熟,在实际使用的时候不会用还是不会用。
所以我们要结合实际出发,通过实际的使用来提升自己对于数据结构的理解。
例如在很多的算法书籍中,提到的深度优先和广度优先用到的不是同一种数据结构。一个用到的是Stock、一个用到的是Queue。但是如果你对Java语言了解的话,在Java中是可以将一个Stock转换成一个Queue的,这个时候,你可能会对Stack和Queue两种数据结构有更加深刻的认识。什么意思呢?在理论上来讲,两种数据结构有着不同的定义,但是从代码实现的角度上,我们可以将一个Stock结构转换成一个Queue结构来使用。这就是理论与实践的差距。
上面介绍了几种面试中常用的算法,以及如何能够有效的学习算法的方式。说白了,在学习算法的时候,一定要理论结合实践的方式来深入的理解算法。而不是生搬硬套的去背诵算法。一定要在理解的基础上然后去应用,而不是从书本上学来就直接进行套用,在这个多元化的氛围中,套用必然会被淘汰,只有不断的创新,灵活应用才是王道。