您当前的位置:首页 > 电脑百科 > 程序开发 > 算法

算法篇:一文搞懂 : 动态规划之最短编辑距离

时间:2019-08-21 09:49:15  来源:  作者:

前言

动态规划

动态规划

动态规划其实就是对分而治之策略的一种应用, 将一个较大的问题分解成有限个的不相关的子问题问题, 然后通过解决子问题, 不断推演出最终结果。

动态规划有一个比较直观特点: 就可以通过表格的方式去描述问题。

动态规划应用

以下使用动态规划进行字符串最短编辑处理的一个例子,通过这个例子就可以很容易的搞懂动态规划这个算法的原理和应用。

1、字符的操作方式

字符的三种操作方式: 替换, 删除, 增加。

举个例子:

替换

abc -> abe

里面就需要将c 提换成e, 这里需要的操作次数是1。

删除

abc -> ab

里面就需要将c 删除, 这里需要的操作次数是1.

增加

a -> ab

里面就需要增加字符b, 这里需要的操作次数是1.

从上面的例子可以看到, 其实两个字符串即便互相交换, 它们的最短操作距离是一样的。

2、使用动态规划解决最短编辑距离问题

. 将 adceg --> abcfg

步骤一: 初始化表格

. 首先, 我们根据比较字符串的长度新建一个 (m+1)x(n+1) 的二维表格, 这个例子中, 这个表格就是6x6, 当然, 需要比较字符串的长度不需要相等.,

. 然后, 初始化首行与首列的数据

算法篇:一文搞懂 : 动态规划之最短编辑距离

 

其实,初始化的原理是和之前说的编辑逻辑保持一致的, 我们先看第一行:

.Null 表示空串, 第0,0 坐标的值是0, 表示, "空串" --> "空串" 无需任何编辑操作

.0,1 坐标的值是1, 表示从"空串" --> "a", 只需要最少1次编辑操作.

.0,2 坐标的值是2, 表示从"空串" --> "ab", 只需要最少2次编辑操作.

同理可得, 第一行剩下的值分别是3,4,5

.同样地, 我们也可以得到第一列的值分别是 0,1,2,3,4,5

步骤二: 解决字符相等的情况

.完成了初始化后, 我们尝试填充 1, 1 坐标的值

.由于第一行的字母是a, 第一列的字母也是a, 两者相等,所以我们只需要将(i-1, j-1)也就是(0,0) 的值直接复制过来, 也就是说, (1,1) 的值是0, 表示无需任何编辑操作.如下图所示

算法篇:一文搞懂 : 动态规划之最短编辑距离

 

步骤三: 解决字符不相等的情况:

.好了, 我们继续填充(1,2) 坐标的值:

.i 对应的值依旧是a, j 对应的值b, 但两者不相等,这个时候, 需要我们就取 replace, insert, remove 操作对应的坐标值中的最小值. 这么说可能比较抽象, 我们先从微观上观察下每一个种操作对应的坐标值:

算法篇:一文搞懂 : 动态规划之最短编辑距离

 

假设当前的坐标是i,j (i>0, j >0). 那么:

insert 操作对应的坐标值是(i, j-1)

replace 操作对应的坐标值是 (i-1, j -1)

remove 操作对应的坐标值是 (i-1, j)

我们需要做的,就是将这三种操作的最小值找出来, 然后做 +1 操作, 以 (1,2) 为例,填的值就是1:

算法篇:一文搞懂 : 动态规划之最短编辑距离

 

步骤四: 填充剩余表格

.好了, 到目前为止, 所有的需要分析的步骤就完成了, 剩下就只需要填充后面的值,最后,你会发现2 就是最终的求解.

算法篇:一文搞懂 : 动态规划之最短编辑距离

 

.动态规划一个很大的优势就是可以通过这个表格找出任意两个子串的最短编辑距离, 比如: abc --> adc 的最短编辑距离就是1

算法篇:一文搞懂 : 动态规划之最短编辑距离

 

算法实现:

最终的算法实现(Python)就非常简单了:

def min_dest(i, j, arr):
 return min(arr[i-1,j-1], min( arr[i-1,j], arr[i,j-1]))
def find_min_edit_distance(str1, str2):
 arr = [len(str1)][len(str2)]
 for i in range(len(str1)):
 for j in range(len(str2)):
 if i == 0:
 #初始化第0行
 a[i][j] = j
 continue
 if j == 0:
 #初始化第0列
 a[i][j] = i
 continue
 if str1[i] == str2[j]:
 #字符相等, 直接复制
 a[i][j] = a[i-1][j-1]
 else:
 #字符不等, 去最小值.
 a[i][j] = min_dest(i, j, arr)
 
 return arr[len(str1)-1][len(str2)-1]

总结:

从这个例子可以看到: 动态规划的实现一点都不难, 难是难在要识别问题能通过动态规划去解决. 我认为这个过程是需要不断积累经验的过程.



Tags:算法   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
前言Kafka 中有很多延时操作,比如对于耗时的网络请求(比如 Produce 是等待 ISR 副本复制成功)会被封装成 DelayOperation 进行延迟处理操作,防止阻塞 Kafka请求处理线程。Kafka...【详细内容】
2021-12-27  Tags: 算法  点击:(1)  评论:(0)  加入收藏
分稀疏重建和稠密重建两类:稀疏重建:使用RGB相机SLAMOrb-slam,Orb-slam2,orb-slam3:工程地址在: http://webdiis.unizar.es/~raulmur/orbslam/ DSO(Direct Sparse Odometry)因为...【详细内容】
2021-12-23  Tags: 算法  点击:(7)  评论:(0)  加入收藏
一、什么是冒泡排序1.1、文字描述冒泡排序是一种简单的排序算法。它重复地走访要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地...【详细内容】
2021-12-15  Tags: 算法  点击:(16)  评论:(0)  加入收藏
前面文章在谈论分布式唯一ID生成的时候,有提到雪花算法,这一次,我们详细点讲解,只讲它。SnowFlake算法据国家大气研究中心的查尔斯·奈特称,一般的雪花大约由10^19个水分子...【详细内容】
2021-11-17  Tags: 算法  点击:(24)  评论:(0)  加入收藏
基于算法的业务或者说AI的应用在这几年发展得很快。但是,在实际应用的场景中,我们经常会遇到一些非常奇怪的偏差现象。例如,Facebook将黑人标记为灵长类动物、城市图像识别系统...【详细内容】
2021-11-08  Tags: 算法  点击:(32)  评论:(0)  加入收藏
随着注册制的加速推进,新股越来越多,截止到今天A股上市公司的总数高达4500余家,A股一直就是重融资,轻投资的市场,而上市公司发行可转债这种再融资的(圈钱方式)是最能让普通投资者接...【详细内容】
2021-11-05  Tags: 算法  点击:(98)  评论:(0)  加入收藏
导读:在大数据时代,对复杂数据结构中的各数据项进行有效的排序和查找的能力非常重要,因为很多现代算法都需要用到它。在为数据恰当选择排序和查找策略时,需要根据数据的规模和类型进行判断。尽管不同策略最终得到的结果完...【详细内容】
2021-11-04  Tags: 算法  点击:(40)  评论:(0)  加入收藏
这是我在网上找的资源的一个总结,会先给出一个我看了觉得还行的关于算法的讲解,再配上实现的代码: Original author: Bill_Hoo Original Address: http://blog.sina.com.cn/s/bl...【详细内容】
2021-11-04  Tags: 算法  点击:(36)  评论:(0)  加入收藏
每个人都有过这样的经历:打开手机准备回消息或打电话,一看到微信图标右上方的小红点,于是忍不住先打开微信;看完微信,不知不觉又被另一个App牵引,直到关闭手机屏幕才发现自己早已...【详细内容】
2021-11-03  Tags: 算法  点击:(30)  评论:(0)  加入收藏
文丨互联网怪盗团在互联网行业,尤其是在投资人心目中,往往存在一种“算法迷信”或曰“技术迷信”:某公司的广告变现做得好,一定是因为有算法;某公司的云计算业务开展的好,也是因为...【详细内容】
2021-11-03  Tags: 算法  点击:(25)  评论:(0)  加入收藏
▌简易百科推荐
前言Kafka 中有很多延时操作,比如对于耗时的网络请求(比如 Produce 是等待 ISR 副本复制成功)会被封装成 DelayOperation 进行延迟处理操作,防止阻塞 Kafka请求处理线程。Kafka...【详细内容】
2021-12-27  Java技术那些事    Tags:时间轮   点击:(1)  评论:(0)  加入收藏
博雯 发自 凹非寺量子位 报道 | 公众号 QbitAI在炼丹过程中,为了减少训练所需资源,MLer有时会将大型复杂的大模型“蒸馏”为较小的模型,同时还要保证与压缩前相当的结果。这就...【详细内容】
2021-12-24  量子位    Tags:蒸馏法   点击:(11)  评论:(0)  加入收藏
分稀疏重建和稠密重建两类:稀疏重建:使用RGB相机SLAMOrb-slam,Orb-slam2,orb-slam3:工程地址在: http://webdiis.unizar.es/~raulmur/orbslam/ DSO(Direct Sparse Odometry)因为...【详细内容】
2021-12-23  老师明明可以靠颜值    Tags:算法   点击:(7)  评论:(0)  加入收藏
1. 基本概念希尔排序又叫递减增量排序算法,它是在直接插入排序算法的基础上进行改进而来的,综合来说它的效率肯定是要高于直接插入排序算法的;希尔排序是一种不稳定的排序算法...【详细内容】
2021-12-22  青石野草    Tags:希尔排序   点击:(6)  评论:(0)  加入收藏
ROP是一种技巧,我们对execve函数进行拼凑来进行system /bin/sh。栈迁移的特征是溢出0x10个字符,在本次getshell中,还碰到了如何利用printf函数来进行canary的泄露。ROP+栈迁移...【详细内容】
2021-12-15  星云博创    Tags:栈迁移   点击:(22)  评论:(0)  加入收藏
一、什么是冒泡排序1.1、文字描述冒泡排序是一种简单的排序算法。它重复地走访要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地...【详细内容】
2021-12-15    晓掌柜丶韶华  Tags:排序算法   点击:(16)  评论:(0)  加入收藏
在了解golang的map之前,我们需要了解哈希这个概念。哈希表,又称散列表(Hash table),是根据键(key)而直接访问在内存储存位置的数据结构。也就是说,它通过计算出一个键值的函数,将...【详细内容】
2021-12-07  一棵梧桐木    Tags:哈希表   点击:(14)  评论:(0)  加入收藏
前面文章在谈论分布式唯一ID生成的时候,有提到雪花算法,这一次,我们详细点讲解,只讲它。SnowFlake算法据国家大气研究中心的查尔斯·奈特称,一般的雪花大约由10^19个水分子...【详细内容】
2021-11-17  小心程序猿QAQ    Tags:雪花算法   点击:(24)  评论:(0)  加入收藏
导读:在大数据时代,对复杂数据结构中的各数据项进行有效的排序和查找的能力非常重要,因为很多现代算法都需要用到它。在为数据恰当选择排序和查找策略时,需要根据数据的规模和类型进行判断。尽管不同策略最终得到的结果完...【详细内容】
2021-11-04  华章科技    Tags:排序算法   点击:(40)  评论:(0)  加入收藏
这是我在网上找的资源的一个总结,会先给出一个我看了觉得还行的关于算法的讲解,再配上实现的代码: Original author: Bill_Hoo Original Address: http://blog.sina.com.cn/s/bl...【详细内容】
2021-11-04  有AI野心的电工和码农    Tags: KMP算法   点击:(36)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条