Wu-Manber算法简介及Python实现说明
Wu-Manber算法是一种字符串匹配算法,用于高效地搜索字符串。它是一种混合算法,结合了Boyer-Moore和Knuth-Morris-Pratt算法的优势,可提供快速准确的模式匹配。
Wu-Manber算法步骤
1.创建一个哈希表,将模式的每个可能子字符串映射到该子字符串出现的模式位置。
2.该哈希表用于快速识别文本中模式的潜在起始位置。
3.遍历文本并将每个字符与模式中的相应字符进行比较。
4.如果字符匹配,则可以移动到下一个字符并继续比较。
5.如果字符不匹配,可以使用哈希表来确定在模式的下一个潜在起始位置之前可以跳过的最大字符数。
6.这允许算法快速跳过大部分文本,而不会错过任何潜在的匹配项。
Python实现Wu-Manber算法
# Define the hash_pattern() function to generate
# a hash for each subpattern
def hashPattern(pattern, i, j):
h = 0
for k in range(i, j):
h = h * 256 + ord(pattern[k])
return h
# Define the Wu Manber algorithm
def wuManber(text, pattern):
# Define the length of the pattern and
# text
m = len(pattern)
n = len(text)
# Define the number of subpatterns to use
s = 2
# Define the length of each subpattern
t = m // s
# Initialize the hash values for each
# subpattern
h = [0] * s
for i in range(s):
h[i] = hashPattern(pattern, i * t, (i + 1) * t)
# Initialize the shift value for each
# subpattern
shift = [0] * s
for i in range(s):
shift[i] = t * (s - i - 1)
# Initialize the match value
match = False
# Iterate through the text
for i in range(n - m + 1):
# Check if the subpatterns match
for j in range(s):
if hashPattern(text, i + j * t, i + (j + 1) * t) != h[j]:
break
else:
# If the subpatterns match, check if
# the full pattern matches
if text[i:i + m] == pattern:
print("Match found at index", i)
match = True
# Shift the pattern by the appropriate
# amount
for j in range(s):
if i + shift[j] < n - m + 1:
break
else:
i += shift[j]
# If no match was found, print a message
if not match:
print("No match found")
# Driver Code
text = "the cat sat on the mat"
pattern = "the"
# Function call
wuManber(text, pattern)
KMP和Wu-Manber算法之间的区别
KMP算法和Wu Manber算法都是字符串匹配算法,也就是说它们都是用来在一个较大的字符串中寻找一个子串。这两种算法具有相同的时间复杂度,这意味着它们在算法运行所需的时间方面具有相同的性能特征。
但是,它们之间存在一些差异:
1、KMP算法使用预处理步骤生成部分匹配表,用于加快字符串匹配过程。这使得当搜索的模式相对较长时,KMP算法比Wu Manber算法更有效。
2、Wu Manber算法使用不同的方法来进行字符串匹配,它将模式划分为多个子模式,并使用这些子模式在文本中搜索匹配项。这使得Wu Manber算法在搜索的模式相对较短时比KMP算法更有效。
以上就是Wu-Manber算法简介及Python实现说明的详细内容,更多请关注编程网其它相关文章!
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341