仓库源文站点原文


title: '算法:正则表达式匹配' cover: https://img.paulzzh.com/touhou/random?55 categories: 算法题目 date: 1996-07-27 08:00:00 tags: [算法题目, 字符串, DFS, 正则表达式]

toc: true

<br/>

<!--more-->

正则表达式匹配

正则表达式匹配

请实现一个函数用来匹配包括.*的正则表达式。模式中的字符.表示任意一个字符,而*表示它前面的字符可以出现任意次(包含0次)。

在本题中,匹配是指字符串的所有字符匹配整个模式。

例如,字符串aaa与模式a.aab*ac*a匹配,但是与aa.aab*a均不匹配


分析

当模式中的第二个字符不是“*”时:

而当模式中的第二个字符是“*”时:

使用递归的DFS对每一个可能分支进行搜索;


代码

public class Solution {
    public boolean match(char[] arr, char[] pattern) {
        if (arr == null && pattern == null) return true;

        return helper(arr, 0, pattern, 0);
    }

    private boolean helper(char[] arr, int start, char[] pattern, int patternIndex) {
        // 有效性检验:arr到尾,pattern到尾,匹配成功
        if (start == arr.length && patternIndex == pattern.length) return true;
        // pattern先到尾,匹配失败
        if (start != arr.length && patternIndex == pattern.length) return false;

        // 模式第2个是*,且字符串第1个跟模式第1个匹配,分3种匹配模式;如不匹配,模式后移2位
        if (patternIndex + 1 < pattern.length && pattern[patternIndex + 1] == '*') {
            if ((start != arr.length && pattern[patternIndex] == arr[start]) || (pattern[patternIndex] == '.' && start != arr.length)) {
                // 模式后移2,视为x*匹配0个字符
                return helper(arr, start, pattern, patternIndex + 2)
                        //视为模式匹配1个字符
                        || helper(arr, start + 1, pattern, patternIndex + 2)
                        //*匹配1个,再匹配arr中的下一个
                        || helper(arr, start + 1, pattern, patternIndex);
            } else {
                return helper(arr, start, pattern, patternIndex + 2);
            }
        }
        // 模式第2个不是*,且字符串第1个跟模式第1个匹配,则都后移1位,否则直接返回false
        if ((start != arr.length && pattern[patternIndex] == arr[start]) || (pattern[patternIndex] == '.' && start != arr.length)) {
            return helper(arr, start + 1, pattern, patternIndex + 1);
        }
        return false;
    }
}