LeetCode 10. 正則表達式匹配 | Python

来源:https://www.cnblogs.com/yiluolion/archive/2020/05/02/12819347.html
-Advertisement-
Play Games

10. 正則表達式匹配 題目來源: "https://leetcode cn.com/problems/regular expression matching" 題目 給你一個字元串 s 和一個字元規律 p,請你來實現一個支持 '.' 和 ' ' 的正則表達式匹配。 '.' 匹配任意單個字元 ' ' ...


10. 正則表達式匹配


題目來源:https://leetcode-cn.com/problems/regular-expression-matching

題目


給你一個字元串 s 和一個字元規律 p,請你來實現一個支持 '.' 和 '*' 的正則表達式匹配。

'.' 匹配任意單個字元
'*' 匹配零個或多個前面的那一個元素
所謂匹配,是要涵蓋 整個 字元串 s的,而不是部分字元串。

說明:

  • s 可能為空,且只包含從 a-z 的小寫字母。
  • p 可能為空,且只包含從 a-z 的小寫字母,以及字元 . 和 *。

示例 1:

輸入:
s = "aa"
p = "a"
輸出: false
解釋: "a" 無法匹配 "aa" 整個字元串。

示例 2:

輸入:
s = "aa"
p = "a*"
輸出: true
解釋: 因為 '*' 代表可以匹配零個或多個前面的那一個元素, 在這裡前面的元素就是 'a'。因此,字元串 "aa" 可被視為 'a' 重覆了一次。

示例 3:

輸入:
s = "ab"
p = ".*"
輸出: true
解釋: ".*" 表示可匹配零個或多個('*')任意字元('.')。

示例 4:

輸入:
s = "aab"
p = "c*a*b"
輸出: true
解釋: 因為 '*' 表示零個或多個,這裡 'c' 為 0 個, 'a' 被重覆一次。因此可以匹配字元串 "aab"。

示例 5:

輸入:
s = "mississippi"
p = "mis*is*p*."
輸出: false

解題思路


暴力解

先從【暴力解】的角度理清問題。

這個題目中,難點就在於處理 .* 兩個符號。

如果只是要求檢查兩個普通字元是否匹配。那麼通過直接遍歷,檢查每個數組對應的元素是否相同來判斷是否匹配即可。例如:

def isMatch(s, p):
    if len(s) != len(p):
        return False
    for i in range(p):
        if s[i] != p[i]:
            return False
    return True

那代碼大概就會是這樣。那我們用遞歸的形式來書寫,以下為偽代碼:

def isMatch(s, p):
    """
    s: text
    p: pattern
    """
    if p is empty:
        return s is empty
    first_match = (s not empty) and p[0] == s[0]
    return first_match and isMatch(s[1:], p[1:])

在上面的代碼中,其實就是通過先判斷前面的元素是否匹配,逐層往下判斷後面的元素是否也匹配,從而來找到答案。

現在來處理兩個符號的問題,. 這個符號,表示的是匹配處換行符以外的任意字元(這裡就不展開說明瞭,若需詳細瞭解,可直接上網搜索)。

瞭解這個符號的含義後,這裡所能表達的意義,也會相應的改變,即是說,當 p 中出現 . 號,s 對應的元素無論是什麼字元(題目說明 s 僅包含 a-z 字元)都能夠匹配,現在根據上面的偽代碼進行修改:

def isMatch(s, p):
    """
    s: text
    p: pattern
    """
    if not p:
        return not s
    first_match = bool(s) and p[0] in {s[0], '.'}
    return first_match and isMatch(s[1:], p[1:])

這裡唯一不同的就是 first_match 這部分的判斷中,因為 p 中的元素可能出現固定字元,或者 . 號,所以當 p 出現的字元與 s 中對應的字元相同,或者 p 此處是 . 字元,這裡兩者都表示能夠匹配。

那麼現在往下看 * 符號,這個符號表示的含義是重覆零次或多次。那麼這裡最明顯的字元就是重覆多少次的問題?在這裡考慮使用遞歸的方式書寫,假設重覆 n 次,其實這裡先不需要考慮 n 是多少,把這個交給遞歸實現。要考慮那麼當下的情況,這裡應該就只有兩個選擇,要麼是匹配 0 次,要麼是匹配 1 次。

那麼相應的代碼就應該修改為(這裡書寫發現 * 的情況):

# 這裡表示發現 `*` 的情況下,
if len(p) >= 2 and p[1] == '*':
    # 這裡需要考慮匹配 0 次的問題,例如 aa,c*aa
    # 也要考慮匹配多次的問題,例如 aa, a*
    return isMatch(s, p[2:]) or first_match and isMatch(s[1:], p)

在這段代碼當中,isMatch(s, p[2:]) 這裡表示,字元匹配 0 次,跳過 p 中字元與 * 結合這部分。後面的表示,p[0] 和 s[0] 匹配之後,繼續判斷 s 接下來的元素。其中保留 p,只向後移動 s,是為了實現 * 匹配多次的功能。

這樣來看,其實已經可以說理清兩個符號的具體實現方式。

關於完整的代碼請查看【代碼實現】部分。

動態規劃

思路:動態規劃

在上面暴力解的方法中,頻繁使用切片操作,複雜度高。這裡在暴力解的基礎上,使用動態規劃的方法,定義變數 i,j 來記錄當前匹配到的位置,用 dp(i, j) 表示 s[i:] 和 p[j:] 是否能夠匹配。,避免頻繁切片。這裡也引入備忘錄的概念,用來避免重覆的運算。

具體代碼同樣請查看【代碼實現】部分。

代碼實現


暴力解 | 代碼實現
class Solution:
    def isMatch(self, s: str, p: str) -> bool:
        if not p:
            return not s

        first_match = bool(s) and p[0] in {s[0], '.'}

        if len(p) >= 2 and p[1]=="*":
            return self.isMatch(s, p[2:]) or first_match and self.isMatch(s[1:], p)
        else:
            return first_match and self.isMatch(s[1:], p[1:])
動態規劃 | 代碼實現
class Solution:
    def isMatch(self, s: str, p: str) -> bool:
        memo = {}
        def dp(i, j):
            if (i, j) not in memo:
                if j == len(p):
                    return i == len(s)

                else:
                    first_match = i < len(s) and p[j] in {s[i], '.'}
                    if j + 1 < len(p) and p[j+1] == '*':
                        ans = dp(i, j+2) or first_match and dp(i+1, j)
                    else:
                        ans = first_match and dp(i+1, j+1)

                memo[(i, j)] = ans

            return memo[(i, j)]

        return dp(0, 0)


實現結果


暴力解 | 實現結果

暴力解 | 實現結果

動態規劃 | 實現結果

動態規劃 | 實現結果


以上就是使用暴力解的形式,理清題目的難點,進而使用動態規劃加備忘錄的形式來進一步降低複雜度,更高效的解決《10. 正則表達式匹配》問題的主要內容。


歡迎關註微信公眾號《書所集錄》


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 我的LeetCode:https://leetcode cn.com/u/ituring/ 我的LeetCode刷題源碼[GitHub]:https://github.com/izhoujie/Algorithmcii LeetCode 面試題15. 二進位中1的個數 與以下題目相同 前往:Leet ...
  • 我的LeetCode:https://leetcode cn.com/u/ituring/ 我的LeetCode刷題源碼[GitHub]:https://github.com/izhoujie/Algorithmcii LeetCode 191. 位1的個數 題目 編寫一個函數,輸入是一個無符號整數 ...
  • QMovie,多線程,pyqt5,python3 網路上找遍了,根本不是我遇到的問題啊QAQ,之後就終止了這個項目,改做其他的了 但是之後貌似發現了一點問題的思路,供大家參考: 當一個視窗被打開多次時,就會觸發這種錯誤 當多個線程擠在一起的時候,比較常見 特別是當多線程和QMovie這個東西並行的時 ...
  • 基礎數據結構 棧(stack) 隊列 (queue) 雙端隊列 ( deque ) 順序表 與 記憶體 簡單瞭解一下記憶體 順序表 順序表的弊端:順序表的結構需要預先知道數據大小來申請連續的存儲空間,而在進行擴充時又需要進行數據的搬遷。 鏈表 (Linked list) 二叉樹 二叉樹 根節點 葉子節點 ...
  • 我的LeetCode:https://leetcode cn.com/u/ituring/ 我的LeetCode刷題源碼[GitHub]:https://github.com/izhoujie/Algorithmcii LeetCode 343. 整數拆分 與以下題目相同 前往:LeetCode 面 ...
  • 我的LeetCode:https://leetcode cn.com/u/ituring/ 我的LeetCode刷題源碼[GitHub]:https://github.com/izhoujie/Algorithmcii LeetCode 面試題14 I. 剪繩子 與以下題目相同 前往:LeetCod ...
  • 二叉樹 每個結點最多有兩個孩子,其餘結構和樹的結構一樣。 1. 二叉樹特點 二叉樹的特點有: 每個結點最多有兩棵子樹,所以二叉樹中不存在度大於2的結點。 左子樹和右子樹是有順序的,次序不能任意顛倒。 即使樹中某結點只有一棵子樹,也要區分它是左子樹還是右子樹。 二叉樹有五種基本形態: 空二叉樹; 只有 ...
  • 我的LeetCode:https://leetcode cn.com/u/ituring/ 我的LeetCode刷題源碼[GitHub]:https://github.com/izhoujie/Algorithmcii LeetCode 面試題14 II. 剪繩子 II 題目 給你一根長度為 n 的 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...