AC自動機

来源:https://www.cnblogs.com/pluslius/archive/2019/05/04/10810471.html
-Advertisement-
Play Games

AC自動機 js class ACNode { constructor(data){ this.data = data this.children = new Map() this.isEndingChar = false this.length = 0 this.fail = null } } c ...


AC自動機

image

1.根據字元構造trie樹
2.構建失敗匹配指針
   1.根節點的所以一代子孩子失敗指針都指向root
   2.子節點匹配失敗時,找到父節點的失敗指針,找不到就一直找,直到找到root還匹配不到,直接指向root
3.文本串匹配
   1.如果已經匹配到完整的模式串或者壓根匹配不到,根據失敗指針切換線路繼續向下查找
   2.如果匹配到了,那麼就繼續向下匹配
class ACNode {
    constructor(data){
        this.data = data
        this.isEndingChar = false
        this.children = new Map()
        this.length = 0
        this.fail = null
    }
}

class ACTree {
    constructor(){
        this.root = new ACNode('/')
    }
    insert(text){
        let node = this.root
        for(let char of text ){
            if(!node.children.get(char)){
                node.children.set(char,new ACNode(char))
            }
            node = node.children.get(char)
        }
        node.isEndingChar = true
        node.length = text.length
    }
    failurePointer(){
        let root = this.root
        let queue = []
        queue.push(root)
        while(queue.length > 0){
            let currentNode = queue.shift()
            for(let child of currentNode.children.values()){
                if(!child){
                    continue
                }

                if(currentNode == root){
                    child.fail = currentNode
                }else{
                    //不是一代子節點才指向
                    let grandFatherNode = currentNode.fail
                    while(grandFatherNode){
                        let failNode = grandFatherNode.children.get(child.data)
                        if(failNode){
                            child.fail = failNode
                            //找到失敗節點就不往下找了
                            break
                        }
                        grandFatherNode = grandFatherNode.fail
                    }
                    if(!grandFatherNode){
                        child.fail = root
                    }
                }               
                queue.push(child)
            }
        }
    }
    match(text){
        let root = this.root
        let len =  text.length
        let currentNode
        for(let i = 0; i < len; i++){
            let char = text[i]

            if(!currentNode){
                currentNode = root
            }

            while(!currentNode.children.get(char) && currentNode != root){
                //匹配不到就換線
                currentNode = currentNode.fail
            }

            currentNode = currentNode.children.get(char)

            let tmp = currentNode
            while(tmp != root){
                if(tmp.isEndingChar){
                    console.log(`from ${i - tmp.length + 1} length: ${tmp.length} str: ${text.substr(i - tmp.length + 1,tmp.length)}`)
                }
                //匹配到了就繼續看看其他線有沒有可以匹配成功的
                tmp = tmp.fail 
            }

        }
    }
}

function match(text,patterns){
    const autoMeta = new ACTree()
    for(pattern of patterns){
        autoMeta.insert(pattern)
    }
    autoMeta.failurePointer()
    autoMeta.match(text)
}

let patterns = ["at", "art", "oars", "soar"];
let text = "soarsoars";
match(text, patterns);

let patterns2 = ["Fxtec Pro1", "谷歌Pixel"];
let text2 = "一家總部位於倫敦的公司Fxtex在MWC上就推出了一款名為Fxtec Pro1的手機,該機最大的亮點就是採用了側滑式全鍵盤設計。DxOMark年度總榜發佈 華為P20 Pro/谷歌Pixel 3爭冠";
match(text2, patterns2);

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • SQL中進行轉列 在很多筆試的程式員中會有很多寫SQL的情況,其中很多時候會考察行轉列。那麼這個時候如果能寫出來幾種行轉列的SQL,會給面試官留下比較好的印象。 以下是這次sql轉換的表結構以及數據 數據準備 1、學生表 CREATE TABLE `student` ( `stuid` VARCHA ...
  • OceanBase是阿裡巴巴和螞蟻金服完全自主研發的通用的分散式關係型資料庫,從1.0版本開始OceanBase就支持分區表,功能逐步跟ORACLE分區表相容,並且支持不同分區分佈在集群的不同節點(機器)上。本文是對OceanBase分區表的能力做一個詳細介紹。 ...
  • MySQL的SQL語言是用於訪問資料庫的最常用標準化語言。由於其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,一般中小型網站的開發都選擇MySQL作為網站資料庫。本文主要是入門知識講解,僅供學習分享使用。 ...
  • 原文鏈接 FORMAT() 之後 會滿三位加逗號, 在此基礎上進行數字運算的時候會出現預料之外的結果, 建議使用 : 任意一種 進行代替。 1 ...
  • 一.activity.xml 我這裡主要爬取的愛奇藝首頁的圖片進行輪播,應用了兩個github上的開源庫,一個banner的庫,一個載入網路圖片的庫,用開源庫能夠極大地節省我們編寫代碼的時間。 二.添加相關的庫以及網路許可權 三.activity.java 四.網路圖片載入的新類 代碼一共就這些,全部 ...
  • 最近需要把一個web端的項目做一個app,所以很多後臺代碼就順便複製了,如圖所示,在java代碼有一個簡單的時間戳格式化輸出日期的方法 Java代碼: 輸出結果: 得到的時間是2019-04-29 00:00:00 我們用時間戳轉換工具也得到了同樣的結果(時間戳轉換工具需要去除結尾的三個0) 但是在 ...
  • 一、事件背景: 我最近開源了一個個人耗時半年打造的富文本及一套適用於web後臺的ui框架,在gitee上受到網友們的關註,部分網友對我採用jquery的技術棧提出了質疑。總結起來:無非是jquery已經落後,不久將死。甚至有少數網友很激進:非vue技術棧,你不應該加入我這個群,不管你做得多好。對應這 ...
  • 組件(Component)是Vue.js最核心的功能,也是整個框架設計最精彩的地方,當然也是最難掌握的。本章將帶領你由淺入深地學習組件的全部內容,並通過幾個實戰項目熟練使用Vue組件。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...