6.2 Sunday搜索記憶體特征

来源:https://www.cnblogs.com/LyShark/archive/2023/09/21/17719081.html
-Advertisement-
Play Games

Sunday 演算法是一種字元串搜索演算法,由`Daniel M.Sunday`於1990年開發,該演算法用於在較長的字元串中查找子字元串的位置。演算法通過將要搜索的模式的字元與要搜索的字元串的字元進行比較,從模式的最左側位置開始。如果發現不匹配,則演算法將模式向右`滑動`一定數量的位置。這個數字是由當前文本... ...


Sunday 演算法是一種字元串搜索演算法,由Daniel M.Sunday於1990年開發,該演算法用於在較長的字元串中查找子字元串的位置。演算法通過將要搜索的模式的字元與要搜索的字元串的字元進行比較,從模式的最左側位置開始。如果發現不匹配,則演算法將模式向右滑動一定數量的位置。這個數字是由當前文本中當前模式位置的最右側字元確定的。相比於暴力方法,該演算法被認為更加高效。

6.2.1 字元串與特征碼轉換

GetSignatureCodeArray函數,該函數用於將給定的十六進位串表示的位元組碼特征碼轉換為十進位數,存儲在一個整型數組中,以便後續進行搜索。同時,特征碼中的未知標記符號?會被用256 替代,方便後續搜索對特征碼的匹配。

其中,參數SignatureCode為一串十六進位字元串,描述要搜索的位元組碼特征碼,參數BytesetSequence為一個整型數組,用於存儲將十六進位數轉為十進位後的結果。該函數首先計算給定的十六進位串中包含的位元組碼個數,因為每個位元組對應兩個十六進位字元,再加上每兩個字元間的空格,故需要將十六進位字元串長度除以三,再加上一。

接下來,函數逐個字元讀入特征碼串中的每一個十六進位數,如果是有效的十六進位數,則轉化為十進位數存入BytesetSequence數組中。如果遇到未知的標記符號?,則在BytesetSequence數組中用256表示該位置的值。最後,返回特征碼數組中位元組碼的個數。

// 定義全局變數
#define BLOCKMAXSIZE 409600  // 每次讀取記憶體的最大大小
BYTE* MemoryData;            // 每次將讀取的記憶體讀入這裡
SHORT Next[260];             // 搜索下一個記憶體區域

// 將傳入的SignatureCode特征碼字元串轉換為BytesetSequence特征碼位元組集
WORD GetSignatureCodeArray(char* SignatureCode, WORD* BytesetSequence)
{
    int len = 0;

    // 用於存儲特征碼數組長度
    WORD SignatureCodeLength = strlen(SignatureCode) / 3 + 1;

    // 將十六進位特征碼轉為十進位
    // 依次遍歷SignatureCode中的每一個十六進位數
    for (int i = 0; i < strlen(SignatureCode);)
    {
        char num[2];

        // 分別取出第一個和第二個十六進位字元
        num[0] = SignatureCode[i++];
        num[1] = SignatureCode[i++];
        i++;

        // 如果兩個字元都是有效的十六進位數,則將它們轉換成十進位並存儲到 BytesetSequence 中
        if (num[0] != '?' && num[1] != '?')
        {
            int sum = 0;
            WORD a[2];

            // 分別將兩個十六進位字元轉換成十進位數
            for (int i = 0; i < 2; i++)
            {
                // 如果是數字
                if (num[i] >= '0' && num[i] <= '9')
                {
                    a[i] = num[i] - '0';
                }
                // 如果是小寫字母
                else if (num[i] >= 'a' && num[i] <= 'z')
                {
                    a[i] = num[i] - 87;
                }
                // 如果是大寫字母
                else if (num[i] >= 'A' && num[i] <= 'Z')
                {
                    a[i] = num[i] - 55;
                }
            }

            // 計算兩個十六進位數轉換後的十進位數,並將其存儲到 BytesetSequence 數組中
            sum = a[0] * 16 + a[1];
            BytesetSequence[len++] = sum;
        }
        else
        {
            BytesetSequence[len++] = 256;
        }
    }
    return SignatureCodeLength;
}

6.2.2 搜索記憶體區域特征

SearchMemoryBlock函數,該函數用於在指定進程的某一塊記憶體中搜索給定的位元組碼特征碼,查找成功則將匹配地址存入結果數組中。其中,參數hProcess為指向要搜索記憶體塊所在進程的句柄,SignatureCode為給定特征碼的數組指針,SignatureCodeLength為特征碼長度,StartAddress為搜索的起始地址,size為搜索記憶體的大小,ResultArray為存儲搜索結果的數組引用。

通過調用ReadProcessMemory函數讀取進程記憶體中指定地址和大小的數據,將讀取的數據存入變數MemoryData中,然後對讀取的數據進行匹配,查找特征碼。若匹配成功,則將特征碼匹配的起始地址存入結果數組中。在匹配時,採用了KMP演算法。如果找到與特征碼中的位元組碼不匹配的位元組,就根據Next數組記錄的回溯位置,重新從失配的位置開始匹配,以降低匹配的時間複雜度,提高搜索效率。在代碼中,若特征碼中存在問號,則匹配位置從問號處開始重新匹配,如果沒有則繼續按照Next數組回溯進行匹配。

// 獲取GetNextArray數組
void GetNextArray(short* next, WORD* SignatureCode, WORD SignatureCodeLength)
{
    // 特征碼位元組集的每個位元組的範圍在0-255(0-FF)之間
    // 256用來表示問號,到260是為了防止越界
    for (int i = 0; i < 260; i++)
    {
        next[i] = -1;
    }
    for (int i = 0; i < SignatureCodeLength; i++)
    {
        next[SignatureCode[i]] = i;
    }
}

// 搜索一塊記憶體區域中的特征
void SearchMemoryBlock(HANDLE hProcess, WORD* SignatureCode, WORD SignatureCodeLength, unsigned __int64 StartAddress, unsigned long size, vector<unsigned __int64>& ResultArray)
{
    // 讀取指定進程的記憶體數據到MemoryData緩衝區中
    if (!ReadProcessMemory(hProcess, (LPCVOID)StartAddress, MemoryData, size, NULL))
    {
        return;
    }

    // 迴圈遍歷記憶體數據緩衝區
    for (int i = 0, j, k; i < size;)
    {
        j = i; k = 0;

        // 逐個比對記憶體數據緩衝區中的位元組和特征碼中的位元組
        for (; k < SignatureCodeLength && j < size && (SignatureCode[k] == MemoryData[j] || SignatureCode[k] == 256); k++, j++);

        // 如果特征碼完全匹配到記憶體數據緩衝區中的一段數據
        if (k == SignatureCodeLength)
        {
            // 將該段數據的起始地址保存到結果數組中
            ResultArray.push_back(StartAddress + i);
        }

        // 如果已經處理到緩衝區的末尾
        if ((i + SignatureCodeLength) >= size)
        {
            return;
        }

        int num = Next[MemoryData[i + SignatureCodeLength]];

        // 如果特征碼中有問號,從問號處開始匹配
        if (num == -1)
        {
            // 如果特征碼有問號,就從問號處開始匹配,如果沒有就 i += -1
            i += (SignatureCodeLength - Next[256]);
        }
        else
        {
            // 否則從匹配失敗的位置開始
            i += (SignatureCodeLength - num);
        }
    }
}

6.2.3 搜索整塊記憶體區域

SearchMemory函數,該函數用於在指定進程的記憶體空間中搜索給定特征碼的記憶體塊,並把搜索到的記憶體地址存入結果數組中。函數為一層迴圈枚舉給定的記憶體塊,內部則調用SearchMemoryBlock函數進行記憶體塊搜索。其中,參數hProcess為指向要搜索記憶體塊所在進程的句柄,SignatureCode為給定特征碼的字元串指針,StartAddress為搜索的起始地址,EndAddress為搜索的結束地址,InitSize為搜索結果數組初始空間大小,ResultArray為存儲搜索結果的數組引用。

該函數首先通過調用VirtualQueryEx函數獲取可讀可寫和可讀可寫可執行的記憶體塊信息,並遍歷每個記憶體塊,對記憶體塊進行搜索。之所以不直接搜索整個記憶體區域,是因為那樣可以減少非必要的搜索,提高效率。

記憶體塊的搜索通過調用SearchMemoryBlock函數實現。搜索採用了KMP演算法,先通過GetNextArray函數和GetSignatureCodeArray函數將特征碼轉換為對應的變數,再對每個記憶體塊逐個匹配,在匹配過程中若找到與特征碼中的位元組碼不匹配的位元組,就根據Next數組記錄的回溯位置從失配的位置開始重新匹配,以降低匹配的時間複雜度。在記憶體塊搜索過程中,若匹配成功,則將特征碼匹配的起始地址存入結果數組中,最終函數返回結果數組大小。

// 實現搜索整個程式
int SearchMemory(HANDLE hProcess, char* SignatureCode, unsigned __int64 StartAddress, unsigned __int64 EndAddress, int InitSize, vector<unsigned __int64>& ResultArray)
{
    int i = 0;
    unsigned long BlockSize;
    MEMORY_BASIC_INFORMATION mbi;

    WORD SignatureCodeLength = strlen(SignatureCode) / 3 + 1;
    WORD* SignatureCodeArray = new WORD[SignatureCodeLength];

    // 實現特征碼字元串與數組轉換
    GetSignatureCodeArray(SignatureCode, SignatureCodeArray);
    GetNextArray(Next, SignatureCodeArray, SignatureCodeLength);

    // 初始化結果數組
    ResultArray.clear();
    ResultArray.reserve(InitSize);

    // 查詢記憶體屬性並迴圈
    while (VirtualQueryEx(hProcess, (LPCVOID)StartAddress, &mbi, sizeof(mbi)) != 0)
    {
        // 判斷並獲取具有PAGE_READWRITE讀寫,或者PAGE_EXECUTE_READWRITE讀寫執行許可權的記憶體
        if (mbi.Protect == PAGE_READWRITE || mbi.Protect == PAGE_EXECUTE_READWRITE)
        {
            i = 0;

            // 得到當前塊長度
            BlockSize = mbi.RegionSize;
            
            // 搜索這塊記憶體
            while (BlockSize >= BLOCKMAXSIZE)
            {
                // 調用記憶體塊搜索功能依次搜索記憶體
                SearchMemoryBlock(hProcess, SignatureCodeArray, SignatureCodeLength, StartAddress + (BLOCKMAXSIZE * i), BLOCKMAXSIZE, ResultArray);
                BlockSize -= BLOCKMAXSIZE;
                i++;
            }
            SearchMemoryBlock(hProcess, SignatureCodeArray, SignatureCodeLength, StartAddress + (BLOCKMAXSIZE * i), BlockSize, ResultArray);
        }

        // 開始地址增加下一塊長度繼續搜索
        StartAddress += mbi.RegionSize;
        if (EndAddress != 0 && StartAddress > EndAddress)
        {
            return ResultArray.size();
        }
    }

    // 釋放特征碼數組並返回搜索計數器
    free(SignatureCodeArray);
    return ResultArray.size();
}

將上述代碼理解後讀者可以自行使用

int main(int argc, char *argv[])
{
    // 通過進程名獲取進程PID號
    DWORD Pid = GetPidByName("PlantsVsZombies.exe");
    printf("[*] 獲取進程PID = %d \n", Pid);

    // 初始化MemoryData大小
    MemoryData = new BYTE[BLOCKMAXSIZE];

    // 存儲搜索返回值
    vector<unsigned __int64> ResultArray;

    // 通過進程ID獲取進程句柄
    HANDLE hProcess = OpenProcess(PROCESS_ALL_ACCESS, false, Pid);

    // 開始搜索
    // 搜索特征碼 FF 25 ?? 從0x0000000到0xFFFFFFF 初始長度為3 返回值放入ResultArray
    SearchMemory(hProcess, "FF 25 ??", 0x0000000, 0xFFFFFFF, 3, ResultArray);

    // 輸出結果
    for (vector<unsigned __int64>::iterator it = ResultArray.begin(); it != ResultArray.end(); it++)
    {
        printf("0x%08X \n", *it);
    }

    system("pause");
    return 0;
}

編譯並運行上述程式片段,則會枚舉hProcess進程內特征碼時FF 25 ??的片段,枚舉位置為0x0000000-0xFFFFFFF枚舉長度為3個特征,最終將枚舉結果輸出到ResultArray數組內,輸出效果圖如下所示;

本文作者: 王瑞
本文鏈接: https://www.lyshark.com/post/ae682eb.html
版權聲明: 本博客所有文章除特別聲明外,均採用 BY-NC-SA 許可協議。轉載請註明出處!

文章作者:lyshark (王瑞)
文章出處:https://www.cnblogs.com/LyShark/p/17719081.html
本博客所有文章除特別聲明外,均採用 BY-NC-SA 許可協議。轉載請註明出處!
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Java基礎語法 JAVA--黑馬程式員 筆記 一、Java入門 1、JAVA 是一種很火的電腦語言。 2、JAVA 代碼編寫分三步: 編寫程式源碼,即編寫一個java文件 編譯:翻譯文件, javac是JDK提供的編譯工具,對java文件編譯後會產生一個class文件,class文件即交給電腦 ...
  • 內置數據類型 在編程中,數據類型是一個重要的概念。 變數可以存儲不同類型的數據,不同類型可以執行不同的操作。 Python預設內置了以下這些數據類型,分為以下幾類: 文本類型:str 數值類型:int、float、complex 序列類型:list、tuple、range 映射類型:dict 集合類 ...
  • 目錄前言介紹照片:後續: 前言 V~~~V。 介紹 進程間通訊(Inter-Process Communication,IPC)是操作系統中的一個重要概念,用於不同進程之間的數據傳輸和交互。有多種方式可以實現進程間通訊,以下是其中一些常見的方式: 管道(Pipe):管道是一種單向通信方式,通常用於具 ...
  • 等待事件或等待其他條件 坐車案例 想象一種情況:假設晚上坐車外出,如何才能確保不坐過站又能使自己最輕鬆? 方法一:不睡覺,時刻關註自己的位置 1 #include <iostream> 2 #include <thread> 3 #include <mutex> 4 using namespace ...
  • 基於java線上心理健康咨詢系統設計與實現,可適用於基於java心理健康,java心理咨詢室系統,大學生心理健康,心理健康系統,大學生心理評測管理系統,心理健康平臺系統,校園心理健康評測平臺,校園健康咨詢,校園心理健康咨詢,java心理咨詢室,校園心理咨詢室。 ...
  • Record Patterns 第一次發佈預覽是在JDK 19、隨後又在JDK 20中進行了完善。現在,Java 21開始正式推出該特性優化。下麵我們通過一個例子來理解這個新特性。 record Point(int x, int y) {} static void printSum(Object o ...
  • 基於java酒店客房管理系統設計與實現,可適用於java酒店管理系統,客房系統,酒店客房系統,酒店保潔系統,酒店打掃系統,酒店客房系統,客房酒店管理系統,酒店房間系統,酒店房間管理系統,酒店房間打掃,酒店房間保潔系統,房間酒店系統,賓館客房系統等等; ...
  • 目錄一、爬取目標二、爬取結果三、代碼講解四、技術總結五、演示視頻六、附完整源碼 一、爬取目標 您好!我是@馬哥python說,一名10年程式猿。 今天分享一期爬蟲案例,爬取的目標是:今日頭條熱榜的榜單數據。 打開今日頭條 首頁,在頁面右側會看到頭條熱榜,如下: 爬取以上6個關鍵欄位,含: 熱榜排名, ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...