XML文件解析器TXml

来源:http://www.cnblogs.com/shouce/archive/2016/04/21/5415498.html
-Advertisement-
Play Games

前幾天看了開源的XML文件解析器TinyXml,它是怎麼實現解析的沒怎麼看懂,於是決定自己實現一個,反正最近不忙。先命名為TXml。現在完成瞭解析和查詢功能,全部代碼加起來不到1000行,將會繼續完善它。源碼必共用 先簡單說一下我的思路: 1:讀取XML文件信息,並存入一個字元數組中; 2:遍曆數組 ...


前幾天看了開源的XML文件解析器TinyXml,它是怎麼實現解析的沒怎麼看懂,於是決定自己實現一個,反正最近不忙。先命名為TXml。現在完成瞭解析和查詢功能,全部代碼加起來不到1000行,將會繼續完善它。源碼必共用

先簡單說一下我的思路:

1:讀取XML文件信息,並存入一個字元數組中;

2:遍曆數組,將數組解析成一棵樹;

3:以路徑的方式查詢和按屬性查詢;

這個解析器最麻煩的地方就在怎麼將字元數組解析成一顆樹。我們先看一下一個簡單XML文件,他包括文件頭、節點、節點名稱及節點值、屬性名稱及屬性值,子節點、父節點、註釋等。

<?xml version="1.0" encoding="utf-8" ?>
<!--註釋-->
<Items>
  <item name="chentaihan">89757</item>
</Items>

簡單介紹一下解析的實現,不太好說清楚,看代碼可能更容易理解一些。遞歸實現,每次都從一個節點開始解析,就是從字元“<”開始,到字元“>”結束,字元<後面就是節點的名稱,之後的就是節點屬性,字元>後一個字元如果不是<,那就是節點的值,如果是字元<,可能是子節點也可能是這個節點結束了。遇到字元<開始遞歸,空格和註釋直接被PASS。大致代碼如下:

複製代碼
const char* TXmlParser::ParseContent(const char* p,XmlNode* baseNode)
{ 
    if(p==NULL || !*p) 
        return NULL; 
    if(*p=='<')//開始一個節點
    {
        bool isNote;
        p=SkipNote(p,isNote);//跳過註釋
        if(isNote) {//是註釋
            ParseContent(p,baseNode); 
            return NULL;
        } 
        if(*p=='/')//結束節點
        {
            while(p!=NULL && *p && *p!='>')
            {
                p++;
            } 
            ++p=SkipWhiteSpace(p);
            ParseContent(p,baseNode->parent);//新節點
        }else{ //節點屬性  
            string name;
            while(p!=NULL && *p && *p!='>' && *p!=' ' && *p!='/')
            {
                 name.push_back(*p++); 
            }
            XmlNode* node=new XmlNode(name,baseNode);
            baseNode->AppendNode(node);

            if(*p=='>')
            {
                ++p=SkipWhiteSpace(p); 
                ParseContent(p,node);//新節點
            }else{
                p=GetAttr(p,node);
                if(*p=='/')
                {
                    while(p!=NULL && *p && *p!='<')
                        p++;
                    ParseContent(p,baseNode);//新節點
                }else{
                    ++p=SkipWhiteSpace(p);  
                    ParseContent(p,node);//新節點
                }
            }  
        }
    }else{//節點的值 
        GetNodeValue(p,baseNode);
    } 
}
複製代碼

按路徑的方式查詢。利用兩個數組實現,假設這兩個數組分別為A,B;第一次查詢將結果存入數組A,將A作為數據源,將查詢結果存入B,清除A中的數據,將B作為數據源,將查詢結果存入A,反覆進行,最後A,B中有一個就是查詢結果。當然也可以用遞歸實現,我們都知道遞歸太深容易爆線程棧,且性能低。

按屬性查詢。同樣沒有用遞歸實現,有個經常出現的面試題:按層序列印一個棵樹。那麼這裡也是按層序查找,就是利用一個隊列,按根節點、根節點的直接子節點進棧,一個個匹配,不匹配就出隊列。

複製代碼
//根據屬性查詢--利用隊列按層序查詢
XmlNode* XmlNode::SelectSingleNodeByAttr(const string& attrName,const string& attrValue,XmlNode* node)
{  
    if(node==NULL)
        return NULL; 
    if(node->attribute!=NULL && (*node->attribute)[attrName]==attrValue)
    { 
        return node;
    } 
    queue<XmlNode*> list; 
    for(int i=node->ChildCount()-1;i>=0;i--)
    {
        list.push((*node->childNodes)[i]); 
    }

    while(list.size()>0)
    {
        XmlNode* tmpNode=list.front();
        if(tmpNode->attribute!=NULL && (*tmpNode->attribute)[attrName]==attrValue)
        { 
            return tmpNode;
        }
        for(int i=tmpNode->ChildCount()-1;i>=0;i--)
        {
            list.push((*tmpNode->childNodes)[i]); 
        }
        list.pop();
    } 
    return NULL;
}
複製代碼

看了按屬性查找,我們就很容易知道,C#中ConfigurationManager讀取配置文件的大致實現,因為配置文件很簡單,就是一個節點下麵有多個節點,完全可以這樣實現,根節點基本可以無視,直接就是一個字典,KEY存key的值,VALUE存value的值,查找的時間複雜度就是O(1)。

簡單測試:

複製代碼
#include "XmlDocument.h"
 
int main()
{
    {    
        XmlDocument doc;
        doc.Load("test.txt");   
        cout<<"XML頭部:"<<doc.Head().c_str()<<endl;
        cout<<"顯示全部學生成績:" ;
        doc.ShowXML(doc);  
        cout<<endl;
        vector<XmlNode*> vect;
        doc.SelectNodes("students/student/courses/course",vect);
         
        XmlNode* node=doc.SelectSingleNode("students/Student/courses/course/Course"); 

        if(node!=NULL)
        {
            node->ShowXML(*node); 
            cout<<"name:"<<node->Name().c_str()<<endl;
            cout<<"屬性:";
            node->ShowAttr() ; 
            cout<<endl;
            cout<<"value:"<<node->Value().c_str()<<endl;
            cout<<"ChildCount:"<<node->ChildCount()<<endl<<endl;
            
             XmlNode::Iterator iter=node->begin();
            while(iter!=node->end())
            { 
                cout<<"name:"<<(*((iter)._Ptr))->Name().c_str() <<endl;
                cout<<"value:"<<(*((iter)._Ptr))->Value().c_str() <<endl; 
                iter++;
            }  
        }   
        cout<<"查找name=‘英文’的節點:"<<endl;
        XmlNode* node2=doc.SelectSingleNodeByAttr("name","英文");
        if(node2!=NULL){
            node2->ShowXML(*node2); 
        }
    }
    
    system("pause");
    return 0;
}
複製代碼

運行結果如下:

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在團隊中推廣面向介面開發兩年左右,成果總體來說我還是挺滿意的,使用面向介面開發的模塊使用Unity容器配置的功能非常穩定,便於共用遷移(另一個項目使用只需要複製配置和調用介面即可)也很好擴展(操作的資料庫、表、資源等都可以配置)。 但是由於當時開發的匆忙(邊開發邊應用),留下一些比較致命的問題: 1 ...
  • 如: 讓它選中“統計今天”(控制項Name為cobListTime) 方法: 1.cobListTime.Text = cobListTime.Items[0].ToString();//預設選中第一個值 2.cobListTime.SelectedText = "統計今天"; 3.cobListTi ...
  • 分類:Unity、C#、VS2015 創建日期:2016-04-20 一、簡介 Unity引擎提供了豐富的組件和類庫,為游戲開發提供了非常大的便利,熟練掌握和使用這些API,對於游戲開發的效率提高很重要。 這一節我們主要學習Transform的基本用法。本節例子的運行效果如下: 二、Transfor... ...
  • 數據透視表/圖通過對數據進行過濾、排序、分類彙總等,將結果生成彙總表格或圖表,幫您分析、組織、展示數據,從而提高工作效率並減少錯誤。 Excel 的數據透視表功能強大,那麼,我們自己開發的系統中,是否能嵌入同樣的功能? 當然可以! 葡萄城 ComponentOne 產品線的ComponentOne ...
  • ...
  • 1.開發IDE:Spring Tool Suite(自帶maven插件) 下載地址https://spring.io/tools/sts/all 在STS.ini配置信息中加下麵一行 保證編碼格式為utf-8 -Dfile.encoding=UTF-8 2.jdk:java 1.8 下載地址http... ...
  • php構造函數是對象創建完成後,第一個自動調用的方法,析構函數是當對象被釋放之前最後一個自動調用的方法。本文章向碼農介紹php構造函數與析構函數。 php構造函數 1.是對象創建完成後,“第一個”“自動調用”的方法 2.構造方法的定義,方法名是一個固定的, 在php4中:和類名相同的方法就是構造方法 ...
  • ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...