XML文件解析器TXml_ZenDei技術網路在線

XML文件解析器TXml

-Advertisement-

前幾天看了開源的XML文件解析器TinyXml，它是怎麼實現解析的沒怎麼看懂，於是決定自己實現一個，反正最近不忙。先命名為TXml。現在完成瞭解析和查詢功能，全部代碼加起來不到1000行，將會繼續完善它。源碼必共用先簡單說一下我的思路： 1：讀取XML文件信息，並存入一個字元數組中； 2：遍曆數組 ...

前幾天看了開源的XML文件解析器TinyXml，它是怎麼實現解析的沒怎麼看懂，於是決定自己實現一個，反正最近不忙。先命名為TXml。現在完成瞭解析和查詢功能，全部代碼加起來不到1000行，將會繼續完善它。源碼必共用

先簡單說一下我的思路：

1：讀取XML文件信息，並存入一個字元數組中；

2：遍曆數組，將數組解析成一棵樹；

3：以路徑的方式查詢和按屬性查詢；

這個解析器最麻煩的地方就在怎麼將字元數組解析成一顆樹。我們先看一下一個簡單XML文件，他包括文件頭、節點、節點名稱及節點值、屬性名稱及屬性值，子節點、父節點、註釋等。

<?xml version="1.0" encoding="utf-8" ?>
<!--註釋-->
<Items>
  <item name="chentaihan">89757</item>
</Items>

簡單介紹一下解析的實現，不太好說清楚，看代碼可能更容易理解一些。遞歸實現，每次都從一個節點開始解析，就是從字元“<”開始，到字元“>”結束，字元<後面就是節點的名稱，之後的就是節點屬性，字元>後一個字元如果不是<，那就是節點的值，如果是字元<,可能是子節點也可能是這個節點結束了。遇到字元<開始遞歸，空格和註釋直接被PASS。大致代碼如下：

const char* TXmlParser::ParseContent(const char* p,XmlNode* baseNode)
{ 
    if(p==NULL || !*p) 
        return NULL; 
    if(*p=='<')//開始一個節點
    {
        bool isNote;
        p=SkipNote(p,isNote);//跳過註釋
        if(isNote) {//是註釋
            ParseContent(p,baseNode); 
            return NULL;
        } 
        if(*p=='/')//結束節點
        {
            while(p!=NULL && *p && *p!='>')
            {
                p++;
            } 
            ++p=SkipWhiteSpace(p);
            ParseContent(p,baseNode->parent);//新節點
        }else{ //節點屬性  
            string name;
            while(p!=NULL && *p && *p!='>' && *p!=' ' && *p!='/')
            {
                 name.push_back(*p++); 
            }
            XmlNode* node=new XmlNode(name,baseNode);
            baseNode->AppendNode(node);

            if(*p=='>')
            {
                ++p=SkipWhiteSpace(p); 
                ParseContent(p,node);//新節點
            }else{
                p=GetAttr(p,node);
                if(*p=='/')
                {
                    while(p!=NULL && *p && *p!='<')
                        p++;
                    ParseContent(p,baseNode);//新節點
                }else{
                    ++p=SkipWhiteSpace(p);  
                    ParseContent(p,node);//新節點
                }
            }  
        }
    }else{//節點的值 
        GetNodeValue(p,baseNode);
    } 
}

按路徑的方式查詢。利用兩個數組實現，假設這兩個數組分別為A,B；第一次查詢將結果存入數組A，將A作為數據源，將查詢結果存入B，清除A中的數據，將B作為數據源，將查詢結果存入A，反覆進行，最後A,B中有一個就是查詢結果。當然也可以用遞歸實現，我們都知道遞歸太深容易爆線程棧，且性能低。

按屬性查詢。同樣沒有用遞歸實現，有個經常出現的面試題：按層序列印一個棵樹。那麼這裡也是按層序查找，就是利用一個隊列，按根節點、根節點的直接子節點進棧，一個個匹配，不匹配就出隊列。

//根據屬性查詢--利用隊列按層序查詢
XmlNode* XmlNode::SelectSingleNodeByAttr(const string& attrName,const string& attrValue,XmlNode* node)
{  
    if(node==NULL)
        return NULL; 
    if(node->attribute!=NULL && (*node->attribute)[attrName]==attrValue)
    { 
        return node;
    } 
    queue<XmlNode*> list; 
    for(int i=node->ChildCount()-1;i>=0;i--)
    {
        list.push((*node->childNodes)[i]); 
    }

    while(list.size()>0)
    {
        XmlNode* tmpNode=list.front();
        if(tmpNode->attribute!=NULL && (*tmpNode->attribute)[attrName]==attrValue)
        { 
            return tmpNode;
        }
        for(int i=tmpNode->ChildCount()-1;i>=0;i--)
        {
            list.push((*tmpNode->childNodes)[i]); 
        }
        list.pop();
    } 
    return NULL;
}

看了按屬性查找，我們就很容易知道，C#中ConfigurationManager讀取配置文件的大致實現，因為配置文件很簡單，就是一個節點下麵有多個節點，完全可以這樣實現，根節點基本可以無視，直接就是一個字典，KEY存key的值，VALUE存value的值，查找的時間複雜度就是O(1)。

簡單測試：

#include "XmlDocument.h"
 
int main()
{
    {    
        XmlDocument doc;
        doc.Load("test.txt");   
        cout<<"XML頭部："<<doc.Head().c_str()<<endl;
        cout<<"顯示全部學生成績：" ;
        doc.ShowXML(doc);  
        cout<<endl;
        vector<XmlNode*> vect;
        doc.SelectNodes("students/student/courses/course",vect);
         
        XmlNode* node=doc.SelectSingleNode("students/Student/courses/course/Course"); 

        if(node!=NULL)
        {
            node->ShowXML(*node); 
            cout<<"name:"<<node->Name().c_str()<<endl;
            cout<<"屬性：";
            node->ShowAttr() ; 
            cout<<endl;
            cout<<"value:"<<node->Value().c_str()<<endl;
            cout<<"ChildCount:"<<node->ChildCount()<<endl<<endl;
            
             XmlNode::Iterator iter=node->begin();
            while(iter!=node->end())
            { 
                cout<<"name:"<<(*((iter)._Ptr))->Name().c_str() <<endl;
                cout<<"value:"<<(*((iter)._Ptr))->Value().c_str() <<endl; 
                iter++;
            }  
        }   
        cout<<"查找name=‘英文’的節點："<<endl;
        XmlNode* node2=doc.SelectSingleNodeByAttr("name","英文");
        if(node2!=NULL){
            node2->ShowXML(*node2); 
        }
    }
    
    system("pause");
    return 0;
}

運行結果如下：

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Asp.net 面向介面框架之應用程式上下文作用域組件

在團隊中推廣面向介面開發兩年左右,成果總體來說我還是挺滿意的,使用面向介面開發的模塊使用Unity容器配置的功能非常穩定,便於共用遷移(另一個項目使用只需要複製配置和調用介面即可)也很好擴展(操作的資料庫、表、資源等都可以配置)。但是由於當時開發的匆忙(邊開發邊應用),留下一些比較致命的問題: 1 ...
預設選中ComboBox的某一項

如：讓它選中“統計今天”（控制項Name為cobListTime）方法： 1.cobListTime.Text = cobListTime.Items[0].ToString();//預設選中第一個值 2.cobListTime.SelectedText = "統計今天"; 3.cobListTi ...
【Unity】6.4 Transform--移動、旋轉和縮放游戲對象

分類：Unity、C#、VS2015 創建日期：2016-04-20 一、簡介 Unity引擎提供了豐富的組件和類庫，為游戲開發提供了非常大的便利，熟練掌握和使用這些API，對於游戲開發的效率提高很重要。這一節我們主要學習Transform的基本用法。本節例子的運行效果如下：二、Transfor... ...
怎樣讓您的系統也有“數據透視表”功能？

數據透視表/圖通過對數據進行過濾、排序、分類彙總等，將結果生成彙總表格或圖表，幫您分析、組織、展示數據，從而提高工作效率並減少錯誤。 Excel 的數據透視表功能強大，那麼，我們自己開發的系統中，是否能嵌入同樣的功能？當然可以！葡萄城 ComponentOne 產品線的ComponentOne ...
c#字元串方法

...
SpringMVC+Mybatis+Mysql實戰項目學習--環境搭建

1.開發IDE：Spring Tool Suite(自帶maven插件) 下載地址https://spring.io/tools/sts/all 在STS.ini配置信息中加下麵一行保證編碼格式為utf-8 -Dfile.encoding=UTF-8 2.jdk：java 1.8 下載地址http... ...
php構造函數與析構函數

php構造函數是對象創建完成後，第一個自動調用的方法,析構函數是當對象被釋放之前最後一個自動調用的方法。本文章向碼農介紹php構造函數與析構函數。 php構造函數 1.是對象創建完成後，“第一個”“自動調用”的方法 2.構造方法的定義，方法名是一個固定的，在php4中:和類名相同的方法就是構造方法 ...
PHP資料庫調用類調用實例

...