使用HtmlAgilityPack將HtmlTable填入DataTable

来源:https://www.cnblogs.com/kqw/archive/2018/11/28/10029966.html
-Advertisement-
Play Games

HtmlAgilityPack.HtmlWeb hw = new HtmlAgilityPack.HtmlWeb(); HtmlAgilityPack.HtmlDocument doc = hw.Load("C:\\Users\\u1\\Desktop\\test html.html"); Html... ...


       HtmlAgilityPack.HtmlWeb hw = new HtmlAgilityPack.HtmlWeb();
            HtmlAgilityPack.HtmlDocument doc = hw.Load("C:\\Users\\u1\\Desktop\\test html.html");
            HtmlAgilityPack.HtmlNode rootNode = doc.DocumentNode;//獲取文檔的根節點                                                                                       //   //*[@id="report1"]/tbody
            string xpath = "//*[@id='report1']/tbody";
            HtmlAgilityPack.HtmlNode node = rootNode.SelectSingleNode(xpath);//獲取表格
            foreach (var script in node.Descendants("script").ToArray())
                script.Remove();
            foreach (var style in node.Descendants("style").ToArray())
                style.Remove();
            string innerText = node.OuterHtml;//到這裡就是純純的表格了      
            var trNodes = node.SelectNodes("tr");
            DataTable dt = new DataTable();
            for (int i = 0; i < 100; i++)   //給表格增加100個列
            {
                DataColumn dc = new DataColumn();
                dt.Columns.Add(dc);
            }
            foreach (var trnod in trNodes) //遍歷行
            {
                //dt.Rows.Add()
                DataRow dr = dt.NewRow();
                var tdNodes = trnod.SelectNodes("td");
                for (int i = 0; i < tdNodes.Count; i++) //遍歷列
                {
                    dr[i] = tdNodes[i].InnerText;
                }
                dt.Rows.Add(dr);
            }
            // 所有的數據讀取到了datatable 中

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1.閉包函數也叫匿名函數,一個沒有指定名稱的函數,一般會用在回調部分 2.閉包作為回調的基本使用, echo preg_replace_callback('~-([a-z])~', function ($match) { return strtoupper($match[1]); }, 'hello... ...
  • 1.進程: 進程(Process)是電腦中的程式關於某數據集合上的一次運行活動,是系統進行資源分配和調度的基本單位,是操作系統結構的基礎。在早期面向進程設計的電腦結構中,進程是程式的基本執行實體;在當代面向線程設計的電腦結構中,進程是線程的容器。程式是指令、數據及其組織形式的描述,進程是程式的 ...
  • 思路 首先肯定要樹形dp,一直沒想到怎麼用左偏樹。如果不斷彈出又不斷地合併複雜度不就太高了。瞄了眼題解才知道可以直接用大根樹。然後記錄出當前這棵左偏樹的大小(樹裡面所有點的薪水之和)以及點的個數。然後不斷的刪點。直到薪水滿足條件為止。 ...
  • 題意 "題目鏈接" Sol 直接把序列複製一遍 尾碼數組即可 在前$N$個位置中取$rak$最小的輸出 cpp include using namespace std; const int MAXN = 1e6 + 10; inline int read() { char c = getchar() ...
  • 我們常說的鎖是單進程多線程鎖,在多線程併發編程中,用於線程之間的數據同步,保護共用資源的訪問。而分散式鎖,指在分散式環境下,保護跨進程、跨主機、跨網路的共用資源,實現互斥訪問,保證一致性。 架構圖: 分散式鎖獲取思路a、在獲取分散式鎖的時候在locker節點下創建臨時順序節點,釋放鎖的時候刪除該臨時 ...
  • 大家肯定都有過在餓了麽,或者在美團外賣下單的經歷,下完單後,超過一定的時間,訂單就被自動取消了。這就是延時任務。延時任務的應用場景相當廣泛,不僅僅上面所說的餓了嗎,美團外賣,還有12306,或者是淘寶,攜程等等 都有這樣的場景。這延時任務是怎麼實現的呢?跟著我,繼續看下去吧。 1.在SQL查詢,Se ...
  • 一. 初識python. 1. 認識電腦 CPU(大腦) 3GHZ + 記憶體(DDR4) + 主板 + 電源(心臟)+ 顯示器 + 鍵盤 +滑鼠+ 顯卡 + 硬碟 80MB/s 操作系統 windows 家用 linux 伺服器 macOS 家用+伺服器 電腦是一個高度集成的電子電路 高低電平. ...
  • 上一篇說過在整個DI框架中 是核心,但是如果直接看 派生類其實看不出也沒什麼東西,因為這個類型其實都是調用的其它對象方法,所以我們先來看看其它的類型 ServiceCallSite ServiceCallSite ​ 這個是一個服務訪問配置的類型,DI內部使用此類的派生類型進行封裝所需要實例化的信息 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...