.net解析csv(C#導表工具)

来源:https://www.cnblogs.com/zhaoqingqing/archive/2018/12/20/10150083.html
-Advertisement-
Play Games

前言 解析Excel有知名的NPOI庫,(Java語言是POI),但是NPOI是不支持解析csv的。 csv本質上也是文本文件,可以進行差異對比,更利於解決衝突。 本文對解析csv的幾個.net的開源庫進行調研 很小巧簡單的庫:https://github.com/stevehansen/csv/ ...


前言

解析Excel有知名的NPOI庫,(Java語言是POI),但是NPOI是不支持解析csv的。

csv本質上也是文本文件,可以進行差異對比,更利於解決衝突。

本文對解析csv的幾個.net的開源庫進行調研

性能測試

本次性能測試結果來自:.NET Core中的CSV解析庫

當測試100000行數據的時候

當測試1000000行數據的時候

從測試結果上看
Tiny Csv Parser的效率比CSVHelper高很多,記憶體占用也少很多。

最終結論
當不需要支持字元串換行的時候,請使用Tiny Csv Parser
當需要支持字元串換行的時候,請使用CSVHelper

測試csv

第二行中有人為換行符,在Tiny Csv 和 csv中會解析不出來,而CSVHelper則可以

Make Model Comment
內容1 內容2 這是一個換行,
的內容
內容2-1 內容2-1 單行註釋

CSVHelper示例

如果要讀取某行的原始數據,基本內容是在 csvReader.Context 欄位

public static void ParseCsvDemo(string filePath)
{
    CsvReader csvReader = null;
    using (FileStream fileStream = new FileStream(filePath, FileMode.Open, FileAccess.Read))
    {
        using (StreamReader reader = new StreamReader(fileStream, Encoding.GetEncoding("GB2312")))
        {
            csvReader = new CsvReader(reader);
            //設置之後,不讀取第一列,且列數也會減少
//                    csvReader.Configuration.HasHeaderRecord = false;

            int rowCount = 0;
            while (csvReader.Read())
            {
                //列數
                var columnCount = csvReader.Context.Record.Length;
                //每行的原始數據
                var raw = csvReader.Context.RawRecord;
                rowCount = rowCount + 1;
                if (rowCount == 2)
                {
                    var fileName = csvReader.GetField<string>(2);
                    Console.WriteLine("輸出名:{0}", fileName);
                }
                Console.WriteLine("行:{0} ,列:{1},內容:{2}", rowCount, columnCount, raw);
            }
        }
    }
}

註:對於csvhelper提供的映射關係(把表的一行數據結構轉成 class類型),我未使用到,因為我們主要是提取表的數據。

使用情景

使用C#開發的導表工具,可以導出excel和csv,支持把excel數據插入到SQL資料庫,且Excel的格式可以自定義。

這個項目已開源,可參考我之前的文章:

TableML Excel編譯/解析工具

TableML-GUI篇(C# 編譯/解析 Excel/CSV工具)

遇到問題

問題:未能載入文件或程式集,或它的某一個依賴項。找到的程式集清單定義與程式集引用不匹配

解決方案: 使用nuget更新使用到的庫或者檢查庫所依賴的.net framework版本和項目的基於的.net framework版本是否一致。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在面向對象編程實踐中,我們通過眾多的類來組織一個複雜的系統,這些類之間相互關聯、調用使他們的關係形成了一個複雜緊密的網路。當系統啟動時,出於性能、資源利用多方面的考慮,我們不可能要求 JVM 一次性將全部的類都載入完成,而是只載入能夠支持系統順利啟動和運行的類和資源即可。那麼在系統運行過程中如果需要 ...
  • 1.成員 在類中你能寫的所有內容都是類的成員 2.變數 1. 實例變數:昨天寫的就是實力變數,由對象去訪問的變數 2. 類變數: 這個變數屬於類.但是對象也可以訪問 實例變數 class Person: def __init__(self, name, id, gender, birth): sel ...
  • 很多時候寫windows程式都需要結合多線程,在C#中用如下得代碼來創建並啟動一個新的線程。 但是很多時候,在新的線程中,我們需要與UI(Windows窗體設計器用戶界面)進行交互,在C#中不允許直接這樣做。可以參考MSDN中的描述。 “Windows 窗體”使用單線程單元 (STA) 模型,因為“ ...
  • 在您的手機中通知您家中的入侵者,並拍攝他們的照片 介紹 在本文中,我將展示一些DIY東西​​,用於安裝監控系統,檢測家中的入侵者,拍攝照片並通過手機通知您,必要時可以打電話給警察並提供照片以便快速識別劫匪,並提高你恢復所有被盜事物的機會。 當然,除了這個軟體,你必須提供一些硬體,但我已經在我家使用相 ...
  • ADO.NET 巨集觀定義 傳統ADO主要針對緊密連接的客戶端/伺服器端系統,而 ADO.NET考慮到了斷開連接式應用並且引進了 Dateset 它代表任意數量的關聯表,其中每個表都包含了行和列的集合的本地副本。使用Dateset的話.在斷開資料庫連接的情況下調用程式集(如 web 頁面或者桌面可執行 ...
  • 參數含義:ABURL:要下載的AB包地址 go:用於測試,顯示載入貼圖 assetName:要載入的資源名稱 (在調用之前要對參數初始化) ...
  • 技術交流,請加QQ群:538327407 我的各種github 開源項目和代碼:https://github.com/linbin524 背景 筆者 目前架構的IOT 項目是使用abp 框架作為後臺,雖然abp的框架適用於中小型項目框架,但由於架構優美,筆者認為還是可以經過改造,作為大型項目中使用。 ...
  • 目前Web開發,大部分公司都用的是前後端分離模式,即前端專註於前端頁面交互,後端專註於功能實現及提供Web Api介面。 在某次新站點的開發過程中,為了網站的安全性,要求Web站點使用https協議,在部署到QA環境時,發現調用介面報如下的錯: 從提示的內容來看,大致可推斷出是因為站點是https協 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...