CSV文件的規範

来源:http://www.cnblogs.com/wangjiping/archive/2016/01/28/CSV_File_Spec_for_Data_Exchange.html
-Advertisement-
Play Games

本文講解一種常見的CSV文件標準,設定文件中的行分隔符,列分隔符,如何處理值中的單引號,雙引號,逗號,換行符等。


CSV文件,全程Comma-separated values,就是逗號分隔的數據文件。常用於數據集成的數據交換部分標準部分。

最近看到一個項目組在討論介面文件CSV的規範,真是替他們著急。討論點:

  1. 文件是否有標題行(header row),一方堅持要有,介面另一方堅持不能有。
  2. 行分割符,一方堅持使用Unix style的0x0A字元,另一方堅持使用Windows/Dos風格的0x0D0x0A(或者說\r\n),回車換行兩個字元。
  3. 列分隔符,一方堅持使用一個不可見字元0x05,說防止和內容字元串衝突,另一方堅持使用0x1B(ESC鍵)。
  4. 字元串中如果有換行怎麼處理,也沒有統一的意見。

不會Google真可怕,這個東西很簡單,先看是否有標準,如果有嚴格按照標準走。如果沒有標準,看是否有常見做法(或者叫事實標準)。Google一下關鍵字“CSV”,第一條就是維基百科(wikipedia)的解釋。

An official standard for the CSV file format does not exist, but RFC 4180 provides a de facto standard for many aspects of it.
Jiger: CSV沒有正式標準,但是國際互聯網工程任務組(IETF)給推薦標準RFC 4180描述了CSV文件的結構。

下麵一種常見配置:

  • MS-DOS-style lines that end with (CR/LF) characters (optional for the last line)
    Jiger: {使用回車換行(兩個字元)作為行分隔符,最後一行數據可以沒有這兩個字元。}
  • An optional header record (there is no sure way to detect whether it is present, so care is required when importing).
    Jiger:{標題行是否需要,要雙方顯示約定}.
  • Each record "should" contain the same number of comma-separated fields.
    Jiger:{每行記錄的欄位數要相同,使用逗號分隔。} 逗號是預設使用的值,雙方可以約定別的。
  • Any field may be quoted (with double quotes).
    Jiger:{任何欄位的值都可以使用雙引號括起來}. 為簡單期間,可以要求都使用雙引號。
  • Fields containing a line-break, double-quote, and/or commas should be quoted. (If they are not, the file will likely be impossible to process correctly).
    Jiger:{欄位值中如果有換行符,雙引號,逗號的,必須要使用雙引號括起來。這是必須的。}
  • A (double) quote character in a field must be represented by two (double) quote characters.
    Jiger:{如果值中有雙引號,使用一對雙引號來表示原來的一個雙引號}

如果使用了以上推薦標準,可以減少很多時間來討論方案。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1, Swift 修改導航欄顏色 self.navigationController?.navigationBar.barTintColor 2, Swift button 屬性設置時直接進行初始化 var leftButton : UIButton = UIButton(type: UIButto
  • 1、建立DLL動態庫 動態鏈接庫(DLL)是從C語言函數庫和Pascal庫單元的概念發展而來的。所有的C語言標準庫函數都存放在某一函數庫中。在鏈接應用程式的過程中,鏈接器從庫文件中拷貝程式調用的函數代碼,並把這些函數代碼添加到可執行文件中。這種方法同只把函數儲存在已編譯的OBJ文件中相比更有利於代碼
  • 註意:本章代碼將會建立在上一章的代碼基礎上,上一章鏈接《第八章 企業項目開發--分散式緩存memcached》 1、為什麼用Redis 1.1、為什麼用分散式緩存(或者說本地緩存存在的問題)? 見《第八章 企業項目開發--分散式緩存memcached》 1.2、有了memcached,為什麼還要用r
  • 在我的設計模式分類當中,我選擇單例模式作為我第一個要寫的設計模式,其一,單例模式簡單、容易理解讓人接受,其二,單例模式很常用,在實際的Winform窗體應用開發中能夠帶來更好的客戶體驗。 單例模式的核心是在應用程式的生命周期中只實例化一次當前類,讓整個應用整個應用程式中只擁有一個當前類實例化的對象,
  • 一、什麼是生成器模式 對複雜對象的創建過程進行抽象,相同的創建步驟,不一樣的創建過程實現,生成不同表示的對象; 例如創建一臺電腦,對其應用生成器模式進行創建: 創建過程是指創建cpu、創建記憶體、創建顯示器三個步驟,所有品牌電腦的創建過程都是一樣的,可以對其抽象出一個抽象建造者角色Builder; 不
  • 這裡說的緩存只是為了提供一些動態的界面沒辦法作靜態化的界面來減少資料庫的訪問壓力,如果能夠做靜態化的話的還是採用nginx來做界面的靜態化,這樣可以承受高併發的訪問能力。 好了,廢話少說直接看實現代碼吧下載地址, 實現機制主要是通過過濾器攔截方案,有兩個地方要註意的 1,Servlet過慮器中使用S
  • RFC一致性 Methods GET: 獲取某個資源,冪等且無副作用。 POST: 創建一個新的資源。 PUT: 替換某個已有的資源。冪等有副作用。 PATCH: 修改某個已有的資源。 DELETE:刪除某個資源。冪等有副作用。 Headers Accept:伺服器需要返回什麼樣的content。
  • 我在監理別的項目時,經常提出這樣的要求,所有的列表都要有排序機制。最近又看到一個數據倉庫項目中所有的維度表都沒有排序欄位。結果報表上所有維度都是按Caption屬性的字母排序。很多維度在用戶那裡都是有業務排序需求的,然而我提出這個問題後,設計者居然說這個不重要,不說了(他們就這水平了)和我沒有關係的
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...