Atitit.複合文檔的格式 標準化格式 1. Docfile1 2. Iso Cdf cd file1 3. Zip1 4. Ooxml1 5. Odf :OpenDocument Format2 5.1.1. 本質2 6. 參考3 paip.docfile二進位複合文檔 前言Docfile Do
Atitit.複合文檔的格式 標準化格式
1. Docfile
paip.docfile二進位複合文檔
前言Docfile
Docfile是二進位複合文檔,打開文件可看到文件頭簽名..類似於文件夾存儲的方式來存儲文檔…如以前的DOC文件夾,OLE文檔等..
2. Iso Cdf cd file
3. Zip
作者:: 綽號:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿爾 拉帕努伊 ) 漢字名:艾龍, EMAIL:[email protected]
轉載請註明來源: http://www.cnblogs.com/attilax/
4. Ooxml
OOXML是由微軟公司為Office 2007產品開發的技術規範,現已成為國際文檔格式標準,相容前國際標準開放文檔格式和中國文檔標準“標文通”(外語簡稱:UOF)。於2006年12月成為ECMA標準。
·
互操作性。Office Open XML格式是以工業標準的XML為核心的,Microsoft Office應用程式與企業業務系統之間的數據交換得到了簡化。無需訪問Office應用程式,解決方案就可以更改Office文檔當中的信息,或者使用標準的處理XML的工具和技術來創建文檔。新的格式允許您構建文檔的存檔,而無需使用Office的代碼。
·
·
健壯性。Office Open XML格式被設計為比二進位格式更加健壯,而且因此可以幫助降低由於文件損壞所帶來的信息丟失的風險。即使在Office外面對於文檔的修改和創建也不會對文檔造成過多的損壞,因此使用新的文件格式,Office應用程式被設計為使用增強的可靠性來恢覆文檔。隨著越來越多的文檔穿梭與電子郵件的附加或可移動的存儲設備之間,網路或存儲設備的損壞增加了文檔損壞的可能性。
·
新的文件格式通過將文檔在文件包中進行分段單獨的存儲,增強了數據恢復的能力。這將大大的節省企業用於恢複數據丟失所花費的大量資金和時間。當一個文件組件損壞時,文件中的剩餘部分還可以在應用程式中打開。例如,如果一幅圖表被損壞了,這也並不能阻止客戶打開文檔中的其它部分,當然不包括圖表。另外,Office應用程式可以檢測這些問題,並且在打開文檔的時候嘗試修複它,恢覆文檔正確的數據結構。
·
高效性。Office Open XML格式使用ZIP和壓縮技術來存儲文檔。這種新格式的一個巨大的優勢就在於它的文件大小非常小 - 最大的壓縮比可以達到原來二進位文件的百分之75。這是使用XML和ZIP技術結合進行文件存儲的一大優勢。因為XML是一個基於文本的格式,所以壓縮的比率非常的好,而且ZIP容器支持內容的壓縮,所以用戶可以大大的減小文件的尺寸。文件壓縮的類型提供了潛在的成本節約,因為它減少了存儲文件所需的磁碟容量,並且減少了通過電子郵件、網路和Web進行文件傳輸所需的帶寬。
·
5. Odf :OpenDocument Format
開放文檔格式(外文名:OpenDocument Format,外語簡稱:ODF)是一種規範,基於XML(標準通用標記語言的子集)的文件格式,因應試算表、圖表、演示稿和文字處理文件等電子文件而設置。它的規格原本由太陽微系統開發,標準則由結構化信息標準促進組織OASIS所開發。存在一個自由兼開放的OASIS標準,以ISO/IEC國際標準發佈──ISO/IEC 26300:2006 Open Document Format for Office Applications(OpenDocument)v1.0。
開放文檔格式提供一個取代私有專利文件格式的一個方案,使得組織或個人不會因為文件格式而被廠商套牢(外文名:Vendor lock-in)。
5.1.1. 本質
odf文檔是基於xml語言的純文本文檔。odf格式的文本文檔的擴展名常見為*.odt。一個odt文檔實質上是一個打包的文件,並且通常都經過了zip格式的壓縮。我們完全可以用現有的任意一款壓縮軟體將odt文件解壓,查看其裡面的內容就會發現其本質。一個odt文件解壓後會得到一個與原文件名相同的文件夾,該文件夾裡面一般會含有以下子文件夾與文件:
6. 參考
atitit.壓縮演算法 ZLib ,gzip ,zip 最佳實踐 java .net php - attilax的專欄 - 博客頻道 - CSDN.NET.htm
Atitit. 解壓縮zip文件 的實現最佳實踐 java c# .net php - attilax的專欄 - 博客頻道 - CSDN.NET.htm
ooxml_百度百科.htm