文件大小的友好輸出及其 Python 實現

-Advertisement-

在資料庫中存儲時，使用 Bytes 更精確，可擴展性和靈活性都很高。輸出時，需要做一些適配。1. 註意事項與測試代碼需要考慮sizeInBytes為 None 的場景。除以 1024.0 而非 1024，避免丟失精度。實現的函數為getSizeInMb(sizeInBytes)，通用的測試代碼為de...

在資料庫中存儲時，使用 Bytes 更精確，可擴展性和靈活性都很高。

輸出時，需要做一些適配。

1. 註意事項與測試代碼

需要考慮 sizeInBytes 為 None 的場景。
除以 1024.0 而非 1024，避免丟失精度。

實現的函數為 getSizeInMb(sizeInBytes)，通用的測試代碼為

def getSizeInMb(sizeInBytes):
    return 0

def test(sizeInBytes):
    print '%s -> %s' % (sizeInBytes, getSizeInMb(sizeInBytes))

test(None)
test(0)
test(10240000)
test(1024*1024*10)

2. 以 MB 為單位輸出 -- 返回 float

通常，電子書的大小在 1 - 50MB 之間，輸出時統一轉為 MB 是不錯的選擇。

弊端：

輸出精度過高，比如 10240000 Bytes 計算結果為 10240000 -> 9.765625
文件大小有限制，小於 1 MB 或 G 級數據不適合該方式展示

優勢：

適合於用返回值參與計算

def getSizeInMb(sizeInBytes):
    return (sizeInBytes or 0) / (1024.0*1024.0)

3. 以 MB 為單位保留 1 位小數 -- 返回 str

處於精度問題考慮，可以選擇保留 1 位小數。

def getSizeInMb(sizeInBytes):
    return '%.1f' % ((sizeInBytes or 0) / (1024.0*1024.0), )  # use 1-dimension tuple is suggested

返回值建議寫成 '%.1f' % (number,) 而非 '%.1f' % (number)

二者均能正確執行，但後者容易被誤判為執行只有一個參數 number 的函數，導致難以判斷的錯誤。

3. 以 MB 為單位保留至多 1 位小數 -- 返回 str

大多數操作系統一般展示至多 1 位小數

def getSizeInMb(sizeInBytes):
    sizeInMb = '%.1f' % ((sizeInBytes or 0) / (1024.0*1024.0), )  # use 1-dimension tuple is suggested
    return sizeInMb[:-2] if sizeInMb.endswith('.0') else sizeInMb  # python2.5+ required

4. 自動選擇最佳單位

def getSizeInNiceString(sizeInBytes):
    """
    Convert the given byteCount into a string like: 9.9bytes/KB/MB/GB
    """
    for (cutoff, label) in [(1024*1024*1024, "GB"),
                            (1024*1024, "MB"),
                            (1024, "KB"),
                            ]:
        if sizeInBytes >= cutoff:
            return "%.1f %s" % (sizeInBytes * 1.0 / cutoff, label)

    if sizeInBytes == 1:
        return "1 byte"
    else:
        bytes = "%.1f" % (sizeInBytes or 0,)
        return (bytes[:-2] if bytes.endswith('.0') else bytes) + ' bytes'

演算法說明：

1. 從英語語法角度，只有 1 使用單數形式。其他 0/小數均使用複數形式。涉及 bytes 級別

2. 精度方面，KB 及以上級別，保留 1 位小數。bytes 保留至多 1 位小數。

這種處理規則，不適合於小數十分位為 0 的情況，比如 10.0 bytes，10.01 bytes。輸入結果均為 10 bytes。

其他情況下，精度均不存在問題。

測試數據與結果如下圖

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

JavaScript 實現列印,列印預覽,列印設置

WebBrowser是IE內置的瀏覽器控制項，無需用戶下載.一、WebBrowser控制項二、WebBrowder控制項的方法 //列印WebBrowser1.ExecWB(6,1);//列印設置WebBrowser1.ExecWB(8,1);//列印預覽WebBrowser1.ExecWB(7,1.....
最常用的CSS技巧收集筆記

1.重置瀏覽器的字體大小重置瀏覽器的預設值，然後重設瀏覽器的字體大小你可以使用雅虎的用戶界面重置的CSS方案，如果你不想下載9MB的文件，代碼如下：body,div,dl,dt,dd,ul,ol,li,h1,h2,h3,h4,h5,h6,pre,form,fieldset,input,texta...
移動端富文本編輯器artEditor

摘要：由於手機上打字比較慢，並不適合長篇大論的文章，所以移動端的富文本編輯器很少。artEditor是一款基於jQuery的移動端富文本編輯器，支持插入圖片，後續完善其他功能。插件地址：https://github.com/baixuexiyang/artEditor 歡迎star或fork。.....
AngularJs 動態載入模塊和依賴註入

最近項目比較忙額，白天要上班，晚上回來還需要做Angular知識點的ppt給同事，畢竟年底要辭職了，項目的後續開發還是需要有人接手的，所以就占用了晚上學習的時間。本來一直不打算寫這些第三方的學習筆記，不過覺得按需載入模塊並且成功使用這個確實是個好處，還是記錄下來吧。基於本獸沒怎麼深入的使用requi...
Node.js靜態文件伺服器

首先還是先感謝github，感謝github上提供此段源碼的作者。跟昨晚看的靜態文件伺服器來比今天的靜態文件伺服器稍微複雜些，可以學到很多新的東西。仔細會發現這次的代碼多了一個fs.stat函數和ReadStream對象的pipe函數，stat這個函數是用來獲取文件信息。第一個參數是傳入文件路徑，第...
使用.NET進行高效率互聯網敏捷開發的思考和探索【一、概述】

.NET進入了生態化的新紀元，開發思路和開發理念都需要革新，是選擇也是機遇，.NET程式員的好日子終於要來啦！
基於MVC設計模式的兩種軟體架構簡介

根據學習和工作中的理解，採用MVC設計模式，設計了兩種模式。第一種採用了抽象工廠、命令模式、組合模式等，面向介面編程，支持單一和組合操作，具有撤銷（Undo）和重做（Redo）功能。第二種模式對第一種做了簡化，主要針對資料庫操作，支持共用資料庫連接和靈活的搜索條件。
OSGI入門筆記

OSGI框架為Java定義了一個動態模塊化系統，它使你可以更好地控制代碼結構，動態管理代碼的生命周期，並且提供了代碼寫作的松耦合方式；更值得稱道的是，它的規範文檔描述詳盡。--《OSGI實戰》OSGI分層架構服務層關註於模塊，特別是模塊內的組件間的交互和通信。生命周期層關註於提供執行時模塊管理和對底...