Linux split拆分文件

来源:http://www.cnblogs.com/chenmh/archive/2016/10/09/5872523.html
-Advertisement-
Play Games

介紹 split可以將一個大文件拆分成指定大小的多個文件,並且拆分速度非常的快,拆分一個1G大小的文件花費不到1S的時間,如果手工在windows上面進行操作估計得卡死。 選項 Usage: split [OPTION]... [INPUT [PREFIX]] Output fixed-size p ...


介紹

split可以將一個大文件拆分成指定大小的多個文件,並且拆分速度非常的快,拆分一個1G大小的文件花費不到1S的時間,如果手工在windows上面進行操作估計得卡死。

 

 

選項

Usage: split [OPTION]... [INPUT [PREFIX]]
Output fixed-size pieces of INPUT to PREFIXaa, PREFIXab, ...; default
size is 1000 lines, and default PREFIX is `x'.  With no INPUT, or when INPUT
is -, read standard input.

Mandatory arguments to long options are mandatory for short options too.
  -a, --suffix-length=N   use suffixes of length N (default 2) 指定拆分文件的尾碼長度
  -b, --bytes=SIZE        put SIZE bytes per output file 按位元組拆分,預設單位位元組
  -C, --line-bytes=SIZE   put at most SIZE bytes of lines per output file  指定單行的最大大小,預設單位位元組
  -d, --numeric-suffixes  use numeric suffixes instead of alphabetic 用數字作為拆分文件的尾碼
  -l, --lines=NUMBER      put NUMBER lines per output file  按行數進行拆分
      --verbose           print a diagnostic just before each
                            output file is opened
      --help     display this help and exit
      --version  output version information and exit

SIZE may be (or may be an integer optionally followed by) one of following:
KB 1000, K 1024, MB 1000*1000, M 1024*1024, and so on for G, T, P, E, Z, Y. 可以用尾碼指定其它的單位

Report split bugs to bug-[email protected]
GNU coreutils home page: <http://www.gnu.org/software/coreutils/>
General help using GNU software: <http://www.gnu.org/gethelp/>
For complete documentation, run: info coreutils 'split invocation'

 

實例

[root@localhost test]# more test
a
b
c
d
e
f
g

1.根據行拆分

每3行拆分成一個文件,拆分後的文件名以name開頭,以數字作為尾碼尾碼長度為1

split -l 3 test -d -a 1 name
[root@localhost test]# ll
total 16
-rw-r--r--. 1 root root  6 Oct  9 19:12 name0
-rw-r--r--. 1 root root  6 Oct  9 19:12 name1
-rw-r--r--. 1 root root  2 Oct  9 19:12 name2
-rw-r--r--. 1 root root 14 Oct  9 19:07 test

2.按位元組進行拆分

每三個位元組拆分成一個文件,預設不加單位就是位元組,也可以帶單位比如KB,MB等

split -b 3 test -d -a 1 new
[root@localhost test]# ls -l new*
-rw-r--r--. 1 root root 3 Oct  9 19:13 new0
-rw-r--r--. 1 root root 3 Oct  9 19:13 new1
-rw-r--r--. 1 root root 3 Oct  9 19:13 new2
-rw-r--r--. 1 root root 3 Oct  9 19:13 new3
-rw-r--r--. 1 root root 2 Oct  9 19:13 new4

 

總結

 spit命令很實用,比如導入數據時將文件進行拆分併發導入會快很多。

 

 

 

 

備註:

    作者:pursuer.chen

    博客:http://www.cnblogs.com/chenmh

本站點所有隨筆都是原創,歡迎大家轉載;但轉載時必須註明文章來源,且在文章開頭明顯處給明鏈接。

《歡迎交流討論》


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 【原文地址】https://docs.mongodb.com/manual/ 引言 MongoDB是一種開源文檔型資料庫,它具有高性能,高可用性,自動擴展性 1.文檔資料庫 MongoDB用一個文檔來表示一條記錄,文檔的數據結構由鍵值對組成。MongoDB文檔類似於JSON對象,欄位值可能是文檔,數 ...
  • 資料庫運維中盛傳一個小段子,我誤刪除了資料庫,改怎麼辦?有備份還原備份,沒有備份就準備簡歷!聽起來有趣但發生在誰身上,誰都笑不起來。接觸了很多的客戶發現90%客戶的運維策略都不是很完善。本篇就分享一些常規的運維腳本,本篇沒有涉及到的或不足的也請大家留言無私貢獻深藏多年的腳本,謝謝! 郵件 郵件主要用 ...
  • 1.是用軟體提供的字體 如果只想簡單的設置,可進行如下設置Tools->IDE Options->Editor->Colors and Fonts->Editor Font->Font但是這裡邊似乎也沒有什麼舒服的字體,在網上找了找,還真找到了一個比較不錯的字體,現呈現給大家 2.使用系統提供的字體 ...
  • 1、名詞解析 主機名: 無論是在區域網還是在INTERNET上,每台主機都有一個IP地址,用來區分當前是那一臺機器(其實底層是使用機器的物理地址),也就是說IP地址就是一個主機的門牌號,唯一的標示這一臺機子。 公網: IP地址不方便記憶,所以又有了功能變數名稱。功能變數名稱只是在公網(INTERNET)中存在,每個 ...
  • 1.SDRAM單管存儲單元 C記憶單元 T控制門管 Z字線 W位線 註:圖示為N溝道耗盡型MOS管 寫入:Z加高電平,MOS導通,W狀態決定了電容C的狀態 讀出:Z加高電平,MOS導通,可以從W狀態得知C的狀態 保持:Z加低電平,MOS關閉,電容保持原狀態 註意:單管讀出是破壞性讀出,因為讀出時電容 ...
  • ARM簡述 ARM公司既不生產晶元也不銷售晶元,它只出售晶元技術授權。ARM技術具有很高的性能和功效,因而容易被廠商接受。同時,合作伙伴的增多,可獲得更多的第三方工具、製造和軟體支持,這又會使整個系統成本降低,讓產品進入市場的時間加快,從而具有更大的競爭優勢。 一、ARM技術的應用領域及其特點 採用 ...
  • 教大家一個簡單方法讓ubuntu發散wifi熱點給手機或者其他設備使用。 ...
  • 先按win+R 輸入cmd netsh wlan set host mode=allow ssid=nothing key=323435435 (ssid後面的可以任意,key後面最少8個字元) 我的電腦,右鍵選中屬性,選中控制面板 選中網路和internet 選中網路和共用中心 選中更改適配器設置 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...