Shell筆記:字元串提取

来源:https://www.cnblogs.com/guyuyun/archive/2020/04/20/12735216.html
-Advertisement-
Play Games

本文講的字元串提取指的是從文件或某個輸出中提取符合條件的列的內容,如果某個文件或輸出中它的每一行的信息都是使用特定的分隔符來分割的話,就可以使用字元串的提取功能,本文涉及到的命令包括cut、printf、awk、sed等。 cut命令cut [選項] 文件名:在文件中提取符合條件的列。選項: -f ...


本文講的字元串提取指的是從文件或某個輸出中提取符合條件的列的內容,如果某個文件或輸出中它的每一行的信息都是使用特定的分隔符來分割的話,就可以使用字元串的提取功能,本文涉及到的命令包括cut、printf、awk、sed等。

 

cut命令
cut [選項] 文件名:在文件中提取符合條件的列。
選項:

  • -f 列號:提取第幾列,提取多列只需要將列號用逗號隔開即可。
  • -d 分隔符:按照指定分隔符分割列,如果分割符使用的是製表符tab,則不用特地指定分隔符,且對於cut命令來說,不能使用空格來作為分隔符。

示例:“cut -d ":" -f 1,3 /etc/passwd”表示使用分號作為分隔符分割文檔後提取第一列和第三列的內容。

 

printf格式化輸出
平常使用字元串輸出時使用cat或echo命令即可,printf命令只是在AWK編程中比較常用,在平常的使用中並不常用。AWK編程中,會有print命令和printf命令,但是printf是Linux的標準輸出命令,但是它預設沒有輸出換行符,而print在Linux命令中是沒有的,且預設會自動輸出換行符。
printf "輸出類型和格式" 輸出內容:格式化輸出字元串(使用單引號或者雙引號都行)。
輸出類型:

  • %ns:輸出字元串,n是數字,表示輸出多少個字元。
  • %ni:輸出整數,n是數字,表示輸出多少個數字。
  • %m.nf:輸出浮點數。m和n是數字,表示輸出的整數位數和小數位數。

輸出格式:

  • \a:輸出警告聲音。
  • \b:輸出退格鍵。
  • \f:清除屏幕。
  • \n:換行。
  • \r:回車。
  • \t:水平製表符。
  • \v:垂直製表符。

 

AWK命令
AWK命令因為功能強大且複雜,所以通常也稱為AWK編程,但是它的作用也是用來提取指定的列。
awk命令可以自動識別空格分隔的字元串(即使每列分隔的空格數不同也行),但cut命令就不可以。
awk '條件1{動作1} 條件2{動作2}...' 文件名:提取符合條件的字元串,也可以使用管道符的結果作為文件內容。
常用條件:

  • x>10:判斷x是否大於10。
  • x>=10:大於等於。
  • x<=10:小於等於。
  • BEGIN:在執行文件內容的所有動作之前先執行這個命令。
  • END:在執行完所有動作之後執行這個命令。

常用動作:

  • 格式化輸出。
  • 流程式控制制語句。
  • FS:指定分割符,如BEGIN{FS=":"}以冒號作為分割符,通常會和BEGIN配合使用,不然第一行字元串不會被分割處理。

示例:
awk '{printf $2 "\t" $6 "\n"}' test.txt:輸出文件中所有內容的第2列和第6列,第2列和第6列之間使用製表符分隔,並且第6列之後輸出換行符(這裡的printf如果換為print,就可以不用指定換行符了)。
df -h | grep sda5 | awk '{print $5}':查詢分區信息中包含sda5的行,並輸出這些行的第5列(可以自動以空格作為分隔符。)

 

sed命令
sed其實就是一個輕量級的流編輯器,sed命令主要用來進行數據的選取、替換、刪除、新增。
sed和vim等編輯器的區別在於,vim操作的對象是一個文件,sed操作的對象不僅可以是文件,也可以是其他命令的結果或管道符輸出的結果。
sed [選項] '[動作]' 文件名:處理輸出並輸出到屏幕或文件。
選項:

  • -n:一般sed命令會把所有數據都輸出到屏幕,如果加入此選項,則只會把經過sed命令處理的行輸出到屏幕。
  • -e:允許對輸入數據應用多條sed命令編輯,多個命令之間使用分號隔開。
  • -i:用sed的修改結果直接修改讀取數據的文件,而不是輸出到屏幕(如果是處理文件,還是建議使用vim等編輯器而不是使用-i選項)。

動作:

  • a \:追加,在指定行後追加一行或多行數據,使用\表示達到換行效果(它本身表示數據還未輸出完,換一行繼續輸出),如“sed '2a hello \ welcome' test.txt”表示在這個文件中第2行之後追加兩行數據hello和welcome。
  • c \:行替換,使用指定的字元串替換原來的數據行,想要將指定行替換為多行的數據,同樣使用\即可。
  • i \:插入,在指定行之前插入一行或多行數據。
  • d:刪除指定行。
  • p:列印指定行,如“sed -n '2p'”表示只列印第2行,註意p選項一般和n一起使用,因為不加-n的話預設會先輸出全部數據,然後再額外輸出p選項指定的行,但這樣的效果肯定不會是我們想要的。
  • s:字元串替換,格式為“sed '[n]s/舊字元串/新字元串/g' 文件名”,如果不指定n則表示文件全部內容,如果想要指定多行,則行號之間使用逗號隔開即可,如“sed '3s/99/55/g' test.txt”表示將文件中第3行中的99替換為55。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • MiniProfiler是一個簡單且高效的小型分析器,可用於.NET,Ruby,Go和Node.js.MiniProfiler不是將自己附加到每一個方法上,因為這樣會有強侵入性而且也不是專註於分析性能問題。 它是一個ADO.NET的分析器,可以分析對於ADO.NET(SQL Server、Oracl ...
  • INotifyPropertyChanged:如果是類實例里的屬性更改需要觸發XAML改變,則該類需實現INotifyPropertyChanged介面。 https://www.cnblogs.com/jax/archive/2009/10/13/1582128.html 第一節。 Observa ...
  • dotnet core version: 3.1 輸入 會出現下圖錯誤 從 3.0 起,EF Core 命令列工具 (dotnet ef) 不在 .NET Core SDK 裡面,需另裝。命令如下: ...
  • 在 VisualStudio 的團隊管理功能,提供了方便的添加 Tag 的方法,可以新建一個 Tag 添加 Tag 信息,同時推送某個特定的 Tag 到伺服器。配合推 Tag 打包 NuGet 的方法,將可以讓整套工具用起來特別爽,完全本地化打 Tag 推送就完成了 NuGet 伺服器打包推送 ...
  • 簡單介紹了磁碟類型,MBR分區、gpt分區、創建文件系統、掛載、RAID、LVM一些相關的命令。本文只是筆記,沒有教學,還是怕誤人子弟,見諒。 ...
  • 一、for迴圈 語法一 for 變數 in 值1 值2 值3... do 程式 done 註:多個值之間只要“有空”,不只是空格,換行符、製表符等都行,比如讀取文件時,可以自動遍歷每一行。 示例1:遍歷固定的某些項 #!/bin/bash for time in morning noon after ...
  • 一、if語句 單分支if語句 語法(中括弧首尾的空格不能省略): if [ 條件判斷式 ];then 程式 fi #或者 if [ 條件判斷式 ] then 程式 fi 示例: #!/bin/bash #根分區的使用率如果達到80則發出警告,向屏幕輸出一條提示信息。 rate=$(df -h | g ...
  • Shell中if等語句的條件判斷通常就是判斷一些測試選項的結果是否為真。 常用的文件類型測試選項(Linux中目錄、設備等都是用文件進行表示) -d 文件:判斷該文件是否存在,並且是否為目錄文件。 -e 文件:判斷該文件是否存在。 -f 文件:判斷該文件是否存在,並且是否為普通文件。 -L 文件:判 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...