Perl一行式:選擇行輸出、刪除、追加、插入

来源:https://www.cnblogs.com/f-ck-need-u/archive/2019/01/09/10247059.html
-Advertisement-
Play Games

perl一行式程式系列文章 : "Perl一行式" 對於Perl的一行式perl程式來說,選擇要輸出的、要刪除的、要插入/追加的行是非常容易的事情,因為print/say決定行是否輸出/插入/追加/刪除。雖然簡單,但對於廣泛應用在sed的示例還是可以拿到這裡來討論一番。 因為輸出/刪除/插入/追加行 ...


perl一行式程式系列文章Perl一行式


對於Perl的一行式perl程式來說,選擇要輸出的、要刪除的、要插入/追加的行是非常容易的事情,因為print/say決定行是否輸出/插入/追加/刪除。雖然簡單,但對於廣泛應用在sed的示例還是可以拿到這裡來討論一番。

因為輸出/刪除/插入/追加行都是通過print/say在不同條件下的操作,所以本文只會介紹輸出操作,刪除/插入/追加其實都是同樣的原理。

輸出第一行

$ perl -lne 'print;exit' file.log

輸出第13行

$ perl -ne 'print if $. == 13' file.log

輸出前10行

$ perl -ne 'print if $.<=10' file.log
$ perl -ne 'print if 1..10' file.log
$ perl -ne '$. <= 10 && print' file.log
$ perl -ne 'print; exit if $. == 10' file.log

輸出最後一行

$ perl -ne '$last=$_;END{print $last}' file.log

或者通過文件結尾eof來判斷:

$ perl -ne 'print if eof' file.log

這裡的eof函數的作用是:如果下一行讀取到了文件尾部eof,就返回1。否則

輸出倒數10行

這個實現起來可能稍顯複雜,但邏輯很簡單:向一個數組中添加10行元素,如果數組元素個數超過了10,則剔除數組的第一個元素。

$ perl -ne '
    push @lines,$_;
    if(@lines>10){
        shift @lines;
    }
    END{
        print @lines
    }
    ' /etc/passwd

這裡是shift一個元素來保證"視窗"的穩定性:最多只有10個元素。另一種穩妥的方式是直接切片,從數組中取最後10個元素:

$ perl -ne '
    push @lines,$_;
    @lines = @lines[@lines-10..$#lines] if @lines>10;
    END{print @lines}
    ' /etc/passwd

輸出倒數第11行到倒數第2行

有了前一個示例作為基礎,這個需求很容易實現。

保留一個11行元素的數組,最後輸出前10個元素即可。

$ perl -ne '
    push @a,$_;
    shift @a if @a>11;
    END{print @a[0..$#a-1]}
    ' /etc/passwd

輸出文件的第偶數行

這個很簡單,只需判斷行號的奇偶性即可。

$ perl -ne 'print if $. % 2 == 0' file.log
$ perl -ne 'print unless $. % 2' file.log

輸出能匹配的行

$ perl -ne 'print if /regexp/' file.log

輸出兩個匹配之間的行

$ perl -ne 'print if /regexp1/../regexp2/' file.log

輸出匹配行的前一行

只需將每行保留到變數中,如果當前行匹配了,則輸出上一行保存的值。

$ perl -ne '/regexp/ && $last && print $last;$last = $_' file.log

如果想要輸出匹配的前M行,只需把這些數量的行保存到數組中,並不斷地shift剔除就可以。

輸出匹配行的後一行

$ perl -ne '$p && print; $p = /regexp/' file.log

Perl中正則表達式的匹配操作返回的是成功與否的布爾真假,所以$p = /regexp/表示如果匹配了,則$p的值為真,否則為假。

如果$p為真,則下一行將被輸出,且繼續對輸出行進行匹配,如果輸出行仍然能匹配,則繼續輸出下一行。

上面的過程可以改寫成邏輯更為清晰的一行式:

$ perl -ne 'if($p){print;$p=0}++$p if /regexp/' file.log

上面的$p是一個狀態標記變數,如果匹配成功,就標記為真值,併在輸出的時候重置狀態變數。

還可以採用另一種處理邏輯:自己編寫從<>讀取行的while迴圈,如果匹配了就繼續讀入下一行。因為讀入的下一行可能繼續匹配,所以在while迴圈中使用redo邏輯回到while迴圈的開頭。

$ perl -se '
    while(<>){
        if(/$reg/){
            if(eof){ exit; }
            print $_ = <>;
        }
        redo if /$reg/;
    }
    ' -- -reg="REGEXP" file.log

輸出匹配行及其後5行

上面採用狀態標記變數$p,這個狀態標記變數可以更深入地使用。

如果匹配了,則$p設置為5,然後輸出後面的行時對$p自減。

$ perl -ne '
    if($p){print;$p--}
    if(/regexp/){$p = 5;print};
    ' file.log

連續行去重

$ perl -ne '
    next if "$line" eq "$_";
    print $line = $_;
    ' file.log

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1. CSDN學院課程數據 寫在前面 今天又要抓取一個網站了,選擇恐懼症使得我不知道該拿誰下手,找來找去,算了,還是抓取CSDN學院吧,CSDN學院的網站為 "https://edu.csdn.net/courses" 我看了一下這個網址,課程數量也不是很多,大概有 門課程,數據量不大,用單線程其實 ...
  • 1.生成9位字母的密碼 使用random.choice函數,此函數需要一個序列,因此給定一個序列包含a-z,A-Z 2:生成9位數字和字母的密碼,密碼可能隨機出現數字和字母此題在上一題的基礎上先生成一個序列包含所有字母和數字,然後使用random.choice()函數 3.檢測密碼強度 c1 : 長 ...
  • Django 系列博客(七) 前言 本篇博客介紹 Django 中的視圖層中的相關參數,HttpRequest 對象、HttpResponse 對象、JsonResponse,以及視圖層的兩種響應方式 CBV 和 FBV,還有簡單的文件上傳。 視圖函數 一個視圖函數,簡稱視圖,是一個簡單的Pytho ...
  • 1.首先是工具的準備。 2.工具環境的搭建 首先,new建立選擇maven project工程,勾選simple project,next後如下圖所示,goup id起名為com.blog,artifact id為ssm-build,packing為war。 點擊finish後完成maven工程的創 ...
  • 題目內容 題目內容很簡單,就是創建 ArrayList 和 Vector 集合,向兩者添加相同內容的字元串,最後用 equals() 方法比較是否相等。 這裡就考察了 "==" 和 equals() 方法的知識點。 這裡我最開始以為輸出為 false,但實驗了一下,結果為 true! 為什麼呢?因為 ...
  • Java提供了 java.lang.ref包,該包下的類均與垃圾回收機制相關 先介紹Java對象的集中引用類型 1.強引用 強引用是最常見的,創建對象就是強引用,如 String a = new String("1"); 無論系統記憶體是否緊張,只要該對象還存在強引用就不會被垃圾回收機制回收 2.軟引 ...
  • 序言:提到線程安全,可能大家首先想到的是確保介面對共用變數的操作要具備 原子性。實際上,在多線程編程中我們需要同時關註可見性,順序性和原子性。本篇文章將從這三個問題出發,結合實例詳解volatile如何保u證可見性及一定程式上保證順序性,同時例講synchronized如何同時保證可見性和原子性,最 ...
  • 以下書籍都是本人看過的書籍,僅做參考。 個人推薦一本一本看,不要跨級,步子大了容易扯著dan。 《電腦科學導論》 本人靠這本書入門電腦,也許談不上入門 《網路是怎樣連接的》《電腦組成原理》《電腦操作系統》 這四本不用多說,電腦基礎中的基礎,不說要全部記住,至少要一目十行看完這三大本,對計算 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...