awk之NR==FNR，如何理解整理_ZenDei技術網路在線

awk之NR==FNR，如何理解整理

-Advertisement-

轉載：https://www.cnblogs.com/irockcode/p/7044722.html NR,表示awk開始執行程式後所讀取的數據行數. FNR,與NR功用類似,不同的是awk每打開一個新文件,FNR便從0重新累計. 下麵看兩個例子: 1,對於單個文件NR 和FNR 的輸出結果一樣 ...

轉載：https://www.cnblogs.com/irockcode/p/7044722.html

NR,表示awk開始執行程式後所讀取的數據行數.

FNR,與NR功用類似,不同的是awk每打開一個新文件,FNR便從0重新累計.

下麵看兩個例子:

1,對於單個文件NR 和FNR 的輸出結果一樣的：

1 2 3 4 5 6 7 8 9 # awk '{print NR,$0}' file1 1 a b c d 2 a b d c 3 a c b d #awk '{print FNR,$0}' file1 1 a b c d 2 a b d c 3 a c b d

2,但是對於多個文件：

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 # awk '{print NR,$0}' file1 file2 1 a b c d 2 a b d c 3 a c b d 4 aa bb cc dd 5 aa bb dd cc 6 aa cc bb dd # awk '{print FNR,$0}' file1 file2 1 a b c d 2 a b d c 3 a c b d 1 aa bb cc dd 2 aa bb dd cc 3 aa cc bb dd

在看一個例子關於NR和FNR的典型應用:

現在有兩個文件格式如下：

1 2 3 4 5 6 7 8 #cat a 張三|000001 李四|000002 #cat b 000001|10 000001|20 000002|30 000002|15

想要得到的結果是將用戶名，帳號和金額在同一行列印出來,如下:

張三|000001|10
張三|000001|20
李四|000002|30
李四|000002|15

執行如下代碼

1	`#awk -F \\| 'NR==FNR{a[$2]=$0;next}{print a[$1]"\|"$2}' a b`

註釋:

由NR=FNR為真時,判斷當前讀入的是第一個文件a,然後使用{a[$2]=$0;next}
迴圈將a文件的每行記錄都存入數組a,並使用$2第2個欄位作為下標引用.

由NR=FNR為假時,判斷當前讀入了第二個文件b,然後跳過{a[$2]=$0;next},
對第二個文件cdr的每一行都無條件執行{print a[$1]"|"$2},
此時變數$1為第二個文件的第一個欄位,與讀入第一個文件時,採用第一個文件第二個欄位$2為數組下標相同.
因此可以在此使用a[$1]引用數組。

=========================================================================

下麵是CU大神jason680的詳細過程分析

awk -F'|' 'NR==FNR{a[$2]=$0;next}{print a[$1] FS $2}' a b

There is no BEGIN block, and FS="|" by -F'|' argument
沒有開始模塊，直接識別-F選項，加參數

start to first file 'a'
從a文件的第一行開始
1. read file a line 1 and get data 張三|000001
讀取文件a的第一行，得到數據
A: $0=張三|000001
B: $1=張三
C: $2=000001

NR and FNR are the same equal to 1, and run NR=FNR block
此時，NR與FNR的值相等都為1，執行NR=FNR模塊
NR==FNR{a[$2]=$0;next}
A: a[$2]=$0
a[000001]=張三|000001
B: next
next cycle and get next line data

2. read file a line 2 and get data 李四|000002
讀取文件a的第二行，得到數據

A: $0=李四|000002
B: $1=李四
C: $2=000002

NR and FNR are the same equal to 2, and run NR=FNR block
此時，NR與FNR的值相等都為2，執行NR=FNR模塊
NR==FNR{a[$2]=$0;next}
A: a[$2]=$0
a[000002]=李四|000002
B: next
next cycle and get next line data

end of the file a, and get next file b data
讀完文件a，然後讀取下一個文件b的數據

3. read file b line 1, and get data 000001|10
讀取文件b的第一行，然後得到數據
A: $0=000001|10
B: $1=000001
C: $2=10

now, NR is 3 and FNR is 1, they are not eqaul
此時，NR與FNR的值不同，不執行NF=FNR模塊，執行下一個模塊{print a[$1] FS $2}
and didn't run NR=FNR block,
and run next block {print a[$1] FS $2}
a[$1] => a[000001] => 張三|000001
FS => |
$2 => 10
you will see the output
張三|000001|10

4. read file b line 2, and get data 000001|20
A: $0=000001|20
B: $1=000001
C: $2=20

NR is 4 and FNR is 2, they are not eqaul
and didn't run NR=FNR block,
and run next block {print a[$1] FS $2}
a[$1] => a[000001] => 張三|000001
FS => |
$2 => 20
you will see the output
張三|000001|20

cycle to read the file b
5. read file b line 3, and get data 000002|30
...
output==> 李四|000002|30

6. read file b line 4, and get data 000002|15
...
output==> 李四|000002|15

補充：

找出兩個文件之間的不同部分

awk 'NR==FNR{a[$0]++} NR>FNR&&!a[$0]' 1.txt 2.txt

awk 'NR==FNR{a[$0]}NR>FNR{ if(!($1 in a)) print $0}' 1.txt 2.txt

找出兩個文件之間的相同部分

awk 'NR==FNR{a[$0]++} NR>FNR&&a[$0]' 1.txt 2.txt

awk 'NR==FNR{a[$0]}NR>FNR{ if($1 in a) print $0}' 1.txt 2.txt

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

EF修改部分欄位

/// <summary> /// 修改 /// </summary> /// <param name="bookInfo"></param> /// <returns></returns> public static bool Update(BookInfo bookInfo) { using ( ...
用c#每日更換“必應背景圖片”為“桌面壁紙”

必應每天都會更換背景圖片，都非常漂亮，有的時候還十分驚艷，同時還會根據每個地區的特色不同應用不同的圖片。下麵用c 抓取必應每天的背景圖片，並實現桌面壁紙的每天自動切換實現思路 1.通過獲取“必應”網頁背景圖片URL 2.下載圖片到本地 3.設置這個圖片為壁紙 4.每日自動切換壁紙 1.創建項目文 ...
[WPF]是時候將WPF控制項庫從.Net Framework升級到.NET Core 3.1

1. 升級到Core的好處去年中我曾考慮將我的控制項庫項目 "Kino.Toolkit.Wpf" 升級到.NET Core，不過很快放棄了，因為當時.NET Core是預覽版，編譯WPF還需要使用最新的Visual Studio 2019，這樣作為一個教學項目不夠友好。到了今天.NET Core 3 ...
基於Asp.Net Core，利用ZXing來生成二維碼的一般流程

在.net環境下，基於Asp.Net Core，利用ZXing來生成二維碼的一般操作。 ...
30多張圖來瞭解Keil5的使用

Keil IDE 工具學習前言學習過近4年的STM32，通過正點原子的視頻還有資料入門的，裡面的資料很齊全。可是我很少去看除了視頻，原理圖，中文手冊之外的資料。但是最近翻看了一下那些資料發現了許多的寶藏，比如，CM3權威指南，Ucos-ii的講解，個人對基礎比較喜歡，所以沒有去看關於界面EmWi ...
debian10切換國內源

Debian 10.3 下載地址： "http://mirrors.163.com/debian cd/10.3.0 live/amd64/iso hybrid/debian live 10.3.0 amd64 standard.iso" 備份更換輸入以下內容：註意許可權問題，否則可能編輯不了此 ...
WEB緩存系統之varnish緩存項修剪

對於varninsh來講，緩存項修剪也叫緩存項刪除；我們在varnish伺服器上可以通過vcl語言來編寫緩存策略，對於某些緩存該如何緩存，緩存多久等等；假如我們在定義好緩存策略後，在定義緩存過期時間內，後端伺服器內容發生了變化，或者後端伺服器發生了內容更新，我們如果不把varnish上的緩存修剪掉... ...
# 第五章：Linux文件類型及查找命令實踐

1、文件屬性文件屬性是指：文件的大小，創建時間，類型，許可權，屬組等。文件的屬性總共10列第一列是文件的唯一標識，也稱之為 inode（節點）號第二列第一個字元是指文件類型 \ 是代表文件類型為普通文件（用f表示） d 是代表文件類型為目錄（用d表示） l 是代表文件類型為連接文件 ...