linux 的一些腦洞操作_ZenDei技術網路在線

linux 的一些腦洞操作

-Advertisement-

把當前文件夾的文件名用"，"連接成一行，或者將多行轉變為一行將行逆序輸出刪除開頭的註釋行去掉每行開頭4個字元對文件第一列進行統計對文件第四列用"："切割成兩列並將最後一列結果+1，然後輸出全部列對文件第二列求均值實現DNA序列反向互補某一行插入另外一個文件的內容對一個文件按照第一 ...

把當前文件夾的文件名用"，"連接成一行，或者將多行轉變為一行

ls | paste -s -d ","  # -s 選項將輸入進行一次性粘貼
ls | xargs | sed 's/ /,/g'  #xargs 將輸入作為參數(空格分隔)傳入
ls | awk '{printf "%s,",$0}'

將行逆序輸出

sed '1!G;h;$!d’'file  # 1!G 第一行不執行G命令，從第二行開始執行；$!d 最後一行不刪除；第一行自動存入模式空間，將模式空間內容（第一行）放到保持空間(h)，然後刪除模式空間內容(d，否則它會自動輸出)，第二行自動存入模式空間，（開始用G）將保持空間（第一行內容）接到模式空間（第二行）後，將當前模式空間（第二行+第一行）放到保持空間（h），然後刪除當前模式空間(d)，依次類推，最後一行不刪除模式空間，再自動輸出模式空間內容

刪除#開頭的註釋行

sed '/^#.*/d' test.txt

去掉每行開頭4個字元

cut -c 4- test.csv

對文件第一列進行統計

awk -F "," '{count[$1]++} END{for (record in count) print record,count[record] }' test.csv  #count[$1]++創建關聯數組count[$1]併進行計數

對文件第四列用"："切割成兩列並將最後一列結果+1，然後輸出全部列

awk -F "," '{split($4,array,":");print $1,$2,$3,array[1],array[2]+1}' test.csv  #split切割$4存到數組array中，array[1]和arrya[2]即為切割後的兩個區域

對文件第二列求均值

awk -F "," '{sum+=$2} END {print "Average = ", sum/NR}' test.csv

實現DNA序列反向互補

cat seq.txt | sed 'y/ATGC/TACG/' |rev

某一行插入另外一個文件的內容

sed '2 r a.txt' test.csv

對一個文件按照第一列進行篩選，篩選條件是必須在另外一個文件的第一列出現過

awk -F "," '{if(NR==FNR){count[$1]=1}else if(count[$1]==1){print $0}}' chr.txt test.csv  #將第一個文件第一列的值存入關聯數組，並給值為1，如果第二個文件建立的關聯數組對應值為1，說明在第一個文件第一列出現過，則輸出整行

對文件第二列和第三列進行展開

展開前四列

展開後成為三列

awk -F "," '{for (i=$2;i<=$3;i++) {print $1,i,$4}}'  test.csv

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Spark機器學習(11)：協同過濾演算法

協同過濾（Collaborative Filtering，CF）演算法是一種常用的推薦演算法，它的思想就是找出相似的用戶或產品，向用戶推薦相似的物品，或者把物品推薦給相似的用戶。怎樣評價用戶對商品的偏好？可以有很多方法，如用戶對商品的打分、購買、頁面停留時間、保存、轉發等等。得到了用戶對商品的偏好，就可 ...
Mysql rpm安裝

總結下mysql rpm安裝的方式，與一些錯誤環境[root@host2 ~]# uname -aLinux host2 2.6.32-504.3.3.el6.x86_64 #1 SMP Wed Dec 17 01:55:02 UTC 2014 x86_64 x86_64 x86_64 GNU/L ...
MapReduce和yarn

1.Mapreduce是什麼? Mapreduce是一個分散式運算程式的編程框架，是用戶開發“基於hadoop的數據分析應用”的核心框架； Mapreduce核心功能是將用戶編寫的業務邏輯代碼和自帶預設組件整合成一個完整的分散式運算程式，併發運行在一個hadoop集群上； 2.作用（1）海量數據在 ...
java oracle clob string 大字元串存儲【轉】

單位用到了oracle存儲string類型到資料庫里的clob，上網查看資料找到解決方案。如下：轉自：http://bestxiaok.iteye.com/blog/1027733 ...
linux用戶及許可權管理

【文件管理、管道、用戶及組管理、用戶及許可權管理】\用戶及組管理用戶與組管理 Linux系統是一個多用戶多任務的分時操作系統，任何一個要使用系統資源的用戶，都必須首先向系統管理員申請一個賬號，然後以這個賬號的身份進入系統。用戶的賬號一方面可以幫助系統管理員對使用系統的用戶進行跟蹤，並控制他們對系統資 ...
ROS學習（三）——創建一個簡單的發佈節點和訂閱節點

暑假在家有些懈怠，不，非常懈怠— —||！良心已經發痛了，想快些補回原來的進度，但忽然發現，中斷了一段時間再重新去學習，有的地方連最基本的符號都忘記了，這次特意弄個最最基礎的，恢復一下，以前的進度。 1.建立一個工作空間在home文件夾裡面發現新建好了相應的文件夾，當然裡面，空空的，什麼都沒有。 ...
Hadoop-2.7.2集群的搭建——集群學習日記

前言因為比賽的限制是使用Hadoop2.7.2，估在此文章下麵的也是使用Hadoop2.7.2,具體下載地址為 "Hadoop2.7.2" 開始的準備目前在我的實驗室上有三台Linux主機，因為需要參加一個關於spark數據分析的比賽，所以眼見那幾台伺服器沒有人用，我們團隊就拿來配置成集群。具體 ...
linux下通過命令行上傳文件到百度網盤

一.環境： centos release 6.9 python 2.7.13 二.安裝工具bypy sudo pip install bypy 三.使用bypy 3.1 授權 3.2 上傳文件 bypy upload (在某個文件夾下就會將文件夾下的內容全部上傳到雲端) 3.3 下載文件 bypy ...