【轉載】inotify+rsync實時同步 解決同步慢問題 (轉載備記)

来源:http://www.cnblogs.com/xiuluo--angel/archive/2017/06/26/7081586.html
-Advertisement-
Play Games

原文地址:http://www.ttlsa.com/web/let infotify rsync fast/ 背景 我們公司在用inotify+rsync做實時同步,來解決分散式集群文件一致性的問題。但當web文件越來越多(百萬級數量html,jpg等小 文件),同步就越來越慢,根本做不到實時,按照 ...


原文地址:http://www.ttlsa.com/web/let-infotify-rsync-fast/

背景

  我們公司在用inotify+rsync做實時同步,來解決分散式集群文件一致性的問題。但當web文件越來越多(百萬級數量html,jpg等小 文件),同步就越來越慢,根本做不到實時,按照網上的調優方法都嘗試過,問題根本沒有解決。經過我一翻細緻研究,終於把慢的核心問題研究明白,先總結一句 inotifywait響應不會有延遲,rsync也很快。大家同樣有慢的煩惱,那是因為網上的inotify+rsync的教程都是坑。下麵我們來分 析。

inotifywait 單獨分析

/usr/local/bin/inotifywait -mrq --format '%Xe %w%f' -e modify,create,delete,attrib /data/

執行上面命令,是讓inotifywait監聽/data/目錄,當監聽到有發生modify,create,delete,attrib等事件發生時,按%Xe %w%f的格式輸出。
在/data/目錄touch幾個文件

touch /data/{1..5}

觀看inotify輸出

ATTRIB /data/1           -- 表示發生了ATTRIB事件 路徑為/data/1
ATTRIB /data/2
ATTRIB /data/3
ATTRIB /data/4
ATTRIB /data/5

知道上面的輸出效果之後 我們應該想得到,可以用rsync獲取inotifywait監控到的文件列表來做指定的文件同步,而不是每次都由rsync做全目錄掃描來判斷文件是否存在差異。

網上的inotify+rsync分析

我們來看網上的教程,我加了註釋。(網上所有的教程基本都一模一樣,儘管寫法不一樣,致命點都是一樣的)

#!/bin/bash 
/usr/bin/inotifywait -mrq --format '%w%f'-e create,close_write,delete /backup |while read file
#把發生更改的文件列表都接收到file 然後迴圈,但有什麼鬼用呢?下麵的命令都沒有引用這個$file 下麵做的是全量rsync
do 
    cd /backup && rsync -az --delete /backup/ [email protected]::backup/--password-file=/etc/rsync.password 
done

#註意看 這裡的rsync 每次都是全量的同步(這就坑爹了),而且 file列表是迴圈形式觸發rsync ,等於有10個文件發生更改,就觸發10次rsync全量同步(簡直就是噩夢),那還不如直接寫個死迴圈的rsync全量同步得了。
#有很多人會說 日誌輸出那裡明明只有差異文件的同步記錄。其實這是rsync的功能,他本來就只會輸出有差異需要同步的文件信息。不信你直接拿這句rsync來跑試試。
#這種在需要同步的源目錄文件量很大的情況下,簡直是不堪重負。不僅耗CPU還耗時,根本不可以做到實時同步。
備註:backup為rsync server配置module,除了編寫腳本以外,還需要配置一個rsync server,rsync server配置參考《http://www.ttlsa.com/linux/rsync-install-on-linux/

改良方法

要做到實時,就必須要減少rsync對目錄的遞歸掃描判斷,儘可能的做到只同步inotify監控到已發生更改的文件。結合rsync的特性,所以這裡要分開判斷來實現一個目錄的增刪改查對應的操作。
腳本如下

#!/bin/bash
src=/data/                           # 需要同步的源路徑
des=data                             # 目標伺服器上 rsync --daemon 發佈的名稱,rsync --daemon這裡就不做介紹了,網上搜一下,比較簡單。
rsync_passwd_file=/etc/rsyncd.passwd            # rsync驗證的密碼文件
ip1=192.168.0.18                 # 目標伺服器1
ip2=192.168.0.19                 # 目標伺服器2
user=root                            # rsync --daemon定義的驗證用戶名
cd ${src}                              # 此方法中,由於rsync同步的特性,這裡必須要先cd到源目錄,inotify再監聽 ./ 才能rsync同步後目錄結構一致,有興趣的同學可以進行各種嘗試觀看其效果
/usr/local/bin/inotifywait -mrq --format  '%Xe %w%f' -e modify,create,delete,attrib,close_write,move ./ | while read file         # 把監控到有發生更改的"文件路徑列表"迴圈
do
        INO_EVENT=$(echo $file | awk '{print $1}')      # 把inotify輸出切割 把事件類型部分賦值給INO_EVENT
        INO_FILE=$(echo $file | awk '{print $2}')       # 把inotify輸出切割 把文件路徑部分賦值給INO_FILE
        echo "-------------------------------$(date)------------------------------------"
        echo $file
        #增加、修改、寫入完成、移動進事件
        #增、改放在同一個判斷,因為他們都肯定是針對文件的操作,即使是新建目錄,要同步的也只是一個空目錄,不會影響速度。
        if [[ $INO_EVENT =~ 'CREATE' ]] || [[ $INO_EVENT =~ 'MODIFY' ]] || [[ $INO_EVENT =~ 'CLOSE_WRITE' ]] || [[ $INO_EVENT =~ 'MOVED_TO' ]]         # 判斷事件類型
        then
                echo 'CREATE or MODIFY or CLOSE_WRITE or MOVED_TO'
                rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip1}::${des} &&         # INO_FILE變數代表路徑哦  -c校驗文件內容
                rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip2}::${des}
                 #仔細看 上面的rsync同步命令 源是用了$(dirname ${INO_FILE})變數 即每次只針對性的同步發生改變的文件的目錄(只同步目標文件的方法在生產環境的某些極端環境下會漏文件 現在可以在不漏文件下也有不錯的速度 做到平衡) 然後用-R參數把源的目錄結構遞歸到目標後面 保證目錄結構一致性
        fi
        #刪除、移動出事件
        if [[ $INO_EVENT =~ 'DELETE' ]] || [[ $INO_EVENT =~ 'MOVED_FROM' ]]
        then
                echo 'DELETE or MOVED_FROM'
                rsync -avzR --delete --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip1}::${des} &&
                rsync -avzR --delete --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip2}::${des}
                #看rsync命令 如果直接同步已刪除的路徑${INO_FILE}會報no such or directory錯誤 所以這裡同步的源是被刪文件或目錄的上一級路徑,並加上--delete來刪除目標上有而源中沒有的文件,這裡不能做到指定文件刪除,如果刪除的路徑越靠近根,則同步的目錄月多,同步刪除的操作就越花時間。這裡有更好方法的同學,歡迎交流。
        fi
        #修改屬性事件 指 touch chgrp chmod chown等操作
        if [[ $INO_EVENT =~ 'ATTRIB' ]]
        then
                echo 'ATTRIB'
                if [ ! -d "$INO_FILE" ]                 # 如果修改屬性的是目錄 則不同步,因為同步目錄會發生遞歸掃描,等此目錄下的文件發生同步時,rsync會順帶更新此目錄。
                then
                        rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip1}::${des} &&            
                        rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip2}::${des}
                fi
        fi
done

每兩小時做1次全量同步

因為inotify只在啟動時會監控目錄,他沒有啟動期間的文件發生更改,他是不知道的,所以這裡每2個小時做1次全量同步,防止各種意外遺漏,保證目錄一致。

crontab -e
* */2 * * * rsync -avz --password-file=/etc/rsync-client.pass /data/ [email protected]::data && rsync -avz --password-file=/etc/rsync-client.pass /data/ [email protected]::data

改良後我們公司這種百萬級小文件也能做到實施同步了。
下麵附上inotify的參數說明

inotify介紹-- 是一種強大的、細顆粒的、非同步的文件系統監控機制,&####&0&####&內核從2.6.13起,加入Inotify可以監控文件系統中添加、刪除、修改移動等各種事件,利用這個內核介面,就可以監控文件系統下文件的各種變化情況。

inotifywait 參數說明

參數名稱 參數說明
-m,–monitor 始終保持事件監聽狀態
-r,–recursive 遞歸查詢目錄
-q,–quiet 只列印監控事件的信息
–excludei 排除文件或目錄時,不區分大小寫
-t,–timeout 超時時間
–timefmt 指定時間輸出格式
–format 指定時間輸出格式
-e,–event 後面指定刪、增、改等事件

inotifywait events事件說明

事件名稱 事件說明
access 讀取文件或目錄內容
modify 修改文件或目錄內容
attrib 文件或目錄的屬性改變
close_write 修改真實文件內容
close_nowrite
close
open 文件或目錄被打開
moved_to 文件或目錄移動到
moved_from 文件或目錄從移動
move 移動文件或目錄移動到監視目錄
create 在監視目錄下創建文件或目錄
delete 刪除監視目錄下的文件或目錄
delete_self
unmount 卸載文件系統

優化 Inotify

#在/proc/sys/fs/inotify目錄下有三個文件,對inotify機制有一定的限制

[root@web ~]# ll /proc/sys/fs/inotify/
總用量0
-rw-r--r--1 root root 09月923:36 max_queued_events
-rw-r--r--1 root root 09月923:36 max_user_instances
-rw-r--r--1 root root 09月923:36 max_user_watches

max_user_watches #設置inotifywait或inotifywatch命令可以監視的文件數量(單進程)
max_user_instances #設置每個用戶可以運行的inotifywait或inotifywatch命令的進程數
max_queued_events #設置inotify實例事件(event)隊列可容納的事件數量
----------------------------

[root@web ~]# echo 50000000>/proc/sys/fs/inotify/max_user_watches -- 把他加入/etc/rc.local就可以實現每次重啟都生效
[root@web ~]# echo 50000000>/proc/sys/fs/inotify/max_queued_events

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Sql Server2005資料庫自帶一個排序函數ROW_NUMBER(),列表為: 語法:row_number() : over(子句)1.使用row_number()函數進行編號: 原理:先按Sage進行排序,排序完後,給每條數據進行編號。註:在使用over等開窗函數時,over裡頭的分組及排序 ...
  • mongodb作為nosql中排名第一的資料庫,近年來使用的人數越來越多,作為開發人員,非常有必要瞭解下mongodb資料庫。下麵就給大家介紹下mongodb資料庫的基本知識,有不對的地方歡迎指正 ...
  • 純粹記錄一下最基礎寫法,幾乎沒有寫什麼邏輯,寫法也並不是很完善(因為我自己也剛剛摸索出來這麼寫可以...= =!) 望高手指教 也希望能夠幫到比我還新的新手.... //1.insert操作 let insertSql = 'insert into User(username,password,na ...
  • 最近因為那個勒索病毒,聽了一位安全方面的專家做的的一個關於安全方面的培訓,從中學習到了許多新的知識。在如今網路如此發達的社會,我們的信息,我們的隱私,是如此簡單的就可以被泄漏出來,所以關註安全是很有必要的。 在報告的時候提到了kali linux,這個對想學習安全攻防的同學來說是一個很好的實踐工具。 ...
  • 一、版本信息 mac 10.10.5 php 5.5.38 phpstorm 10.0.3 xdebug 版本需要與php匹配,匹配地址 :點我匹配 點我查看所有版本 提示:不確定xdebug版本的,把phpinfo()顯示的全部複製(command+a 全選再command+c複製)到文本框中,x ...
  • 下麵介紹一下自己寫的python程式,主要是的知識點為sys、os、json、pickle的模塊應用,python程式包的的使用,以及關於類的使用。 下麵是我的程式目錄: bin是存放一些執行文件course.py下麵是這個文件的內容: 這個文件是對os,sys模塊的應用; BASE_DIR = o ...
  • " 1、理論基礎 " "1.1、命令行的前世今生" "1.2、命令執行規則" "1.3、使用命令歷史" " 2、使用入門 " "2.1、啟動和關閉命令行" "2.2、執行簡單的命令" "2.3、命令行執行程式使用技巧" " 3、總結 " 1、理論基礎 1.1、命令行的前世今生 談到 Windows ...
  • Supervisor介紹 Supervisor 允許其用戶在UNIX類操作系統上控制多個進程。 塊如下: 方便 需要為每個進程實例編寫rc.d腳本通常是不方便的。 rc.d腳本是進程初始化/自動啟動/管理的常用形式,但寫入和維護可能會很痛苦。此外,rc.d腳本不能自動重新啟動崩潰的進程,並且許多程式 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...