在當今數字化的時代,數據已然成為企業決策與運營的關鍵要素。而保障數據的完整性、準確性以及及時性,對於企業的發展有著舉足輕重的意義。在數據運維管理範疇內,補數據屬於大數據開發和運維人員常用的運維操作手段。 周期補數據和定時補數據作為兩個相對特殊的補數據方式,在各類不同的場景中均發揮著至關重要的作用。 ...
在當今數字化的時代,數據已然成為企業決策與運營的關鍵要素。而保障數據的完整性、準確性以及及時性,對於企業的發展有著舉足輕重的意義。在數據運維管理範疇內,補數據屬於大數據開發和運維人員常用的運維操作手段。
周期補數據和定時補數據作為兩個相對特殊的補數據方式,在各類不同的場景中均發揮著至關重要的作用。
例如,某銀行客戶的上游業務系統數據會每隔一段時間進行數據訂正,此時可能需要重新計算或補充之前的數據。若每次都通過手動方式去補,操作將會極其繁瑣,這種情況下就需要藉助周期補數據的功能來修正數據。
再如,某證券客戶的機器資源有限,白天時段希望將資源主要用於跑批任務,而夜間的資源通常處於閑置狀態。大數據開發人員通常需要設置一個凌晨的鬧鐘起來補數據,在此種情形下,則需要藉助定時補數據的功能,從而避免天天熬夜。
一、如何配置周期補數據任務
第一步:補數據任務配置
使用項目下擁有「數據開發」角色許可權的用戶,進入到當前項目的「運維中心->周期任務->周期任務管理」頁面,如下圖所示:
我們要對mysql_002這個任務進行周期補數據的配置,找到mysql_002任務後,點擊「操作-補數據-當前任務」;
打開補數據配置頁面後,運行方式選擇「周期運行」,即可對當前補數據任務進行「調度周期」「具體時間」「業務日期」等相關屬性的配置;
配置調度周期為天,計劃時間為每日0點,需要補業務日期為計劃時間近三天的數據,可以進行如下圖配置;
點擊「預覽」按鈕,預覽補數據近5個周期對應的業務日期;
完成周期補數據相關配置後,點擊「確定」按鈕。
第二步:補數據任務管理
周期補數據配置完成後,在「運維中心->補數據任務->補數據任務管理->周期運行」中可以看到新建的周期補數據任務;
在補數據任務管理頁面,能夠查看相應的任務信息,並且能夠針對已生成的周期補數據任務進行「生效狀態」的管理,還能執行臨時運行周期補數據任務、編輯周期補數據任務配置以及刪除周期補數據任務等操作。
第三步:補數據實例管理
在補數據實例管理頁面,可以對不同批次的補數據任務進行操作,例如批量殺實例、批量重跑等操作;
二、如何配置定時補數據任務
第一步:補數據任務配置
使用項目下擁有「數據開發」角色許可權的用戶,進入到當前項目的「運維中心->周期任務->周期任務管理」頁面,如下圖所示:
我們要對mysql_002這個任務進行定時補數據的配置,找到mysql_002任務後,點擊「操作-補數據-當前任務」;
打開補數據配置頁面後,選擇運行方式為「單次運行」,運行時間為「自定義時間」設置為7月30日 00時00分;
完成定時補數據任務配置後,點擊「確認」按鈕。
第二步:補數據任務管理
定時補數據配置完成後,在「運維中心->補數據任務->補數據任務管理->單次運行」中可以看到新建的定時補數據任務;
在補數據任務管理頁面,能夠查看相應的任務信息,可以執行臨時運行定時補數據任務、編輯定時補數據任務配置以及刪除定時補數據任務等操作。
第三步:補數據實例管理
在補數據實例管理頁面,可以對不同批次的補數據任務進行操作,例如批量殺實例、批量重跑等操作。
三、總結
通過對周期補數據和定時補數據的介紹,我們深入瞭解了這兩種特殊的數據補充方式。周期補數據適用於應對諸如數據採集故障、系統升級或遷移、業務規則變更等導致的數據缺失或錯誤,能按照一定規律自動補充,減輕手動操作的繁瑣。定時補數據則能充分利用特定時間段的資源,滿足如資源有限場景下的補數據需求,避免人工熬夜操作。
《行業指標體系白皮書》下載地址:https://www.dtstack.com/resources/1057?src=szsm
《數棧產品白皮書》下載地址:https://www.dtstack.com/resources/1004?src=szsm
《數據治理行業實踐白皮書》下載地址:https://www.dtstack.com/resources/1001?src=szsm
想瞭解或咨詢更多有關大數據產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠雲官網:https://www.dtstack.com/?src=szbky