不知不覺間,2022年的腳步已經走到了倒數第二個月。臨近年末,我們對產品本身以及客戶反饋的一些問題進行了持續的更新和優化,例如基線告警、數據服務平臺新增TDengine 數據源支持、行級許可權根據用戶屬性實現動態賦權。 以下為袋鼠雲產品功能更新報告第二期內容,更多探索,請繼續閱讀。 數棧DTinsig ...
不知不覺間,2022年的腳步已經走到了倒數第二個月。臨近年末,我們對產品本身以及客戶反饋的一些問題進行了持續的更新和優化,例如基線告警、數據服務平臺新增TDengine 數據源支持、行級許可權根據用戶屬性實現動態賦權。
以下為袋鼠雲產品功能更新報告第二期內容,更多探索,請繼續閱讀。
數棧DTinsight
離線開發平臺
1.支持對接Trino引擎
創建項目時支持對接Trino引擎,支持創建和運行Trino任務。
2.個人賬號支持綁定Kerberos認證
數棧支持對用戶或用戶組綁定Kerberos證書,並支持以用戶級/用戶組級Kerberos賬號進行任務提交。
3.基線告警
基線是一組任務的管理單位,被納入同一組基線的任務一般需要相同的產出時間。一條基線被納入監控後,該基線中的任務及其所有上游的任務都會被自動監控。
基線在基線管理中開啟時,每天晚上24點會生成第二天的基線實例,以對第二天的基線上任務所產生的實例進行監控。
例子:如下圖,設一條基線包含任務D、E,則D、E及其上游的A、B都會被納入監控。
如果某任務的下游沒有被納入基線的任務(例如C),則即使該任務異常,智能監控也不會報警。
4.安全審計增加類目
5.NULL可以選擇識別為NULL
數據同步任務中,FTP作為源數據源時,NULL可以選擇識別為NULL或者空字元串
6.整庫同步可以選擇同步任務存放目錄
7.其他優化項
· 在IDE中進行任務切換時,會記住上次代碼瀏覽位置
· postgresql、db2、greenplum、kingbase、mysql、oceanbase、oracle、sqlserber、tidb等任務,存儲函數使用select * from procedure() /select procedure()調用時,在調度不會執行的問題修複
· 表查詢結果限制,所有SQL任務數據查詢結果預設僅顯示1000條
· 數據同步任務當HDFS分區不存在時,高級配置中可配置是否報錯
具體說明:通過指定高級配置中failedIfPathNotExist的狀態,來配置是否進行報錯提示:
若failedIfPathNotExist=true,則報錯;若failedIfPathNotExist=false,則不報錯
8.技術改造
· 統計數據流量統計優化
· SQL加密解密防止某些關鍵字被攔
· 支持spark UDF
· inceptor同步支持直接讀寫文件的方式去進行數據同步
實時開發平臺
1.產品首頁改造
在原來只有項目入口和幫助手冊入口的基礎上,新增了更多運維信息。幫助用戶進入產品後,不需要一個個進入項目,可以直觀的看到目前項目運行情況、當前需要處理什麼問題,提高產品可用性。
2.任務運行日誌推送
在【任務開發-任務設置】頁面,支持將任務運行日誌推送至外部Kafka,運維人員可基於日誌信息做更豐富的日誌分析、任務監控等工作。
3.優化項目
· PyFlink任務在創建時可以引用第三方python包
· Flink1.12相容TiDB Connector
· Flink1.10/1.12相容開啟SASL認證的Kafka Connector
· 優化日誌列印格式,避免出現/n/t等字元
· Source Connector新增支持了RocketMQ
數據服務平臺
1.【生成API】新增TDengine 數據源支持
TDengine 是一款高性能、分散式、支持 SQL 的時序資料庫,廣泛運用於物聯網、工業互聯網、車聯網、IT 運維、金融等領域。除核心的時序資料庫功能外,TDengine 還提供緩存、數據訂閱、流式計算等大數據平臺所需要的系列功能。
目前EasyAPI支持TDengine基本SQL語句的查詢功能,可以在「生成API」-「自定義SQL模式」DQL模式下創建TDengine API服務。
2.【API市場】增加批量導出功能
支持API市場API的批量導出,用戶可先在測試環境中進行API調試,無誤後在API市場批量導出API,再在正式環境中導入API,提高效率。
3.【API調用情況】新增下載日誌功能
「API管理」API調用情況 調用明細/錯誤明細模塊增加「下載日誌」功能,可以通過設置調用條件下載7天內的日誌數據,方便用戶進行明細查看,調用統計。
4.【生成API】in、not in 操作符增加分隔符配置
之前的版本當進行in、not in 操作符查詢數據時,預設入參參數為逗號分隔。存在特殊業務場景入參參數中包含逗號的情況,導致入參分隔錯誤。
當前版本中,針對in、not in操作符,可以自定義選擇英文“,”、“|”、“/”、“:”、“;”五種分隔符,以滿足不同客戶業務場景需求。
數雁EasyDigit
客戶數據洞察平臺(原智能標簽平臺)
1.【授權】-標簽/實體/群組/目錄細粒度許可權控制
用戶痛點:標簽、實體、群組等屬於企業數據資源的一部分,隨著資源持續維護、資產沉澱,對資源的許可權控制提出了更高的要求,本次新增的授權功能能夠實現靈活的許可權控制。
新增功能說明:給用戶/用戶組/部門/角色授予當前資源的許可權,可授權的資源包括標簽、實體、群組、目錄,可授予的許可權包括可查看、可編輯許可權,也可以將資源設置為全員公開可查看/可編輯,實現細粒度的許可權控制。
2.【行級許可權】-根據用戶屬性實現動態賦權
用戶痛點:行級許可權 用來控制用戶對標簽數據的訪問許可權,當某個用戶被設置了行級許可權後,只能查看在許可權規則內設置的標簽數據。
新增功能說明:
· 支持針對用戶屬性動態設置許可權規則,如1000條結果數據,用戶A查看200條,用戶B查看500條
· 單個許可權標識可設多條許可權規則,且最大支持5個層級,條件之間支持配置“且”、“或”關係
· 許可權的適用成員可指定用戶、用戶組、部門、角色,且支持針對用戶屬性動態設置適用成員
3.【多值標簽】-標簽值分隔去重
多值標簽 的值由一個或多個值組合構成,多個值之間由分隔符進行分隔(系統固定為英文逗號),可在實體/關係創建時指定標簽是否多值。
多值型標簽的操作符包括【包含部分、包含所有、不包含、精確匹配、模糊匹配、不匹配、有值、無值】,可選的是分隔並去重後的標簽值。其中:
· 包含所有:若選擇多個標簽值,篩選結果將同時符合所有標簽值,即多個標簽值的篩選結果之間使用交集運算;
· 包含部分:若選擇多個標簽值,篩選結果將至少符合其中一個標簽值,即多個標簽值的篩選結果之間使用並集運算。
4.【組織架構】-引入多層級部門
組織架構 是一個組織整體的結構,是企業內部開展業務、落實管理的基本要素。標簽系統支持根據多層級的組織架構添加用戶,並根據部門進行標簽授權、行級許可權的控制。
5.【批量操作】-發佈/更新交互升級
· 批量發佈:分類展示可發佈、無法發佈的標簽,並說明標簽無法發佈的原因,降低操作門檻
· 批量更新:分類展示可更新、無法更新的標簽,並說明標簽無法更新的原因,降低操作門檻
6.【通用模板】-查詢模板設置
設置查詢維度通用模板,並直接應用於標簽圈群、上傳本地群組、群組交並差選查詢維度的地方,用戶可以在模板的基礎上增刪查詢維度,減少操作成本。
7.【導出描述】-導出數據時可填描述
用戶在導出數據時可填寫描述信息,系統將描述信息記錄在審計日誌中。
8.其他優化項
· 標簽圈群支持重置條件
· 字典數據最大支持2000條
袋鼠雲開源框架釘釘技術交流qun(30537511),歡迎對大數據開源項目有興趣的同學加入交流最新技術信息,開源項目庫地址:https://github.com/DTStack/Taier