數據源太多,報表工具該如何相容?

来源:https://www.cnblogs.com/zimug/archive/2022/11/14/16888455.html
-Advertisement-
Play Games

現代應用已經進入多數據源階段了,不再是一個單一的資料庫包打天下,一個應用中會涉及除關係資料庫外各種數據源,如文本文件類數據、NOSQL、多維資料庫、HTML Webservice等等,即使是關係資料庫,也可能不止一個 應用這樣了,那麼應用中的報表自然也會涉及到多樣性的數據源了 現在的報表,基本都是用 ...


現代應用已經進入多數據源階段了,不再是一個單一的資料庫包打天下,一個應用中會涉及除關係資料庫外各種數據源,如文本文件類數據、NOSQL、多維資料庫、HTML Webservice等等,即使是關係資料庫,也可能不止一個

應用這樣了,那麼應用中的報表自然也會涉及到多樣性的數據源了

現在的報表,基本都是用報表工具來做,很多報表工具都號稱支持多數據源,是不是能解決這個問題呢?

其實只能搞定一點點

報表工具能輕鬆搞定的多源數據長什麼樣

簡單的說,來自關係資料庫的多源數據都比較好搞定,不管是多表,還是多庫,都很簡單,用SQL把各個來源的數據都取出來,放到報表中去關聯、計算、呈現就可以

imagepng

imagepng

這樣的多源數據,好一點的報表工具都可以輕鬆應對

報表工具不好搞定的多源數據長什麼樣

也可以簡單的說,不是單純的關係資料庫的多源數據,報表工具都不太好做

imagepng

進入大數據時代以來,數據不僅是大了,而且存儲的方式也多了,除了傳統的關係資料庫外,還有

1.TXT/CSV、Excel、JSON/XML 等文件;
2.MongoDB、Cassandra、HBase、Redis 這些 NoSQL 資料庫;
3.HDFS 等分散式文件系統;
4.webService;
5.ES、Kafka 等其他數據源形式

文件類的某些報表工具還能搞定,但也只限於讀,而不會算,只能先全部讀入到報表中,然後再利用報表的計算能力來計算處理,數據量大時,讀取的效率和空間容量都可能會成為問題,(極個別的工具可以邊讀邊彙總過濾,還能並行流式讀取,會好很多);其它類的數據源大部分報表工具就連讀都不會了,因為沒有標準,每家有各自的API,想要讀取,大部分都得通過JAVA自定義數據集的方式了

讀取都比較費勁,而這些數據常常在業務邏輯上又有關聯,做報表的時候大部分時候都會涉及到多個數據源之間的關聯混算,單憑報表工具提供的多源關聯能力處理起來就更困難了

報表工具解決不了只能硬編碼

報表工具解決不了,但也難不倒工程師,因為工程師會編碼,沒有什麼是編碼解決不了的,

工程師可以先把異構的數據變成同構的,比如把文件的數據先導入到RDB中,由RDB計算後再給報表用,而那些不會讀的,就只能再一次依靠所有報表工具都提供的所謂自定義數據原介面了用JAVA讀入並處理好,再傳給報表

項目中,很多困難的多源混算情況,都是這麼處理的,都能搞定,但是這麼做其實弊端很多

異構變同構,其實大部分時候是把不同的數據強行裝入到常見關係資料庫中,然後再利用SQL的方式來處理計算,這樣做,首先得考慮資料庫本身的管理和壓力,管理上是否允許這樣操作,容量是否夠,每次遇到這樣的庫外數據都要往資料庫中放?

然後還得考慮時效,數據的導入都需要時間,量少的耗時短可能無所謂,量大的可能進度都被耽誤了,而且一般業務數據都是實時變動的,導入數據的方式也基本很難保證數據的實時性,還有些變不了或者變起來極困難的,像json/xml多層數據(mongodb也是這種),要建很多表,想變都變不了

JAVA處理的話,要好很多,不用考慮入庫的一系列問題,實時性也可以保證,但是開發成本高,還會破壞應用架構

JAVA開發人員的成本本身就高,然後JAVA計算數據的能力還很弱,寫起來工作量很大,簡單做個求和運算都需要寫數行代碼的迴圈來實現,更別說邏輯複雜的運算了,動輒幾百行的代碼,一個報表還可以承受,報表一多,就承受不了這樣的高成本了

另外JAVA代碼需要和項目應用一起編譯,也會帶來報表和應用高耦合的問題,還會影響報表本身熱切換的能力

有沒有更好的辦法

如果報表工具提供處理複雜多樣性數據源的能力,那問題就可以迎刃而解了,就不需要再來回倒騰數據或者JAVA硬寫了

潤乾報表集成SPL集算器以後就具備了這樣的能力

imagepng

SPL 是一款流行的專業的數據計算處理工具,很多項目開發商都在用,因為它不僅好用,而且還免費,開源,是常年做項目,總需要做數據處理的工程師的好幫手

集成 SPL 後,潤乾報表相當於多了一個計算層,這個計算層支持常見的各類數據源,可以同時計算來自不同數據源的數據,不管它是同構還是異構

比如JSON和ORACLE混算

A
1 =json(file("/data/EO.json").read()) JSON數據
2 =A1.conj(Orders)
3 =A2.select(Amount>1000 &&Amount<=3000 && like@c(Client,"s")) 條件過濾
4 =db.query@x(“select ID,Name,Area from Client”) 資料庫數據
5 =join(A3:o,Client;A4:c,ID) 關聯計算
再比如MongoDB和 CSV關聯運算
A
1 =mongo_open("mongodb://127.0.0.1:27017/mongo")
2 =mongo_shell(A1,"Orders.find()").fetch()
3 =file("Employee.csv").import@tc()
4 =mongo_close(A1)
5 =join(A2,SellerId;A3,EId)
6 =A5.new(_1.OrderID,_1.Client,_2.Name,_2.Gender,_2.Dept)

原本要做各種轉換把數據導入到庫里,或者用大段的JAVA來寫,現在簡單幾行SPL代碼就輕鬆搞定了

說在最後

集成了SPL的潤乾報表,簡單幾行代碼就可以搞定多樣性數據源的難題,不僅讓報表做起來更輕鬆,更是幫用戶省下了大把的人工成本,而且潤乾報表本身也好用,潤乾一直都是報表行業的頭部供應商,各行業的大小軟體開發商們都有用潤乾,現在的價格又很親民,1W一套,3W一年隨便用,也可以給項目上省出不少費用,有需要的可以收藏一下了

潤乾報表資料

歡迎對潤乾報表有興趣的加小助手(VX號:RUNQIAN_RAQSOFT),進技術交流群

歡迎關註我的公告號:字母哥雜談,回覆003贈送作者專欄《docker修煉之道》的PDF版本,30餘篇精品docker文章。字母哥博客:zimug.com


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 渲染模板 我的客服系統後端使用的golang Gin 框架,想把頁面渲染出來,下麵就是載入html模板頁面 package router func InitViewRouter(engine *gin.Engine) { //關於頁面 engine.GET("/aboutus.html", func ...
  • 在看集合源碼的時候,因為對一些知識點有些混淆,導致看源碼比較吃力。所以重新回顧一下麵向對象的繼承和多態,順便記錄一下重點。 繼承 子類會繼承父類的所有屬性和方法,但私有屬性和方法在子類不能直接訪問,需要通過父類提供的公共方法訪問; 子類必須調用父類的構造器,完成父類的初始化(創建子類對象時會調用父類 ...
  • 本文花了較短的篇幅重點介紹了JVM Sandbox的功能,實際用法,以及基礎原理。它通過封裝一些底層JVM控制的框架,使得對JVM層面的AOP開發變的異常簡單,就像作者自己所說“JVM-SANDBOX還能幫助你做很多很多,取決於你的腦洞有多大了。” ...
  • 本篇學習 Yarn Application 編寫方法,將帶你更清楚的瞭解一個任務是如何提交到 Yarn ,在運行中的交互和任務停止的過程。通過瞭解整個任務的運行流程,幫你更好的理解 Yarn 運作方式,出現問題時能更好的定位。 一、簡介 本篇將對 Yarn Application 編寫流程進行介紹。 ...
  • 數據結構是Python中一個很重要的概念,是以某種方式(如通過編號)組合起來的數據元素(如數字、字元乃至其他數據結構)的集合。 在Python中,最基本的數據結構是序列(sequence)。 序列中的每個元素都有編號,及其位置或索引,其中的第一個元素的索引為0,第二個元素位的索引為1,依此類推 在有 ...
  • 先說結論 : extern "C"隻影響到鏈接期的name mangling 什麼是name mangling? 請看 : C++函數重載的實現機制之name mangling - 知乎 (zhihu.com) 舉個例子 : // external.h #ifdef __cplusplus exte ...
  • 迷人的兩度搜索 1、BFS和DFS 深度優先搜索演算法(DFS)和廣度優先搜索演算法(BFS)是一種用於遍歷或搜索樹或圖的演算法,在搜索遍歷的過程中保證每個節點(頂點)訪問一次且僅訪問一次,按照節點(頂點)訪問順序的不同分為深度優先和廣度優先。 1.1、深度優先搜索演算法 深度優先搜索演算法(Depth-Fi ...
  • 今天跟大家分享一個關於“狀態機”的話題。給你講清楚什麼是狀態機、為什麼需要狀態機、適用場景、有哪些具體的實現方案以及各個方案對比(附帶github源碼地址) ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...