豬臉識別、自動投喂!Apache DolphinScheduler還能做這些?

来源:https://www.cnblogs.com/DolphinScheduler/p/18357061
-Advertisement-
Play Games

數字化轉型提速中!傳統農牧食品行業也尋求搭上數字化轉型的快車,通過物聯網、大數據、人工智慧等現代信息技術,實現生產、加工、流通等環節的智能化和自動化,提高生產效率、優化資源配置、提升產品質量,並滿足消費者對食品安全和可追溯性的需求。 在數字化浪潮的推動下,鐵騎力士集團作為一家歷史悠久的農牧食品企業, ...


file

數字化轉型提速中!傳統農牧食品行業也尋求搭上數字化轉型的快車,通過物聯網、大數據、人工智慧等現代信息技術,實現生產、加工、流通等環節的智能化和自動化,提高生產效率、優化資源配置、提升產品質量,並滿足消費者對食品安全和可追溯性的需求。

在數字化浪潮的推動下,鐵騎力士集團作為一家歷史悠久的農牧食品企業,正通過引入先進的調度平臺——Apache DolphinScheduler,實現其數字化轉型的巨集偉藍圖。

本期嘉賓介紹

李賢利,鐵騎力士集團的IT架構師,擁有電子與通信工程專業背景,自2014年畢業以來,積累了豐富的行業經驗。在廣電和軍工行業深耕7年後,他將專業視野拓展至農牧養殖食品領域,至今已在鐵騎力士集團服務3年。李賢利在分散式系統建設方面尤為擅長,並積極投身於大數據應用、電腦視覺以及大模型落地探索等前沿技術研究。

鐵騎力士集團概覽

鐵騎力士集團自1992年成立以來,已發展成為一個擁有150家分子公司的產業集群,涵蓋飼料、牧業、食品和生物工程四大領域。集團以全程可控溯源的產業鏈,確保食品安全,推動現代農業的健康發展。

DolphinScheduler的引入

在鐵騎力士集團的數字化轉型過程中,近萬人的集團業務,30多套業務系統需要依靠數字化中心的技術人員作為IT信息支撐,我所在的技術開發部門感到壓力巨大。Apache DolphinScheduler的引入是一個關鍵的里程碑,它不僅支持了集團在飼料事業部、生豬事業部等多個部門,還促進了數字化中心與大數據部的協同工作。

數字化轉型中的調度平臺

2020年,鐵騎力士集團啟動了數字化轉型變革項目,投入1億+資金,設立了研發、營銷、供應鏈、財務、人力資源等五大領域,圍繞著這五大領域共建設了30多套IT系統。通過建設30多套IT系統,集團實現了業務流程的自動化和智能化。這些系統包括但不限於PLM、QMS、TDB、TBI、ECI等業務,涉及到的調度包括Quartz、Elastic-Job、Xxl-job、Oozie,使用的開發語言包括Delphi、C++、C#、Java和Python等。

file

這讓我思考,是否可以做一個統一的大數據調度平臺,統一調度與語言?恰好這時大數據部門的領導推薦了Apache DolphinScheduler。

底座規劃中的調度平臺

響應四川省數字化轉型的號召,集團的數字化轉型已進行一年多,為傳統企業數字化轉型“打樣板”,做支撐。為此,集團進行了數字化平臺底座規劃。

file

在底座規劃中,集團計劃將Apache DolphinScheduler作為統一的調度平臺。

應用案例

2023年,集團正式使用Apache DolphinScheduler,我的使用感受是界面清爽,一目瞭然,數據源與集團採購系統較為匹配,組件也比較豐富。

IOT設備數據採集與應用

file

在IOT設備數據採集方面,鐵騎力士集團期望利用Apache DolphinScheduler實現了對豬(雞)舍和屠宰車間環境的實時監控與數據採集,包括溫度、濕度、光照度、製冷度、氨氣與硫化氫濃度等關鍵指標,上傳到數據資產管理平臺,經過對數據的調度,最終在禽畜養殖管理平臺展現出來。

通過調度事件,我們希望實現定時喂養、自動投料與喂水等自動化操作,並利用豬臉識別技術監控生豬動態,屠宰車間製冷控制,提高養殖效率。

在我們的構想中,我們希望建成一個禽畜養殖調度管理平臺,由總調度平臺採集集團所有養殖基地的數據,並形成溫度、濕度、光照度、製冷度等的可視化調度管理。

主數據歸一化管理

file

在主數據管理方面,鐵騎力士集團通過Apache DolphinScheduler的SQL組件,實現了經銷商、供應商、產品物料和人員組織等數據的歸一化管理。這一舉措不僅提高了數據的一致性和可用性,也為數據驅動的決策提供了堅實的基礎。

大數據部門主要使用了Apache DolphinScheduler的DataX和Sqoop組件。

file

由於系統比較多,數據同步過來之後需要及時進行數據校驗,比如唯一單據的校驗。

電商情報數據應用

file

電商情報數據的應用是鐵騎力士集團數字化轉型的另一亮點。通過Python和Java組件,集團能夠高效處理來自不同商超平臺的數據,實現數據的快速分析和應用。

級聯組件的創新應用

file

在業務流程自動化方面,鐵騎力士集團希望通過Apache DolphinScheduler的級聯組件,實現業務場景的創新應用。例如,通過調度平臺整合EAA系統與集團的各系統數據,實現從發票/完稅證明到報銷/收付款的全流程自動化。

有了上面的構想,我們提出了三個方案:

方案1:SQL+PYTHON+HTTP組件,這個方案的優點是可以實現解耦,但SQL組件的列表數據無法傳輸到下一個組件;

方案2:JAVA/PYTHON組件,這個方式實現起來簡單,但每個介面都需要寫代碼;

方案3: HTTP組件,這個方案需要統一調度平臺,可以寫一個http介面去驅動源系統向目標系統發出請求,但僅僅是換了調度平臺。

在實踐過程中,我們發現在使用Apache DolphinSchedulers時遇到了一些技術挑戰。

遇到的挑戰與解決方案

例如SQL組件的列表數據無法傳輸到下一個組件的問題。官方文檔顯示Apache DolphinScheduler支持SQL和Python參數傳遞,但在實際應用中,我們發現LIST數據類型是不可傳遞的。為瞭解決這個問題,團隊只能使用http的方式開發介面,把源數據同步到數據管理平臺。

file

file

file

對開源社區的展望

雖然由於時間緊急,我曾擱淺了改造源碼已實現對LIST數據類型的支持,但考慮到Apache DolphinScheduler未來在集團數字化轉型戰略中的重要作用,我還是提倡積极參与到Apache DolphinScheduler開源社區中,並且有一些建議給到社區。

據我觀察,在農牧行業中,組件之間進行數據傳輸的應用場景廣泛,像鐵騎力士這樣的大型傳統農牧企業,其實技術人員數量不多,大部分系統為外部採購二開,開發能力相對較弱,希望可以有像白鯨開源這樣的企業能夠提供專業的服務。

另外,從開發層面,希望開源社區能夠補齊數據傳輸管道的場景,有一個過濾器可以過濾掉所需的數據,存儲到具體的業務系統中。

file

當然,我鼓勵更多的開發者加入Apache DolphinScheduler社區,共同推動調度平臺的發展和創新。

結語

隨著數字化轉型的不斷深入,鐵騎力士集團將繼續探索和實踐新技術,以實現更高效、更智能的企業運營。Apache DolphinScheduler作為集團數字化轉型的重要工具,將繼續在這一過程中發揮關鍵作用。

本文由 白鯨開源 提供發佈支持!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 《數據資產管理核心技術與應用》是清華大學出版社出版的一本圖書,全書共分10章,第1章主要讓讀者認識數據資產,瞭解數據資產相關的基礎概念,以及數據資產的發展情況。第2~8章主要介紹大數據時代數據資產管理所涉及的核心技術,內容包括元數據的採集與存儲、數據血緣、數據質量、數據監控與告警、數據服務、數據許可權 ...
  • AntV團隊迅速將G6圖可視化引擎融入Awesome-Graphs項目,發佈1.2.0版本,提升交互體驗,包括路徑高亮、模糊搜索等功能,現邀請體驗並徵集改進意見。 ...
  • 在當今數字化的時代,數據已然成為企業決策與運營的關鍵要素。而保障數據的完整性、準確性以及及時性,對於企業的發展有著舉足輕重的意義。在數據運維管理範疇內,補數據屬於大數據開發和運維人員常用的運維操作手段。 周期補數據和定時補數據作為兩個相對特殊的補數據方式,在各類不同的場景中均發揮著至關重要的作用。 ...
  • GreatSQL 並行Load Data加快數據導入 資料庫信息 資料庫版本:GreatSQL 8.0.32-25 Clickhouse表需要導入到 GreatSQL 中,表數據量龐大所以選用導出CSV的方式。 測試數據復現操作 load data MySQL load data 語句能快速將一個文 ...
  • 1.資料庫結構優化 一個好的資料庫設計方案對於資料庫的性能往往會起到事半功倍的效果。優化設計需要考慮數據冗餘、查詢和更新的速度、欄位的數據類型是否合理等多方面的因素。 將欄位很多的表分解成多個表 概述:對於欄位較多的表,如果有些欄位的使用頻率很低,可以將這些欄位分離出來形成新表。這樣可以減少表的數據 ...
  • 指標是反映企業的各項核心業務活動、管理成效的數據體系,指標體系作為聯結業務邏輯與數據實體的關鍵橋梁,是構建高質量數據統計的基礎單元,併在量化業務績效和效果評估中扮演著核心角色。 為了更好地服務於客戶並提供切實可行的實踐指導,自4月24日起,袋鼠雲將推出全新《指標體系建設實戰》系列直播。該系列內容覆蓋 ...
  • 摘要:當多個引擎/節點同時訪問和修改數據時,如何保證數據在各個引擎/節點之間的一致性成為了一項挑戰。本文將深入探討MySQL集群在保持數據一致性的解決方案。 本文分享自華為雲社區《【華為雲MySQL技術專欄】MySQL 8.0事務提交原理解析!》,作者:GaussDB資料庫。 1. 概述 MySQL ...
  • Flink CDC 於 2021 年 11 月 15 日發佈了最新版本 2.1,該版本通過引入內置 Debezium 組件,增加了對 Oracle 的支持。 Flink下載地址 https://flink.apache.org/downloads/ 其他必需的jar包(cdc、jdbc、mysq和o ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...