在平時和開發者們交流的過程中,發現許多開發朋友尤其是新入門 [Taier](https://github.com/DTStack/Taier) 的開發者,對於本地調試都有著諸多的不理解和問題。本文就大家平時問的最多的三個問題,服務編譯,配置&本地運行,如何在 Taier 運行 [Flink-stan ...
都在說數據已經成為新時代的生產資料。
但隨著大數據和人工智慧等技術的發展,即便人們都知道數據的價值日益凸顯,卻無法憑藉一己之力獲取和分析如此大規模的數據。
要想富,先修路。要想利用新時代的數據致富,也必須要有趁手的工具。只有合適的工具才能完成大規模數據的採集、清洗、存儲、處理和可視化等各個環節。只有具備這樣的工具,才能更好地利用數據來推動經濟社會發展,併為人類創造更多的價值。
現如今,免費的,螞蟻集團圖計算團隊開源的超大規模流圖處理系統——TuGraph-Analytics。正成為一款專註於圖計算領域的開源數據處理工具。我們從一個簡單的問題開始,讓你體會TuGraph-Analytics的強大之處。
“誰在以太坊的區塊鏈上進行迴圈交易?”
如何回答這個問題?
大數據領域的同學可能會立即舉手,Kafka給我上,Flink給我上,實在不行Spark... 這些系統在處理大規模數據時,工作流程通常非常長,開發效率較低,無法迅速地響應用戶的需求。各有各的長處,各有各的毛病。因此,我們需要尋找全新的數據分析工具,以提高大數據領域的工作效率,並更好地應對日益複雜和多變的數據處理挑戰。
新的工具?那麼試試GPT?
Q:誰在以太坊的區塊鏈上進行迴圈交易?
GPT:這個問題需要進行數據分析,涉及到大量的以太坊交易數據。如果要確定誰在以太坊的區塊鏈上進行迴圈交易,可以通過以下步驟:
獲取以太坊的交易數據,包括交易哈希、發送方地址、接收方地址、交易類型和交易金額等信息。
對交易數據進行清洗和處理,去掉無效數據和重覆數據等。
利用圖計算等技術,構建以太坊交易網路,並對交易網路進行分析,識別出交易中的迴圈交易。
進一步分析迴圈交易的發送方地址和接收方地址,識別出誰在以太坊的區塊鏈上進行迴圈交易。
需要註意的是,由於以太坊區塊鏈的去中心化特性,交易數據的獲取和分析可能存在一定的難度和挑戰。
姿勢不對,再來一次。
Q:誰在以太坊的區塊鏈上進行迴圈交易?一句話回答
GPT:無法通過一句話回答,需要進行數據分析。
可見,雖然GPT等人工智慧在自然語言處理和圖像識別等方面已經取得了顯著進展,但在數據洞察方面仍然存在挑戰。因為數據洞察往往需要結合具體的業務背景和領域知識,而這些人類經驗和智慧難以完全被機器模擬和替代。此外,在數據清洗、數據預處理、特征提取和建模等關鍵步驟上,仍需要人類專家進行干預和優化。
今天,我們使用開源的TuGraph-Analytics與流式消息系統Kafka,不僅能夠很好回答誰在以太坊的區塊鏈上進行迴圈交易,而且能夠搭建秒級實時的金融級解決方案,客官且看----
何為迴圈交易?
來看這個例子
圖中有7個不同顏色的點代表交易賬戶,每個賬戶對應以太坊上的一個錢包地址。一個賬戶轉出到另一個賬戶的過程,表示為圖中有方向的邊,這個圖中共有8筆交易構成一個交易網路。
將交易頭尾相連,能夠找到返回起點的迴圈,就可以視為迴圈交易。
迴圈交易通常是指通過多個交易步驟,從而實現利用價格差異來獲取利潤的一種交易方式。其過程包括在不同的市場或不同的時間段內進行買賣行為,從而獲得利潤。在交易網路圖中,可以使用環路檢測演算法來發現潛在的迴圈交易路徑,並檢索這條路徑上的賬戶就能夠知道哪些賬戶可能參與了迴圈交易。
可是,當一筆新的交易發生時——
可見,環路檢測並不是一勞永逸的靜態圖演算法。隨著消息實時不斷到來,交易網路圖中的最新環路不斷發生變化。如果關心每一筆交易產生的交易環路,這將成為一個極其複雜的問題。
以太坊是基於區塊鏈技術的智能合約平臺,其交易速度取決於眾多的參與者。交易成交速度通常在15秒到1分鐘之間,交易吞吐量可以達到每秒數十到數百筆交易。但別忘了,以太坊還有海量的歷史交易數據,相當於存在一個相當複雜的”底圖“,迴圈交易問題不僅需要考慮新的交易,還必須綜合分析歷史上所有的交易!
這就是為什麼強如GPT也無法一句話回答這個問題的原因。
那麼真的能夠在每筆交易發生時實時地檢測迴圈交易的產生嗎?
實際上,使用專業的圖計算系統TuGraph-Analytics,這個問題只需要幾十行代碼即可解決,還能夠迅速結合Kafka搭建起交易聽單->交易網路生成->實時迴圈交易檢出->給下游發送消息完整的金融級實時解決方案。更關鍵的是,這一切都是免費的~ 感謝開源!
我們在TuGraph-Analytics新建一個圖計算作業,只需大約40行代碼,即可完成整個端到端流程。
代碼描述如下,需要自取。
在這短短40行中,我們創建了以太坊交易的整個底圖,命名為ethereum_transaction_network。把來自Kafka的實時交易流table_new_trade不斷添加到命名為ethereum_transaction_network的圖中。
接下來,每當有新的交易到達的時刻,都將觸發一次3跳迴圈交易模式的檢查,把更新的結果存入位於Kafka的外部表tbl_circular_trade,可以很方便地分發給下游組件。
實時交易數據我們採用了XBlock-ETH: Extracting and exploring blockchain data from Ethereum這篇論文整理的真實的以太坊區塊數據,在這個Demo中把以太坊地址隱去,以一個數字替代,即每個數字代表以太坊的一個錢包地址,相同的數字表示相同的地址。生成的迴圈路徑結果我們拼接成一個字元串,方便觀察。
set geaflow.dsl.window.size = 200;
-- 以太坊交易的底圖
CREATE GRAPH IF NOT EXISTS ethereum_transaction_network (
Vertex address (id bigint ID),
Edge trade (srcId bigint SOURCE ID, targetId bigint DESTINATION ID, mount double)
) WITH (
storeType='rocksdb'
);
-- 從Kafka監聽最新的交易
CREATE TABLE IF NOT EXISTS table_new_trade (
srcId bigint, targetId bigint, mount double
) WITH (
type='kafka',
geaflow.dsl.kafka.servers = '{your.kafka.server.ip}:9092',
geaflow.dsl.kafka.topic = 'tbl-trade'
);
-- 將新的交易添加到底圖
INSERT INTO ethereum_transaction_network.address SELECT srcId FROM table_new_trade;
INSERT INTO ethereum_transaction_network.address SELECT targetId FROM table_new_trade;
INSERT INTO ethereum_transaction_network.trade SELECT srcId, targetId, mount FROM table_new_trade;
-- 一張外部表連接Kafka以輸出檢出的迴圈交易結果
CREATE TABLE IF NOT EXISTS tbl_circular_trade (
circular VARCHAR
) WITH (
type='kafka',
geaflow.dsl.kafka.servers = '{your.kafka.server.ip}:9092',
geaflow.dsl.kafka.topic = 'tbl-circular-trade'
);
-- 使用以太坊交易圖進行實時查詢
USE GRAPH ethereum_transaction_network;
-- 查詢3跳迴圈交易模式存入位於Kafka的外部表
INSERT INTO tbl_circular_trade
MATCH (v1)-[:trade]->(v2)-[:trade]->(v3)-[:trade]->(v4)
WHERE v1.id = v4.id AND v1.id != v2.id AND v1.id != v3.id AND v2.id != v3.id
RETURN concat(CAST(v1.id as VARCHAR), '->', CAST(v2.id as VARCHAR),
'->', CAST(v3.id as VARCHAR), '->', CAST(v4.id as VARCHAR)) AS circular
;
實機演示!
打開一個Kafka Producer,產生消息流,將交易不斷發送給Kafka,如左側終端視窗所示。平均1秒左右,最新的圖中迴圈交易檢出結果就列印在右側的Kafka Consumer視窗中。
當添加一些新的交易日誌時,右側的Kafka Consumer視窗中也實時更新了新的迴圈交易檢出結果,響應十分迅速。
以上便是開源圖計算平臺TuGraph Analytics結合Kafka,快速搭建的以太坊迴圈交易檢出解決方案。雖然這隻是一個小小的demo,但實機演示中強大的圖計算語法和系統性能可見一斑,大大較低了我們普通人搭建圖計算應用的難度和成本。
說多不如現在開始行動,TuGraph Analytics是你不容錯過的利器。現在就趕快訪問https://github.com/TuGraph-family/tugraph-analytics,親自體驗TuGraph Analytics的魅力吧!此外,我們歡迎各位參與到開源貢獻中來,為社區貢獻自己的智慧和代碼,共同促進國產圖計算系統的發展。
[參考文獻]
P. Zheng, Z. Zheng, J. Wu, and H.-N. Dai, “XBlock-ETH: Extracting and exploring blockchain data from Ethereum,” IEEE Open J. Comput. Soc., vol. 1, pp. 95–106, May 2020, doi: 10.1109/OJCS.2020.2990458.