JDBC Vertica Source Connector 使用文檔

-Advertisement-

![file](https://img2023.cnblogs.com/other/2685289/202308/2685289-20230818105027807-1763988259.jpg) ## 支持以下引擎 * Spark * Flink * SeaTunnel Zeta ## 關鍵特性 ...

file

支持以下引擎

Spark
Flink
SeaTunnel Zeta

關鍵特性

批處理
精確一次性處理
列投影
並行處理
支持用戶自定義拆分
支持查詢 SQL 並實現投影效果

描述

通過 JDBC 讀取外部數據源數據。

支持的數據源信息

Datasource	Supported versions	Driver	Url	Maven
Vertica	Different dependency version has different driver class.	com.vertica.jdbc.Driver	jdbc:vertica://localhost:5433/vertica	Download

資料庫依賴

請下載與 'Maven' 對應的支持列表，並將其複製到 '$SEATNUNNEL_HOME/plugins/jdbc/lib/' 工作目錄中

例如，Vertica 數據源：cp vertica-jdbc-xxx.jar $SEATNUNNEL_HOME/plugins/jdbc/lib/

數據類型映射

Vertical Data type	SeaTunnel Data type
BIT	BOOLEAN
TINYINT TINYINT UNSIGNED SMALLINT SMALLINT UNSIGNED MEDIUMINT MEDIUMINT UNSIGNED INT INTEGER YEAR	INT
INT UNSIGNED INTEGER UNSIGNED BIGINT	LONG
BIGINT UNSIGNED	DECIMAL(20,0)
DECIMAL(x,y)(Get the designated column's specified column size.<38)	DECIMAL(x,y)
DECIMAL(x,y)(Get the designated column's specified column size.>38)	DECIMAL(38,18)
DECIMAL UNSIGNED	DECIMAL((Get the designated column's specified column size)+1, (Gets the designated column's number of digits to right of the decimal point.)))
FLOAT FLOAT UNSIGNED	FLOAT
DOUBLE DOUBLE UNSIGNED	DOUBLE
CHAR VARCHAR TINYTEXT MEDIUMTEXT TEXT LONGTEXT JSON	STRING
DATE	DATE
TIME	TIME
DATETIME TIMESTAMP	TIMESTAMP
TINYBLOB MEDIUMBLOB BLOB LONGBLOB BINARY VARBINAR BIT(n)	BYTES
GEOMETRY UNKNOWN	Not supported yet

源選項

Name	Type	Required	Default	Description
url	String	Yes	-	The URL of the JDBC connection. Refer to a case: jdbc:vertica://localhost:5433/vertica
driver	String	Yes	-	The jdbc class name used to connect to the remote data source, if you use Vertica the value is `com.vertica.jdbc.Driver`.
user	String	No	-	Connection instance user name
password	String	No	-	Connection instance password
query	String	Yes	-	Query statement
connection_check_timeout_sec	Int	No	30	The time in seconds to wait for the database operation used to validate the connection to complete
partition_column	String	No	-	The column name for parallelism's partition, only support numeric type,Only support numeric type primary key, and only can config one column.
partition_lower_bound	Long	No	-	The partition_column min value for scan, if not set SeaTunnel will query database get min value.
partition_upper_bound	Long	No	-	The partition_column max value for scan, if not set SeaTunnel will query database get max value.
partition_num	Int	No	job parallelism	The number of partition count, only support positive integer. default value is job parallelism
fetch_size	Int	No	0	For queries that return a large number of objects,you can configure the row fetch size used in the query toimprove performance by reducing the number database hits required to satisfy the selection criteria. Zero means use jdbc default value.
common-options		No	-	Source plugin common parameters, please refer to Source Common Options for details

提示

如果未設置 partition_column，則會在單一併發中運行；如果設置了 partition_column，則將根據任務的併發性進行並行執行。

任務示例

簡單示例：

此示例在單一併行中查詢您的測試“資料庫”中的 type_bin 'table' 16 個數據，並查詢其所有欄位。您還可以指定要查詢的欄位，以便將最終輸出顯示在控制臺上。

env {

您可以在此處設置 Flink 配置
execution.parallelism = 2
job.mode = "BATCH"
}
source{
Jdbc {
url = "jdbc:vertica://localhost:5433/vertica"
driver = "com.vertica.jdbc.Driver"
connection_check_timeout_sec = 100
user = "root"
password = "123456"
query = "select * from type_bin limit 16"
}
}

transform {
# 如果您想獲取有關如何配置 seatunnel 的更多信息，並查看完整的轉換插件列表，
# 請訪問 https://seatunnel.apache.org/docs/transform-v2/sql
}

sink {
Console {}
}

並行示例：

並行讀取您的查詢表，使用您配置的 shard 欄位和 shard 數據。如果要讀取整個表，可以這樣做。

source {
Jdbc {
url = "jdbc:vertica://localhost:5433/vertica"
driver = "com.vertica.jdbc.Driver"
connection_check_timeout_sec = 100
user = "root"
password = "123456"
# 根據需要定義查詢邏輯
query = "select * from type_bin"
# 並行分片讀取欄位
partition_column = "id"
# 片段數量
partition_num = 10
}
}

並行邊界示例：

根據查詢的上限和下限指定數據更加高效，根據您配置的上限和下限來讀取數據源更加高效
source {
Jdbc {
url = "jdbc:vertica://localhost:5433/vertica"
driver = "com.vertica.jdbc.Driver"
connection_check_timeout_sec = 100
user = "root"
password = "123456"
# 根據需要定義查詢邏輯
query = "select * from type_bin"
partition_column = "id"
# 讀取起始邊界
partition_lower_bound = 1
# 讀取結束邊界
partition_upper_bound = 500
partition_num = 10
}
}

本文由白鯨開源提供發佈支持！

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Unity 編輯器資源導入處理函數 OnPreprocessTexture：深入解析與實用案例

# Unity 編輯器資源導入處理函數 OnPreprocessTexture 用法 [![https://github.com/AlianBlank/download.unity.com](https://img2023.cnblogs.com/other/406187/202308/406187 ...
關於 STM32 在使用 C++ 進行編程時無法進行中斷（觸發中斷就死迴圈）的問題

他媽的！！！就因為這破事導致我浪費了兩天的時間！！！都是基礎不扎實的鍋，導致我沒能第一時間想到問題的關鍵好了，平復一下心情，快速的寫一篇博客來記錄這個叼問題 ## 解決方法先把結論放在這裡：用`extern "C" {}`把中斷函數包起來 ```C++ // 就像這樣 extern "C" { ...
ansible入門指南 - 安裝與簡單使用

ansible 是用來自動化管理遠程操作系統的工具. ansible的三要素: `控制節點` , `被控節點`, `資產清單` ### 安裝 ansible 可以通過pip直接安裝 ```bash python3 -m pip install ansible --user ``` ### 快速入門 ...
ubuntu製作chroot系統鏡像

這裡的使用場景是在ubuntu x64上編譯arm程式，需要一個開發環境，而最省心的方式就是自己做一個arm環境的chroot鏡像，然後自由用apt-get安裝依賴，然後編譯程式。所以這裡就以製作arm鏡像為例。在我們開始之前，我們需要瞭解一下ARM的幾種架構： armel（abi）：這個是老架構 ...
Ansible的安裝及簡單使用

## Ansible的安裝及簡單使用 ## #### 一.Ubuntu安裝Ansible ```shell sudo apt update sudo apt install ansible #使用以下命令檢查安裝是否成功： ansible --version ``` ![image-20230817 ...
CentOS7.9中的Glibc2.17源碼編譯升級到Glibc2.31

# 一、準備工作 ## 1、配置yum阿裡鏡像源 * 查看yum當前配置的倉庫，如果yum配置的不是阿裡雲源，請配置阿裡雲源。 ```shell yum repolist all ``` * 驗證是否能ping通阿裡雲 ```shell # 如果不能ping通可能是DNS沒有配置 ping mirr ...
手把手帶你玩轉HetuEngine：資源規劃與數據源對接

本文分享自華為雲社區《【手把手帶你玩轉HetuEngine】（三）HetuEngine資源規劃》，作者： HetuEngine九級代言。 HetuEngine支持在服務層角色實例和計算實例兩個維度進行資源規劃，並且支持在高併發場景下通過啟動多個計算實例進行負載分擔和均衡，從而滿足各種業務場景下的資 ...
手把手教你做 Redis 雙向數據同步

本文主要介紹如何使用 CloudCanal 構建生產級穩定性的 Redis 雙向數據同步，具備版本相容全面、功能細節豐富自然等特點。 ...