Oozie Sqoop Action 配置 Sqoop Action 用來運行sqoop 任務,流程任務必須等當前節點的sqoop任務執行完成之後才能執行後續節點任務。Email Action 所有的節點值都可以使用EL表達式運行Sqoop Job,必須在 sqoop action裡面配置 job- ...
Oozie Sqoop Action 配置
- Sqoop Action 用來運行sqoop 任務,流程任務必須等當前節點的sqoop任務執行完成之後才能執行後續節點任務。
- Email Action 所有的節點值都可以使用EL表達式
- 運行Sqoop Job,必須在 sqoop action裡面配置 job-tracer,name-node,Sqoop command,也許還需要一些參數和配置。
- 同Shell Action一樣 Sqoop Action 可以配置成創建或者刪除HDFS目錄之後再去執行一個Sqoop任務
- Sqoop 應用的配置可以使用job-xml文件中的元素,也可以使用內部元素來配置,像EL表達式也支持在內部元素中的配置,內部元素的配置可以覆蓋外部文件中的配置,內部元素配置不能使用 Hadoop mapred.job.tracker and fs.default.name這兩個屬性
- 跟mr任務一樣,在Shell任務中也可以使用文件和附件具體參見【http://archive.cloudera.com/cdh/3/oozie/WorkflowFunctionalSpec.html#a3.2.2.1_Adding_Files_and_Archives_for_the_Job】
Sqoop Action格式
- prepare 元素 如果存在,表明在執行sqoop 命令之前需要執行的一系列 hdfs路徑的創建和刪除操作,並且路徑必須以 hdfs://HOST:PORT 開頭
- job-xml 元素 如果存在,則作為sqoop任務的配置文件,從 schema 0.3開始支持多個job-xml元素用來支持多個job.xml文件
- configuration 用來給sqoop任務傳遞參數
- sqoop 命令可以通過command元素或者多個arg元素指定
- 當使用command的時候,oozie會根據空格把命令切分成多個參數
- 當使用arg的時候,oozie將會把arg裡面的值當成參數傳遞給sqoop
- 當一個參數裡面有空格的時候,必須用arg來指定
- 上述所有的元素值都可以使用EL表達式配置