Hive基本操作

来源:https://www.cnblogs.com/hackerer/archive/2019/08/13/11343502.html
-Advertisement-
Play Games

在hive命令終端直接導入文本數據: 查看特征: 通過LOAD命令直接將hadoop文件系統上的文件導入,不加LOCAL hive數據導入另外一種方法: ...


在hive命令終端直接導入文本數據:

hive> LOAD DATA LOCAL INPATH '/home/simon/hive_test/a.txt' OVERWRITE INTO TABLE w_a;

 

 查看特征:

hive> select A.usrid, A.age, B.time from w_a A join w_b B on A.usrid = B.usrid; 

通過LOAD命令直接將hadoop文件系統上的文件導入,不加LOCAL

hive> LOAD DATA INPATH '/user_name.data.utf.txt' OVERWRITE INTO TABLE u_info;

 

 hive數據導入另外一種方法:

hive> insert into table w_d select usrid, age from w_a limit 2;

 從Hive導出數據到local本地

hive> insert overwrite local directory '/home/badou/hive_test/data/1.txt' select usrid, age from w_a;

 

從Hive導出數據到HDFS上

hive> insert overwrite directory '/hive_data' select usrid, age from w_a;

 

利用partition導入,查詢數據

hive> load data local inpath '/home/badou/hive_test/p1.txt' into table p_t_2;                       
Copying data from file:/home/badou/hive_test/p1.txt
Copying file: file:/home/badou/hive_test/p1.txt
Loading data to table default.p_t_2
Table default.p_t_2 stats: [numFiles=1, numRows=0, totalSize=72, rawDataSize=0]
OK
Time taken: 0.41 seconds
hive> select * from p_t_2;
OK
user2   28      20170302
user4   30      20170302
user6   32      20170302
user8   34      20170302
Time taken: 0.081 seconds, Fetched: 4 row(s)
hive> select * from p_t_2 where dt='20170302';                               
Total jobs = 1
Launching Job 1 out of 1
Number of reduce tasks is set to 0 since there's no reduce operator
Starting Job = job_201908120758_0009, Tracking URL = http://master:50030/jobdetails.jsp?jobid=job_201908120758_0009
Kill Command = /usr/local/src/hadoop-1.2.1/libexec/../bin/hadoop job  -kill job_201908120758_0009
Hadoop job information for Stage-1: number of mappers: 1; number of reducers: 0
2019-08-14 20:36:11,750 Stage-1 map = 0%,  reduce = 0%
2019-08-14 20:36:20,899 Stage-1 map = 100%,  reduce = 0%, Cumulative CPU 2.98 sec
2019-08-14 20:36:26,020 Stage-1 map = 100%,  reduce = 100%, Cumulative CPU 2.98 sec
MapReduce Total cumulative CPU time: 2 seconds 980 msec
Ended Job = job_201908120758_0009
MapReduce Jobs Launched: 
Job 0: Map: 1   Cumulative CPU: 2.98 sec   HDFS Read: 283 HDFS Write: 72 SUCCESS
Total MapReduce CPU Time Spent: 2 seconds 980 msec
OK
user2   28      20170302
user4   30      20170302
user6   32      20170302
user8   34      20170302
Time taken: 21.554 seconds, Fetched: 4 row(s)
hive> 

 

創建UDF函數:

hive> create temporary function uppercase as 'com.badou.hive.udf.Uppercase';
OK
Time taken: 0.097 seconds

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 環境 CentOS: 7.x 下載 下載地址 :http://www.clamav.net/downloads,使用目前最新版本為:clamav 0.101.3 使用 wget 下載 安裝 1. 解壓 2. 安裝依賴 3. 編譯安裝 4. 添加用戶 配置 1. 創建日誌目錄和病毒庫目錄 2. 創建日 ...
  • Ubuntu系統中會存在多個 Python 的可執行二進位文件。一般Ubuntu預設的Python版本都為2.x, 如何改變Python的預設版本呢?下麵來一起看看吧。 你可以按照以下方法使用 ls 命令來查看你的系統中都有那些 Python 的二進位文件可供使用。 像我的有2.7、3、3.5版本 ...
  • 在linux的命令模式下使用ctrl組合鍵能讓操作更便捷。 ctrl + k : 剪切游標及其後邊的內容; ctrl + u : 剪切游標之前的內容; ctrl + y : 在游標處粘貼上兩個命令,粘貼方式和被剪切方式相同; ctrl + c : 結束正在運行的程式或命令; ctrl + d : 結... ...
  • 提到 Linux,作為程式員來說一定都不陌生。但如果說到「懂」Linux,可能就沒有那麼多人有把握了。到底用 Linux 離懂 Linux 有多遠?如果決定學習 Linux,應該怎麼開始?要學到什麼程度?懂一點 Linux,對於程式員有什麼價值?通過馬蜂窩內容中心高級研發總監李鴻的這次內部分享,你會 ...
  • 轉自:linux sed命令詳解 簡介 sed 是一種線上編輯器,它一次處理一行內容。處理時,把當前處理的行存儲在臨時緩衝區中,稱為“模式空間”(pattern space),接著用sed命令處理緩衝區中的內容,處理完成後,把緩衝區的內容送往屏幕。接著處理下一行,這樣不斷重覆,直到文件末尾。文件內容 ...
  • 日常開發中,我們經常需要在伺服器上進行各種文本,日誌的查看操作,本文主要對常用的文本,日誌查看技巧進行了一番總結和歸納,方便大家收藏起來後續查看使用: tail命令查看日誌信息 實時監控日誌: 實時監控10行日誌信息: 查看日誌尾部的最後100行日誌信息: 查看日誌100行之後的日誌信息: head ...
  • 又要寫周報???? 寫周報就算了每次都要改這一大堆的日期,什麼鬼嘛,最騷的我還總是有的忘記改。。。。 作為一個正兒八經的程式員,固定每周某天干重覆的一件事,哦~~ 這是機器人 程式應該做的事。 那得咋辦呢,excel 這麼強大的工具日期不在話下搞起來, 每周一都要寫周報,周報格式就是上面那鳥樣,每次 ...
  • 1、判斷/etc/inittab文件是否大於100行,如果大於,則顯示”/etc/inittab is a big file.”否者顯示”/etc/inittab is a small file.” #!/bin/bash a=`awk '{print NR}' /etc/inittab|tail ... ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...