hadoop日常維護之問題解決01_ZenDei技術網路在線

hadoop日常維護之問題解決01

-Advertisement-

執行hadoop任務遇到的問題： Caused by: org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /user/hive/warehouse/rec_new2.db/user_session/.hive-stagi ...

執行hadoop任務遇到的問題：

Caused by: org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /user/hive/warehouse/rec_new2.db/user_session/.hive-staging_hive_2017-12-10_08-22-41_311_4339813855157373054-1/-ext-10000/_temporary/0/_temporary/attempt_20171210082241_0000_m_000000_3/appid=10017/dt=2017-12-09/part-00000 could only be replicated to 0 nodes instead of minReplication (=1). There are 3 datanode(s) running and no node(s) are excluded in this operation

當時遇到無論是hive向hadoop寫入數據還是spark、storm寫入數據都報以上錯誤：

一開始網上各種找，冷靜下仔細看hadoop運行日誌信息，

日誌查看：

$HADOOP_HOME/logs

通過在master節點查看，tail –f hadoop-root-namenode-hadoop-master.log 監聽namenode運行日誌信息，發現問題所在：

原來在hadoop配置文件中，預留磁碟大小為20G，通過df -hl 命令查看磁碟空間大小，發現hadoop-slave3 磁碟空間只剩17G，導致數據無法插入；

解決方案：增大磁碟空間或刪除較大文件，達到配置預留磁碟空間即可；

由於spark配置的是standalone模式，導致每執行一個spark任務，運行日誌中都會有一個運行任務所需jar包；累積下來占用磁碟空間；可定期刪除，也可以配置spark-env.sh 每執行完後直接刪除運行日誌信息及jar包；

spark運行任務查看運行日誌信息及jar包所在位置：$SPARK_HOME/work

運行完直接刪除運行日誌信息及jar包，在spark-env.sh中加入如下內容：

SPARK_WORKER_OPTS=”-Dspark.worker.cleanup.enabled=true”

註意官方文檔中說不管程式是否已經停止，都會刪除文件夾，這是不准確的，只有停止掉的程式文件夾才會被刪除

附：

Hdfs-site.xml:

可以通過配置，修改配置只需停掉集群重啟即可：

$HADOOP_HOME/conf/hdfs-site.xml 文件里的 dfs.datanode.du.reserved 屬性來配置HDFS預留磁碟的空間大小，從而限制 data node 的磁碟使用量（單位是位元組數），如以下配置會給磁碟預留20GB的空間：

<name>dfs.datanode.du.reserved</name>

<description>Reserved space in bytes per volume. Always leave this much space free for non dfs use.

</description>

</property>

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

使用VMware安裝linux虛擬機以及相關配置

前言使用VMware安裝虛擬機這個一般都知道，操作簡單。而本文主要講使用虛擬機的後續相關配置。並記錄使用過程中遇到的問題以及一些技巧。本篇文章以後回持續更新的。。。安裝包准備 VM:12 Linux:CentOS 7.0 百度雲盤: 鏈接：https://pan.baidu.com/s/1geE ...
win10連接外接滑鼠怎麼禁用觸摸板

Win10筆記本如何禁用觸摸板呢？Win10筆記本如何設置“插入滑鼠自動禁止觸摸板功能”呢？雖然筆記本觸摸板在一定程度上可以方便我們的操作，但是在以滑鼠和鍵盤做為重要的輸入設備的情況下，筆記本觸摸板有時由於觸摸、誤按等操作，導致造成一些不必要的後果。對此我們可以通過以下方法實現筆記本觸摸板的禁用 ...
你不得不瞭解的應用容器引擎---Docker

最近突然想搭一個redis集群玩玩，因為公司的電腦同時開2個虛擬機就卡的不行，所以我就想到用Docker開啟多個redis-server來搭建。然後在網上找著找著發現，使用Docker，哪需要搭建啊，直接Docker pull一個鏡像就OK了。加上之前使用Docker，五分鐘搭建一個類似github ...
SQL Server 2017 安裝過程中的一點說明（有點意思）

會提到：“安裝程式無法與下載伺服器聯繫。請提供 Microsoft 機器學習伺服器安裝文件的位置，然後單擊“下一步”。可從以下位置下載安裝文件” 的解決方案安裝過程和2016大體一致，機器學習這款更完善了。（其他錯誤看看往期的解決吧：http://www.cnblogs.com/dunitian/ ...
SQL Server 全文搜索

SQL Server 的全文搜索(Full-Text Search）是基於分詞的文本檢索功能，依賴於全文索引。全文索引不同於傳統的平衡樹（B-Tree）索引和列存儲索引，它是由數據表構成的，稱作倒轉索引（Invert Index），存儲分詞和行的唯一鍵的映射關係。倒轉索引是在創建全文索引或更新全文索 ...
MapReduce多種join實現實例分析（一）

一、概述對於RDBMS中的join操作大伙一定非常熟悉，寫sql的時候要十分註意細節，稍有差池就會耗時巨久造成很大的性能瓶頸，而在Hadoop中使用MapReduce框架進行join的操作時同樣耗時，但是由於hadoop的分散式設計理念的特殊性，因此對於這種join操作同樣也具備了一定的特殊性。本 ...
源碼中的哲學——通過構建者模式創建SparkSession

spark2.2在使用的時候使用的是SparkSession，這個SparkSession創建的時候很明顯的使用了創建者模式。通過觀察源代碼，簡單的模擬了下，可以當作以後編碼風格的參考：官方使用自己寫的小例子，模擬一下：很好的風格！可以得到輸出: ...
Mysql----關於內聯，左聯，右聯，全聯的使用和理解

準備工作：新建兩張表表一：student 填充內容：編號，姓名，班級表二：school 填充內容：編號，班級，專業這兩張表建好了，意為班級選課表，兩張表沒有任何主外鍵的關係，下麵進行內聯，左聯，右聯，全聯的實驗一，內聯接. 關鍵字：INNER JOIN 語法：SELECT * from 表 ...