MapReduce的輸入文件是兩個_ZenDei技術網路在線

MapReduce的輸入文件是兩個

-Advertisement-

[學習筆記] 1.對於MapReduce程式，如何輸入文件是兩個文件? 這一小節，我們將繼續第一章大數據入門的HelloWorld例子做進一步的研究。這裡，我們研究如何輸入文件是兩個文件。package com;import java.io.IOException;import java.util. ...

[學習筆記]

1.對於MapReduce程式，如何輸入文件是兩個文件?
這一小節，我們將繼續第一章大數據入門的HelloWorld例子做進一步的研究。這裡，我們研究如何輸入文件是兩個文件。
package com;
import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;
public class WordCountMark_to_win {
    public static class TokenizerMapper extends Mapper<Object, Text, Text, IntWritable> {
        private final static IntWritable one = new IntWritable(1);
        private Text word = new Text();
        public void map(Object key, Text value, Context context) throws IOException, InterruptedException {
            System.out.println("key is 馬克-to-win @ 馬克java社區：防盜版實名手機尾號：73203"+key.toString()+" value is "+value.toString());
            StringTokenizer itr = new StringTokenizer(value.toString());
            while (itr.hasMoreTokens()) {
                word.set(itr.nextToken());
                context.write(word, one);
            }
        }
    }

文章轉載自原文：https://blog.csdn.net/qq_44594249/article/details/96112498

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

Linux重器之 Vim 實用命令

Vim 常用的命令游標定位; hjkl 上下左右移動 0 $ 跳到行首或行尾 gg shift+G 跳到整個文件的開頭行或者結尾行 1G ,2G,3G........NG ,跳到第1.2.3 N 行開頭 /String(n N 可以迴圈的上一個下一個切換) 快速定位到某個有String 的行, ...
DLL：操作資料庫和表

1. 操作資料庫 C(Create 創建) R(Retrieve 查詢) U(Update 更新) D(Delete 刪除) (1) 查詢資料庫 1) 查詢所有資料庫名稱這裡有一個註意的東西，一個Database對應數據目錄中的一個實體文件夾，但是 information_schema 這個資料庫 ...
Rewrite基本概述

Rewrite基本概述什麼是rewrite Rewrite主要實現url地址重寫，以及重定向，就是把傳入的請求重定向到其他的過程。 rewrite使用場景 1、地址跳轉，用戶訪問www.drz.com這個URL是，將其定向至一個新的功能變數名稱mobile.drz.com 2、協議跳轉，用戶通過htt ...
Redis—簡介與安裝

Redis簡介 Redis安裝 Redis配置文件 Redis常用命令 ...
GFS（Google File System，谷歌文件系統）----（1）文件系統簡介

分散式文件系統系統是構建在普通的、廉價的機器上，因此故障是常態而不是意外系統希望存儲的是大量的大型文件（單個文件size很大）系統支持兩種類型讀操作：大量的順序讀取以及小規模的隨機讀取（large streaming reads and small random reads.）系統的寫操作主 ...
nginx——keepalived

nginx——keepalived 1.keepalived高可用基本概述什麼是高可用一般是指2台機器啟動著完全相同的業務系統，當有一臺機器down機了，另外一臺伺服器就能快速的接管，對於訪問的用戶是無感知的。高可用通常使用什麼軟體硬體使用F5 軟體使用keepalived keepalil ...
Centos7.0配置Hadoop2.7.0偽分散式

一、ssh免密登錄 1.命令ssh-keygen、 overwrite輸入y一路回車 2.將生成的密鑰發送到本機 ssh-copy-id localhost中間會詢問是否繼續輸入“yes” 3.測試免密登錄是否成功 ssh localhost 二、Java配置新建一個文件夾存放java和hadoo ...
Mysql—忘記密碼（重置密碼）

後補 ...