Windows7 Pro(64bit)で Hadoop2.4.0 Window Native を動かす。
以下をDownloadして使用します。
・Apache Hadoop 2.4.0 Source codes
・Windows 7 OS(64Bit)
・Microsoft Windows SDK v7.1(今回は、VS2010 Proを使用)
・Maven 3.2.1
・Protocol Buffers 2.5.0
・Cygwin64(今回は使用しない、ただしzip、tarファイルが解凍できるツールが必要です。(7-ZIPやLhaplus等))
tar、zipコマンドが必要の場合、インストールしてください。
・JDK 1.6 (JDK 1.7ではサンプル実行でエラーが発生)
1.Maven 3.2.1のインストール
http://maven.apache.org/download.cgiより、apache-maven-3.2.1-bin.zipをDownloadし展開する。
展開した、Mavenをc:\apache-maven-3.2.1に変更する。
2.Protocol Buffers のインストール
http://code.google.com/p/protobuf/downloads/listよりprotoc-2.5.0-win32.zipをDownloadし展開する。
3.JDK1.6をインストール
今回は、インストール先をc:\javaの下にインストールしました。JDKのインストールは他のHP等を参考にしてください。
4.Microsoft Windows SDK v7.1または VS2010 Proをインストールしてください。
5.PATH環境変数に追加
・c:\apache-maven-3.2.1\bin
・c:\protoc-2.5.0-win32
・c:\java\jdk1.6.0_45\bin
6.環境変数の追加
・JAVA_HOME= C:\java\jdk1.6.0_45
・M2_HOME= c:\apache-maven-3.2.1
・Platform=x64
8.Hadoop 2.4.0をDownloadした hadoop-2.4.0-src.tar.gz を展開してください。
hadoop-2.4.0-src.tar.gzをhttp://www.apache.org/dyn/closer.cgi/hadoop/common/よりDownloadしてください。
展開先は e:\deploy とします。
9.Hadoopのコンパイル
スタートメニュー - Microsoft Visual Studio 2010 - Visual Studio Tools - Visual Studio x64 in64 コマンドプロンプトを実行する。
> cd e:\deploy
> mvn package -Pdist,native-win -DskipTests
-Dtar を付けると、コンパイル完了時に、hadoop-2.4.0.tar.gzファイルが作成されます。今回は特に必要がないので指定していません。
10.Hadoopの環境設定
・e:\hadoopを作成
・コンパイルした E:\deploy\hadoop-dist\target\hadoop-2.4.0の全フォルダを e:\hadoop下に移動する。
11.環境変数の設定及び追加
・e:\hadoop\bin をPATHに追加
・HADOOP_HOME=e:\hadoop を環境変数を追加
12.Hadoopの設定
・e:\hadoop\etc\hadoop\core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
・e:\hadoop\etc\hadoop\hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/hadoop/data/dfs/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/hadoop/data/dfs/datanode</value>
</property>
</configuration>
・e:\hadoop\etc\hadoop\yarn-site.xml
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
<property>
<name>yarn.application.classpath</name>
<value>
%HADOOP_HOME%\\etc\\hadoop,
%HADOOP_HOME%\\share\\hadoop\\common\\*,
%HADOOP_HOME%\\share\\hadoop\\common\\lib\\*,
%HADOOP_HOME%\\share\\hadoop\\mapreduce\\*,
%HADOOP_HOME%\\share\\hadoop\\mapreduce\\lib\\*,
%HADOOP_HOME%\\share\\hadoop\\hdfs\\*,
%HADOOP_HOME%\\share\\hadoop\\hdfs\\lib\\*,
%HADOOP_HOME%\\share\\hadoop\\yarn\\*,
%HADOOP_HOME%\\share\\hadoop\\yarn\\lib\\*
</value>
</property>
</configuration>
・e:\hadoop\etc\hadoop\mapred-site.xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
13.HDFSの実行確認
> cd e:\hadoop\sbin
> start-dfs
エラーが出ていなければOKです。
14.YARNの実行確認
> cd e:\hadoop\sbin
> start-yarn
エラーが出ていなければOKです。
15.Resource Manager、Node ManagerとNodenameの確認
・Node Manager: http://localhost:8042/
・Namenode: http://localhost:50070
16.HDFS、YARNの停止
> cd e:\hadoop\sbin
> stop-dfs
> stop-yarn
次はサンプルの実行を確認します。
1.HDFS、YARNの実行
> cd e:\hadoop\sbin
> start-all
2.サンプル実行前に忘れずに実施しておくこと
(1)/tmp を作成
> hdfs dfs mkdir /tmp
> hdfs dfs chmod R 1777 /tmp
(2)/userを作成
> hdfs dfs mkdir /user
> hdfs dfs chmod R 1777 /user
(3)自分自身のユーザを作成
> hdfs dfs mkdir /user/hoge
> hdfs dfs chown hoge /user/hoge
3.データの準備
・e:\file1.txt
Install Hadoop
Run Hadoop Wordcount Mapreduce Example
4.サンプル WordCount の実行
> cd e:\hadoop
> hdfs dfs mkdir input
> hdfs dfs copyFromLocal e:\file1.txt input
> hdfs dfs ls input/file1.txt
-rw-r--r-- 1 skf skf 57 2014-06-04 09:10 input/file1.txt
> hdfs dfs cat input/file1.txt
Install Hadoop
Run Hadoop Wordcount Mapreduce Example
> hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.0.jar wordcount input output
5.サンプル WordCount の実行結果確認
参考URL
http://www.srccodes.com/p/article/38/build-install-configure-run-apache-hadoop-2.2.0-microsoft-windows-os
http://www.ne.jp/asahi/hishidama/home/tech/apache/hadoop/index.html