maiha · March 31, 2012 07:51 · hishidama · Mar 31, 2012 · hishidama · Mar 31, 2012
diff --git a/env b/env
 java-1.6.0-openjdk
 hadoop-1.0.1
 hbase-0.92.1

 OS: ubuntu-11.10
 input src: csv(1億行/22GB)
 disk rest: 77GB
 memory: 24GB (内12GBはramdiskで利用)
 io.compression.codecs: なし(無圧縮で利用)
diff --git a/hadoop:core-site.xml b/hadoop:core-site.xml
 <?xml version="1.0"?>
 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!-- Put site-specific property overrides in this file. -->

 <configuration>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/usr/local/lib/hadoop/tmp</value>
    <description>A base for other temporary directories.</description>
  </property>

  <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost:9000</value>
    <description>primary NameNode</description>
  </property>
 </configuration>
diff --git a/hadoop:hadoop-env.sh b/hadoop:hadoop-env.sh
 # 以下、変更点のみ記載
 export JAVA_HOME=/usr/lib/jvm/default-java
 export HADOOP_OPTS=-server
 export HADOOP_PID_DIR=/var/run/hadoop
diff --git a/hadoop:hdfs-site.xml b/hadoop:hdfs-site.xml
 <?xml version="1.0"?>
 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!-- Put site-specific property overrides in this file. -->

 <configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
    <description>localhost only</description>
  </property>
  <property>
    <name>dfs.permissions</name>
    <value>false</value>
  </property>
 </configuration>
diff --git a/hadoop:mapred-site.xml b/hadoop:mapred-site.xml
 <?xml version="1.0"?>
 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!-- Put site-specific property overrides in this file. -->

 <configuration>
  <property>
    <name>mapred.job.tracker</name>
    <value>localhost:9001</value>
    <description>JobTracker</description>
  </property>
 </configuration>
diff --git a/hadoopcore-site.xml b/hadoopcore-site.xml
 <?xml version="1.0"?>
 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!-- Put site-specific property overrides in this file. -->

 <configuration>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/usr/local/lib/hadoop/tmp</value>
    <description>A base for other temporary directories.</description>
  </property>

  <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost:9000</value>
    <description>primary NameNode</description>
  </property>
 </configuration>
diff --git a/hadoophadoop-env.sh b/hadoophadoop-env.sh
 # 以下、変更点のみ記載
 export JAVA_HOME=/usr/lib/jvm/default-java
 export HADOOP_OPTS=-server
 export HADOOP_PID_DIR=/var/run/hadoop
diff --git a/hadoophdfs-site.xml b/hadoophdfs-site.xml
 <?xml version="1.0"?>
 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!-- Put site-specific property overrides in this file. -->

 <configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
    <description>localhost only</description>
  </property>
  <property>
    <name>dfs.permissions</name>
    <value>false</value>
  </property>
 </configuration>
diff --git a/hadoopmapred-site.xml b/hadoopmapred-site.xml
 <?xml version="1.0"?>
 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

 <!-- Put site-specific property overrides in this file. -->

 <configuration>
  <property>
    <name>mapred.job.tracker</name>
    <value>localhost:9001</value>
    <description>JobTracker</description>
  </property>
 </configuration>
diff --git a/hbase:hbase-env.sh b/hbase:hbase-env.sh
 # 追加分のみ
 export JAVA_HOME=/usr/lib/jvm/default-java
diff --git a/hbase:hbase-site.xml b/hbase:hbase-site.xml
 <configuration>
  <property>
    <name>hbase.rootdir</name>
    <value>file:///usr/local/lib/hbase/data</value>
  </property>
 </configuration>
diff --git a/hbasehbase-env.sh b/hbasehbase-env.sh
 # 追加分のみ
 export JAVA_HOME=/usr/lib/jvm/default-java
diff --git a/hbasehbase-site.xml b/hbasehbase-site.xml
 <configuration>
  <property>
    <name>hbase.rootdir</name>
    <value>file:///usr/local/lib/hbase/data</value>
  </property>
 </configuration>
diff --git a/importtsv.bulk.output.log b/importtsv.bulk.output.log
 12/03/31 15:29:54 INFO mapred.JobClient:  map 100% reduce 10%
 12/03/31 15:30:17 INFO mapred.JobClient: Task Id : attempt_201203310137_0010_r_000000_2, Status : FAILED
 java.io.IOException: Task: attempt_201203310137_0010_r_000000_2 - The reduce copier failed
        at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:389)
        at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
        at java.security.AccessController.doPrivileged(Native Method)
        at javax.security.auth.Subject.doAs(Subject.java:416)
        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1093)
        at org.apache.hadoop.mapred.Child.main(Child.java:249)
 Caused by: org.apache.hadoop.util.DiskChecker$DiskErrorException: Could not find any valid local directo\
 ry for file:/usr/local/lib/hadoop/tmp/mapred/local/taskTracker/maiha/jobcache/job_201203310137_0010/atte\
 mpt_201203310137_0010_r_000000_2/output/map_105.out
        at org.apache.hadoop.fs.LocalDirAllocator$AllocatorPerContext.getLocalPathForWrite(LocalDirAlloc\
 ator.java:381)
        at org.apache.hadoop.fs.LocalDirAllocator.getLocalPathForWrite(LocalDirAllocator.java:146)
        at org.apache.hadoop.fs.LocalDirAllocator.getLocalPathForWrite(LocalDirAllocator.java:127)
        at org.apache.hadoop.mapred.ReduceTask$ReduceCopier$LocalFSMerger.run(ReduceTask.java:2639)

 attempt_201203310137_0010_r_000000_2: log4j:WARN No appenders could be found for logger (org.apache.hado\
 op.mapred.ReduceTask).
 attempt_201203310137_0010_r_000000_2: log4j:WARN Please initialize the log4j system properly.
 12/03/31 15:30:19 INFO mapred.JobClient:  map 100% reduce 0%
	java-1.6.0-openjdk
	hadoop-1.0.1
	hbase-0.92.1

	OS: ubuntu-11.10
	input src: csv(1億行/22GB)
	disk rest: 77GB
	memory: 24GB (内12GBはramdiskで利用)
	io.compression.codecs: なし(無圧縮で利用)
	<?xml version="1.0"?>
	<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

	<!-- Put site-specific property overrides in this file. -->

	<configuration>
	<property>
	<name>hadoop.tmp.dir</name>
	<value>/usr/local/lib/hadoop/tmp</value>
	<description>A base for other temporary directories.</description>
	</property>

	<property>
	<name>fs.default.name</name>
	<value>hdfs://localhost:9000</value>
	<description>primary NameNode</description>
	</property>
	</configuration>
	# 以下、変更点のみ記載
	export JAVA_HOME=/usr/lib/jvm/default-java
	export HADOOP_OPTS=-server
	export HADOOP_PID_DIR=/var/run/hadoop
	<configuration>
	<property>
	<name>hbase.rootdir</name>
	<value>file:///usr/local/lib/hbase/data</value>
	</property>
	</configuration>
	12/03/31 15:29:54 INFO mapred.JobClient: map 100% reduce 10%
	12/03/31 15:30:17 INFO mapred.JobClient: Task Id : attempt_201203310137_0010_r_000000_2, Status : FAILED
	java.io.IOException: Task: attempt_201203310137_0010_r_000000_2 - The reduce copier failed
	at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:389)
	at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
	at java.security.AccessController.doPrivileged(Native Method)
	at javax.security.auth.Subject.doAs(Subject.java:416)
	at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1093)
	at org.apache.hadoop.mapred.Child.main(Child.java:249)
	Caused by: org.apache.hadoop.util.DiskChecker$DiskErrorException: Could not find any valid local directo\
	ry for file:/usr/local/lib/hadoop/tmp/mapred/local/taskTracker/maiha/jobcache/job_201203310137_0010/atte\
	mpt_201203310137_0010_r_000000_2/output/map_105.out
	at org.apache.hadoop.fs.LocalDirAllocator$AllocatorPerContext.getLocalPathForWrite(LocalDirAlloc\
	ator.java:381)
	at org.apache.hadoop.fs.LocalDirAllocator.getLocalPathForWrite(LocalDirAllocator.java:146)
	at org.apache.hadoop.fs.LocalDirAllocator.getLocalPathForWrite(LocalDirAllocator.java:127)
	at org.apache.hadoop.mapred.ReduceTask$ReduceCopier$LocalFSMerger.run(ReduceTask.java:2639)

	attempt_201203310137_0010_r_000000_2: log4j:WARN No appenders could be found for logger (org.apache.hado\
	op.mapred.ReduceTask).
	attempt_201203310137_0010_r_000000_2: log4j:WARN Please initialize the log4j system properly.
	12/03/31 15:30:19 INFO mapred.JobClient: map 100% reduce 0%