hunj · June 25, 2015 00:59 · imjching · Jun 25, 2015
diff --git a/path_stripper.rb b/path_stripper.rb
 def path_strip(input_file, domain, output_file)
  raise "domain must be string form" unless domain.is_a? String
  raise "invalid input file name" unless input_file.is_a? String
  raise "invalid output file name" unless output_file.is_a? String

  file = File.open(input_file, "r")
  data = file.read
  file.close
  data_lines = data.lines
  cleared_arr = []

  result_file = File.open(output_file, "w")

  num = 0
  data_lines.each do |line|
    if line =~ /<loc>http:\/\/#{Regexp.quote(domain)}\/.*<\/loc>/
      num += 1
      result_file.puts "link_#{num},#{line[5..-8].sub("http://#{domain}/", '')}"
    end
  end
  result_file.close
  p num
 end

 # example:
 path_strip "./sitemap.xml", "hunj.github.io", "./result.csv"
	def path_strip(input_file, domain, output_file)
	raise "domain must be string form" unless domain.is_a? String
	raise "invalid input file name" unless input_file.is_a? String
	raise "invalid output file name" unless output_file.is_a? String

	file = File.open(input_file, "r")
	data = file.read
	file.close
	data_lines = data.lines
	cleared_arr = []

	result_file = File.open(output_file, "w")

	num = 0
	data_lines.each do \|line\|
	if line =~ /<loc>http:\/\/#{Regexp.quote(domain)}\/.*<\/loc>/
	num += 1
	result_file.puts "link_#{num},#{line[5..-8].sub("http://#{domain}/", '')}"
	end
	end
	result_file.close
	p num
	end

	# example:
	path_strip "./sitemap.xml", "hunj.github.io", "./result.csv"