pi0 · February 27, 2020 14:16
diff --git a/clean.js b/clean.js
 const fs = require('fs')
 const parse = require('wtf_wikipedia')
 const readline = require('readline')

 const rl = readline.createInterface({
  input: process.stdin,
  output: process.stdout,
  terminal: false
 })

 const fd = fs.openSync('out.txt', 'w+')
 process.on('exit', () => { fs.closeSync(fd) })

 const startrChars = '-*{}[]#!@%^&<>|'.split('')

 rl.on('line', line => {
  line = line.trim()
  if (!line.length) { return }
  if (startrChars.includes(line[0])) { return }
  try {
    const parsed = parse(line)
    const text = parsed.text().trim()
    if (!text.length) { return }
    fs.writeSync(fd, text + '\n')
  } catch (e) {
    console.log(line)
    console.log('Error while parsing: ' + e)
  }
 })


diff --git a/WikipediaDump.md b/WikipediaDump.md
	const fs = require('fs')
	const parse = require('wtf_wikipedia')
	const readline = require('readline')

	const rl = readline.createInterface({
	input: process.stdin,
	output: process.stdout,
	terminal: false
	})

	const fd = fs.openSync('out.txt', 'w+')
	process.on('exit', () => { fs.closeSync(fd) })

	const startrChars = '-*{}[]#!@%^&<>\|'.split('')

	rl.on('line', line => {
	line = line.trim()
	if (!line.length) { return }
	if (startrChars.includes(line[0])) { return }
	try {
	const parsed = parse(line)
	const text = parsed.text().trim()
	if (!text.length) { return }
	fs.writeSync(fd, text + '\n')
	} catch (e) {
	console.log(line)
	console.log('Error while parsing: ' + e)
	}
	})