hassanvfx · July 10, 2023 14:15 · hassanvfx · Jul 10, 2023
diff --git a/output_text.py b/output_text.py
 import csv
 import sys
 import os
 import re

 def remove_urls(text):
    url_pattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\\(\\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')
    return url_pattern.sub(r'', text)

 def read_csv(filename, output_filename):
    with open(filename, 'r') as csvfile:
        reader = csv.DictReader(csvfile)

        with open(output_filename, 'w') as txtfile:
            for row in reader:
                content = row['Content']
                if content is None:
                    content = ''
                else:
                    content = remove_urls(content)
                txtfile.write(content + '\n')

 def main():
    if len(sys.argv) != 2:
        print(f'Usage: {sys.argv[0]} input_filename')
        sys.exit(1)

    input_filename = sys.argv[1]
    basename = os.path.splitext(input_filename)[0]
    output_filename = basename + '.txt'
    read_csv(input_filename, output_filename)

 if __name__ == "__main__":
    main()
	import csv
	import sys
	import os
	import re

	def remove_urls(text):
	url_pattern = re.compile(r'http[s]?://(?:[a-zA-Z]\|[0-9]\|[$-_@.&+]\|[!*\\(\\),]\|(?:%[0-9a-fA-F][0-9a-fA-F]))+')
	return url_pattern.sub(r'', text)

	def read_csv(filename, output_filename):
	with open(filename, 'r') as csvfile:
	reader = csv.DictReader(csvfile)

	with open(output_filename, 'w') as txtfile:
	for row in reader:
	content = row['Content']
	if content is None:
	content = ''
	else:
	content = remove_urls(content)
	txtfile.write(content + '\n')

	def main():
	if len(sys.argv) != 2:
	print(f'Usage: {sys.argv[0]} input_filename')
	sys.exit(1)

	input_filename = sys.argv[1]
	basename = os.path.splitext(input_filename)[0]
	output_filename = basename + '.txt'
	read_csv(input_filename, output_filename)

	if __name__ == "__main__":
	main()
No results found