agmarrugo · October 18, 2014 02:46
diff --git a/duplicate_papers.py b/duplicate_papers.py
 import csv

 with open('papers.csv','r') as f:
    sheet = csv.reader(f)
    papers = []
    for row in sheet:
 # Every row is a list, thus I concatenate all to form a single list
        papers = papers + row
 # remove blank spaces       
    papers = filter(None,papers)
 # Converting the paperID to int
    papers = [int(x) for x in papers]
 # Sorting the list of papers
    papers = sorted(papers)

 # Searching duplicates and unique papers   
    seen = set()
    uniq = []
    dup = []
    for x in papers:
        if x not in seen:
            uniq.append(x)
            seen.add(x)
        else:
            dup.append(x)
    print "Unique values are:",uniq
    print "The duplicates are: ",dup
    
    f.close()
	import csv

	with open('papers.csv','r') as f:
	sheet = csv.reader(f)
	papers = []
	for row in sheet:
	# Every row is a list, thus I concatenate all to form a single list
	papers = papers + row
	# remove blank spaces
	papers = filter(None,papers)
	# Converting the paperID to int
	papers = [int(x) for x in papers]
	# Sorting the list of papers
	papers = sorted(papers)

	# Searching duplicates and unique papers
	seen = set()
	uniq = []
	dup = []
	for x in papers:
	if x not in seen:
	uniq.append(x)
	seen.add(x)
	else:
	dup.append(x)
	print "Unique values are:",uniq
	print "The duplicates are: ",dup

	f.close()