debboutr · October 24, 2020 06:11
diff --git a/stack.py b/stack.py
 #!/usr/bin/env python3
 # -*- coding: utf-8 -*-

 import os
 import pandas as pd


 uid = "GEO_ID"  # <-- set the column that will hold the unique ID
 directory = "." # <-- set the directory that you want to read from here

 def is_csv(x):
    return x.split(".")[-1] == "csv"

 final = pd.DataFrame()
 for f in filter(is_csv, os.listdir(directory)):
    tbl = pd.read_csv(directory + "/" + f).set_index(uid)
    if final.empty:
        final = tbl
        continue
    if not final.index.isin(tbl.index).all(): # append uid's that don't exist
        missing = tbl.loc[~tbl.index.isin(final.index),[]]    
        final = final.append(missing)
    final.loc[tbl.index, tbl.columns] = tbl
 final.to_csv('bologna.csv')
	#!/usr/bin/env python3
	# -- coding: utf-8 --

	import os
	import pandas as pd


	uid = "GEO_ID" # <-- set the column that will hold the unique ID
	directory = "." # <-- set the directory that you want to read from here

	def is_csv(x):
	return x.split(".")[-1] == "csv"

	final = pd.DataFrame()
	for f in filter(is_csv, os.listdir(directory)):
	tbl = pd.read_csv(directory + "/" + f).set_index(uid)
	if final.empty:
	final = tbl
	continue
	if not final.index.isin(tbl.index).all(): # append uid's that don't exist
	missing = tbl.loc[~tbl.index.isin(final.index),[]]
	final = final.append(missing)
	final.loc[tbl.index, tbl.columns] = tbl
	final.to_csv('bologna.csv')
No results found