chucknado · November 23, 2020 07:41 · nimicent · Jul 8, 2017
diff --git a/write_posts.py b/write_posts.py
 import dateutil.parser

 import pandas as pd

 topic = pd.read_pickle('my_serialized_data')
 posts_df = pd.DataFrame(topic['posts'], columns=['id', 'title', 'created_at', 'author_id'])
 users_df = pd.DataFrame(topic['users'], columns=['id', 'name']).drop_duplicates(subset=['id'])

 posts_df['created_at'] = posts_df['created_at'].apply(lambda x: dateutil.parser.parse(x).date())

 merged_df = pd.merge(posts_df, users_df, how='left', left_on='author_id', right_on='id')
 merged_df.rename(columns={'id_x': 'post_id'}, inplace=True)
 merged_df.drop(['id_y', 'author_id'], axis=1, inplace=True)

 merged_df.to_excel('topic_posts.xlsx', index=False)
 print('Spreadsheet saved.')
	import dateutil.parser

	import pandas as pd

	topic = pd.read_pickle('my_serialized_data')
	posts_df = pd.DataFrame(topic['posts'], columns=['id', 'title', 'created_at', 'author_id'])
	users_df = pd.DataFrame(topic['users'], columns=['id', 'name']).drop_duplicates(subset=['id'])

	posts_df['created_at'] = posts_df['created_at'].apply(lambda x: dateutil.parser.parse(x).date())

	merged_df = pd.merge(posts_df, users_df, how='left', left_on='author_id', right_on='id')
	merged_df.rename(columns={'id_x': 'post_id'}, inplace=True)
	merged_df.drop(['id_y', 'author_id'], axis=1, inplace=True)

	merged_df.to_excel('topic_posts.xlsx', index=False)
	print('Spreadsheet saved.')
No results found