Skip to content

Instantly share code, notes, and snippets.

@alfard
Last active December 28, 2015 17:19
Show Gist options
  • Select an option

  • Save alfard/7534999 to your computer and use it in GitHub Desktop.

Select an option

Save alfard/7534999 to your computer and use it in GitHub Desktop.
Manipulation fichier csv Python
#A noter sur python, on compte à partir de 0 et non de 1
import pandas as pd
import numpy as np
import csv
f = open('/home/alfard/Documents/Kaggle/Facebook2/Train.csv',"rb")
fw= open('/home/alfard/Documents/Kaggle/Facebook2/TrainClean.csv',"w")
fileopen = csv.reader(f,delimiter=',', quotechar='"')
filewrite = csv.writer(fw,delimiter=',', quotechar='"')
#Mise en place d'un compteur pour connaître le nombre de ligne traitées
p=0
for row in fileopen:
#Exemple de traitement de caractère
for i in range(len(stopwords)):
row[1] = row[1].lower()
row[1] = row[1].replace(stopwords[i],' ')
row[1] = " ".join(row[1].split())
#Ecriture du résultat du traitement dans le fichier TrainClean.csv
filewrite.writerow([row[1],row[3]])
p=p+1
print p
# row[1],row[3] signifie que je copie la 2e et le 4e élement de la ligne traitée,
# à la fin de traitement, l'ensemble des éléments de la ligne constituera une colonne
# CAD la 2e colonne et la 4e colonne
#Obligatoire pour réaliser l'écriture du csv
f.close()
fw.close()
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment