Created
February 10, 2012 13:52
-
-
Save ferayebend/1789755 to your computer and use it in GitHub Desktop.
kok verisi bulunan csvleri wordl'a yollar (cakma yontemler reloaded) (stemming şuradan http://nlp.ceng.fatih.edu.tr/~metinanaliz/ )
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
import webbrowser | |
import sys | |
def send2wordl(text): | |
result_file_name = "/tmp/hede.html" | |
result_file = open(result_file_name, "w") | |
html_template = """ | |
<form action="http://www.wordle.net/advanced" method="POST"> | |
<textarea name="text">%text%</textarea> | |
<input type="submit"> | |
</form> | |
""" | |
html_template = html_template.replace("%text%", text) | |
result_file.write(html_template) | |
result_file.close() | |
webbrowser.open(result_file_name) | |
def loadData(inputFile): | |
data = [] | |
for line in inputFile: | |
if line.startswith("#"): | |
continue | |
data.append([str(v) for v in line.strip().split(',')]) | |
return data | |
def transpose(data): | |
return [[data[j][i] for j in range(len(data))] for i in range(len(data[0]))] | |
if __name__ == "__main__": | |
filename = sys.argv[1] | |
data = loadData(open(filename)) | |
stop = transpose(loadData(open('stoplist.txt')))[0] | |
text = "" | |
for line in data: | |
kelime = line[1].replace('\'','') | |
if kelime in stop: | |
continue | |
if len(kelime) == 1: | |
continue | |
if int(line[2]) > 1: | |
for i in range(int(line[2])): | |
text = text+kelime+' ' | |
send2wordl(text) |
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
a | |
acaba | |
altı | |
ama | |
ancak | |
artık | |
asla | |
aslında | |
az | |
b | |
bana | |
bazen | |
bazı | |
bazıları | |
bazısı | |
belki | |
beni | |
benim | |
beş | |
bile | |
bir | |
birçoğu | |
birçok | |
birçokları | |
biri | |
birisi | |
birkaç | |
birkaçı | |
birşey | |
birşeyi | |
bize | |
bizi | |
bizim | |
böyle | |
böylece | |
bu | |
buna | |
bunda | |
bundan | |
bunu | |
bunun | |
burada | |
bütün | |
c | |
ç | |
çoğu | |
çoğuna | |
çoğunu | |
çok | |
çünkü | |
d | |
da | |
daha | |
de | |
değil | |
demek | |
diğer | |
diğeri | |
diğerleri | |
diye | |
dokuz | |
dolayı | |
dört | |
e | |
elbette | |
en | |
f | |
fakat | |
falan | |
felan | |
filan | |
g | |
gene | |
gibi | |
ğ | |
h | |
hâlâ | |
hangi | |
hangisi | |
hani | |
hatta | |
hem | |
henüz | |
hep | |
hepsi | |
hepsine | |
hepsini | |
her | |
her biri | |
herkes | |
herkese | |
herkesi | |
hiç | |
hiç kimse | |
hiçbiri | |
hiçbirine | |
hiçbirini | |
ı | |
i | |
için | |
içinde | |
iki | |
ile | |
ise | |
işte | |
j | |
k | |
kaç | |
kadar | |
kendi | |
kendine | |
kendini | |
ki | |
kim | |
kime | |
kimi | |
kimin | |
kimisi | |
l | |
m | |
madem | |
mı | |
mı | |
mi | |
mu | |
mu | |
mü | |
mü | |
n | |
nasıl | |
ne | |
ne kadar | |
ne zaman | |
neden | |
nedir | |
nerde | |
nerede | |
nereden | |
nereye | |
nesi | |
neyse | |
niçin | |
niye | |
o | |
on | |
ona | |
ondan | |
onlar | |
onlara | |
onlardan | |
onların | |
onların | |
onu | |
onun | |
orada | |
oysa | |
oysaki | |
ö | |
öbürü | |
ön | |
önce | |
ötürü | |
öyle | |
p | |
r | |
rağmen | |
s | |
sana | |
sekiz | |
senden | |
seni | |
senin | |
sizden | |
size | |
sizi | |
sizin | |
son | |
sonra | |
ş | |
şayet | |
şey | |
şeyden | |
şeye | |
şeyi | |
şeyler | |
şimdi | |
şöyle | |
şu | |
şuna | |
şunda | |
şundan | |
şunlar | |
şunu | |
şunun | |
t | |
tabi | |
tamam | |
tüm | |
tümü | |
u | |
ü | |
üç | |
üzere | |
v | |
var | |
ve | |
veya | |
veyahut | |
y | |
ya | |
ya da | |
yani | |
yedi | |
yerine | |
yine | |
yoksa | |
z | |
zaten | |
zira | |
ol | |
iç | |
et | |
ab | |
abç |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment