Skip to content

Instantly share code, notes, and snippets.

@llaine
Last active November 27, 2015 17:02
Show Gist options
  • Select an option

  • Save llaine/f937ca01867ccc9e4bc7 to your computer and use it in GitHub Desktop.

Select an option

Save llaine/f937ca01867ccc9e4bc7 to your computer and use it in GitHub Desktop.
Elasticsearch french fake index creation for mock and test
# Index creation with settings
curl -XPUT localhost:9200/geoloc -d '{
"settings": {
"index": {
"analysis": {
"filter": {
"french_elision": {
"type": "elision",
"articles": [ "l", "m", "t", "qu", "n", "s",
"j", "d", "c", "jusqu", "quoiqu",
"lorsqu", "puisqu"
]
},
"french_stop": {
"type": "stop",
"stopword" : ["ès", "vers", "a", "à", "afin", "ai", "ainsi", "après", "attendu", "au", "aujourd", "auquel", "aussi", "autre", "autres", "aux", "auxquelles", "auxquels", "avait", "avant", "avec", "avoir", "c", "ça", "car", "ce", "ceci", "cela", "celle", "celles", "celui", "cependant", "certain", "certaine", "certaines", "certains", "ces", "cet", "cette", "ceux", "chez", "ci", "combien", "comme", "comment", "concernant", "contre", "d", "dans", "de", "debout", "dedans", "dehors", "delà", "depuis", "derrière", "des", "dès", "désormais", "desquelles", "desquels", "dessous", "dessus", "devant", "devers", "devra", "divers", "diverse", "diverses", "doit", "donc", "dont", "du", "duquel", "durant", "elle", "elles", "en", "entre", "environ", "est", "et", "etc", "été", "etre", "être", "eu", "eux", "excepté", "hélas", "hormis", "hors", "hui", "il", "ils", "j", "je", "jusqu", "jusque", "l", "la", "là", "laquelle", "le", "lequel", "les", "lesquelles", "lesquels", "leur", "leurs", "lorsque", "lui", "ma", "mais", "malgré", "me", "même", "mêmes", "merci", "mes", "mien", "mienne", "miennes", "miens", "moi", "moins", "mon", "moyennant", "n", "ne", "néanmoins", "ni", "non", "nos", "notre", "nôtre", "nôtres", "nous", "ô", "on", "ont", "ou", "où", "outre", "par", "parmi", "partant", "pas", "passé", "pendant", "plein", "plus", "plusieurs", "pour", "pourquoi", "près", "proche", "puisque", "qu", "quand", "que", "quel", "quelle", "quelles", "quels", "qui", "quoi", "quoique", "revoici", "revoilà", "s", "sa", "sauf", "se", "selon", "seront", "ses", "si", "sien", "sienne", "siennes", "siens", "sinon", "soi", "soit", "son", "sont", "sous", "suivant", "sur", "ta", "te", "tes", "tien", "tienne", "tiennes", "tiens", "toi", "ton", "tous", "tout", "toute", "toutes", "tu", "un", "une", "va", "voici", "voilà", "vos", "votre", "vôtre", "vôtres", "vous", "vu", "y"]
},
"french_stemmer": {
"type": "stemmer",
"language": "light_french"
},
"synonym": {
"type":"synonym",
"synonyms": [
"cie, compagnie",
"mme, madame, mam",
"mr, monsieur, msieur"
]
}
},
"analyzer": {
"french": {
"tokenizer": "standard",
"filter": [
"french_elision",
"lowercase",
"french_stop",
"french_stemmer",
"synonym"
]
}
}
}
}
}
}'
# Mapping creation
curl -XPUT localhost:9200/geoloc/_mapping/item -d '{
"item": {
"properties": {
"name": {"type":"string", "analyzer":"french"},
"username": {"type":"string", "analyzer":"french", "store": "yes"},
"address": {
"type": "string",
"fields": {
"street": {"type":"string", "index":"analyzed"},
"city": {"type":"string", "analyzer":"french"},
"zip": {"type":"string", "index":"not_analyzed"}
}
},
"geo": {
"type": "geo_point",
"store": "yes"
}
}
}
}'
# Refreshing the index.
curl -XGET localhost:9200/geoloc/_refresh
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment