Created
January 16, 2018 06:35
-
-
Save miz21358/ef37c0c0ae0b16d6a4b5382bd816342a to your computer and use it in GitHub Desktop.
Elasticsearch+kuromoji-neologd で品詞分解アナライザを設定したテンプレート設定用JSONファイル
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
{ | |
"sample-analyze": { | |
"order": 0, | |
"template": "sample-analyze-*", | |
"settings": { | |
"index": { | |
"analysis": { | |
"filter": { | |
"greek_lowercase_filter": { | |
"type": "lowercase", | |
"language": "greek" | |
}, | |
"ja_neologd_pos_meishi_filter": { | |
"type": "kuromoji_neologd_part_of_speech", | |
"stoptags": [ | |
"名詞-代名詞", | |
"名詞-代名詞-一般", | |
"名詞-代名詞-縮約", | |
"名詞-数", | |
"名詞-非自立", | |
"名詞-非自立-一般", | |
"名詞-非自立-副詞可能", | |
"名詞-非自立-助動詞語幹", | |
"名詞-非自立-形容動詞語幹", | |
"名詞-特殊-助動詞語幹", | |
"名詞-接尾", | |
"名詞-接尾-一般", | |
"名詞-接尾-人名", | |
"名詞-接尾-地域", | |
"名詞-接尾-サ変接続", | |
"名詞-接尾-助動詞語幹", | |
"名詞-接尾-形容動詞語幹", | |
"名詞-接尾-副詞可能", | |
"名詞-接尾-助数詞", | |
"名詞-接尾-特殊", | |
"名詞-接続詞的", | |
"名詞-動詞非自立的", | |
"名詞-引用文字列", | |
"名詞-ナイ形容詞語幹", | |
"接頭詞", | |
"接頭詞-名詞接続", | |
"接頭詞-動詞接続", | |
"接頭詞-形容詞接続", | |
"接頭詞-数接続", | |
"動詞", | |
"動詞-自立", | |
"動詞-非自立", | |
"動詞-接尾", | |
"形容詞", | |
"形容詞-自立", | |
"形容詞-非自立", | |
"形容詞-接尾", | |
"副詞", | |
"副詞-一般", | |
"副詞-助詞類接続", | |
"連体詞", | |
"接続詞", | |
"助詞", | |
"助詞-格助詞", | |
"助詞-格助詞-一般", | |
"助詞-格助詞-引用", | |
"助詞-格助詞-連語", | |
"助詞-接続助詞", | |
"助詞-係助詞", | |
"助詞-副助詞", | |
"助詞-間投助詞", | |
"助詞-並立助詞", | |
"助詞-終助詞", | |
"助詞-副助詞/並立助詞/終助詞", | |
"助詞-連体化", | |
"助詞-副詞化", | |
"助詞-特殊", | |
"助動詞", | |
"感動詞", | |
"記号", | |
"記号-一般", | |
"記号-読点", | |
"記号-句点", | |
"記号-空白", | |
"記号-括弧開", | |
"記号-括弧閉", | |
"記号-アルファベット", | |
"その他", | |
"その他-間投", | |
"フィラー", | |
"非言語音", | |
"語断片", | |
"未知語" | |
] | |
}, | |
"ja_neologd_pos_doushi_filter": { | |
"type": "kuromoji_neologd_part_of_speech", | |
"stoptags": [ | |
"名詞", | |
"名詞-一般", | |
"名詞-固有名詞", | |
"名詞-固有名詞-一般", | |
"名詞-固有名詞-人名", | |
"名詞-固有名詞-人名-一般", | |
"名詞-固有名詞-人名-姓", | |
"名詞-固有名詞-人名-名", | |
"名詞-固有名詞-組織", | |
"名詞-固有名詞-地域", | |
"名詞-固有名詞-地域-一般", | |
"名詞-固有名詞-地域-国", | |
"名詞-代名詞", | |
"名詞-代名詞-一般", | |
"名詞-代名詞-縮約", | |
"名詞-副詞可能", | |
"名詞-サ変接続", | |
"名詞-形容動詞語幹", | |
"名詞-数", | |
"名詞-非自立", | |
"名詞-非自立-一般", | |
"名詞-非自立-副詞可能", | |
"名詞-非自立-助動詞語幹", | |
"名詞-非自立-形容動詞語幹", | |
"名詞-特殊", | |
"名詞-特殊-助動詞語幹", | |
"名詞-接尾", | |
"名詞-接尾-一般", | |
"名詞-接尾-人名", | |
"名詞-接尾-地域", | |
"名詞-接尾-サ変接続", | |
"名詞-接尾-助動詞語幹", | |
"名詞-接尾-形容動詞語幹", | |
"名詞-接尾-副詞可能", | |
"名詞-接尾-助数詞", | |
"名詞-接尾-特殊", | |
"名詞-接続詞的", | |
"名詞-動詞非自立的", | |
"名詞-引用文字列", | |
"名詞-ナイ形容詞語幹", | |
"接頭詞", | |
"接頭詞-名詞接続", | |
"接頭詞-動詞接続", | |
"接頭詞-形容詞接続", | |
"接頭詞-数接続", | |
"動詞-非自立", | |
"動詞-接尾", | |
"形容詞", | |
"形容詞-自立", | |
"形容詞-非自立", | |
"形容詞-接尾", | |
"副詞", | |
"副詞-一般", | |
"副詞-助詞類接続", | |
"連体詞", | |
"接続詞", | |
"助詞", | |
"助詞-格助詞", | |
"助詞-格助詞-一般", | |
"助詞-格助詞-引用", | |
"助詞-格助詞-連語", | |
"助詞-接続助詞", | |
"助詞-係助詞", | |
"助詞-副助詞", | |
"助詞-間投助詞", | |
"助詞-並立助詞", | |
"助詞-終助詞", | |
"助詞-副助詞/並立助詞/終助詞", | |
"助詞-連体化", | |
"助詞-副詞化", | |
"助詞-特殊", | |
"助動詞", | |
"記号", | |
"記号-一般", | |
"記号-読点", | |
"記号-句点", | |
"記号-空白", | |
"記号-括弧開", | |
"記号-括弧閉", | |
"記号-アルファベット", | |
"その他", | |
"その他-間投", | |
"フィラー", | |
"非言語音", | |
"語断片", | |
"未知語" | |
] | |
}, | |
"ja_neologd_pos_keiyoushi_filter": { | |
"type": "kuromoji_neologd_part_of_speech", | |
"stoptags": [ | |
"名詞", | |
"名詞-一般", | |
"名詞-固有名詞", | |
"名詞-固有名詞-一般", | |
"名詞-固有名詞-人名", | |
"名詞-固有名詞-人名-一般", | |
"名詞-固有名詞-人名-姓", | |
"名詞-固有名詞-人名-名", | |
"名詞-固有名詞-組織", | |
"名詞-固有名詞-地域", | |
"名詞-固有名詞-地域-一般", | |
"名詞-固有名詞-地域-国", | |
"名詞-代名詞", | |
"名詞-代名詞-一般", | |
"名詞-代名詞-縮約", | |
"名詞-副詞可能", | |
"名詞-サ変接続", | |
"名詞-形容動詞語幹", | |
"名詞-数", | |
"名詞-非自立", | |
"名詞-非自立-一般", | |
"名詞-非自立-副詞可能", | |
"名詞-非自立-助動詞語幹", | |
"名詞-非自立-形容動詞語幹", | |
"名詞-特殊", | |
"名詞-特殊-助動詞語幹", | |
"名詞-接尾", | |
"名詞-接尾-一般", | |
"名詞-接尾-人名", | |
"名詞-接尾-地域", | |
"名詞-接尾-サ変接続", | |
"名詞-接尾-助動詞語幹", | |
"名詞-接尾-形容動詞語幹", | |
"名詞-接尾-副詞可能", | |
"名詞-接尾-助数詞", | |
"名詞-接尾-特殊", | |
"名詞-接続詞的", | |
"名詞-動詞非自立的", | |
"名詞-引用文字列", | |
"名詞-ナイ形容詞語幹", | |
"接頭詞", | |
"接頭詞-名詞接続", | |
"接頭詞-動詞接続", | |
"接頭詞-形容詞接続", | |
"接頭詞-数接続", | |
"動詞", | |
"動詞-自立", | |
"動詞-非自立", | |
"動詞-接尾", | |
"形容詞-非自立", | |
"形容詞-接尾", | |
"副詞", | |
"副詞-一般", | |
"副詞-助詞類接続", | |
"連体詞", | |
"接続詞", | |
"助詞", | |
"助詞-格助詞", | |
"助詞-格助詞-一般", | |
"助詞-格助詞-引用", | |
"助詞-格助詞-連語", | |
"助詞-接続助詞", | |
"助詞-係助詞", | |
"助詞-副助詞", | |
"助詞-間投助詞", | |
"助詞-並立助詞", | |
"助詞-終助詞", | |
"助詞-副助詞/並立助詞/終助詞", | |
"助詞-連体化", | |
"助詞-副詞化", | |
"助詞-特殊", | |
"助動詞", | |
"感動詞", | |
"記号", | |
"記号-一般", | |
"記号-読点", | |
"記号-句点", | |
"記号-空白", | |
"記号-括弧開", | |
"記号-括弧閉", | |
"記号-アルファベット", | |
"その他", | |
"その他-間投", | |
"フィラー", | |
"非言語音", | |
"語断片", | |
"未知語" | |
] | |
}, | |
"ja_neologd_pos_fukushi_filter": { | |
"type": "kuromoji_neologd_part_of_speech", | |
"stoptags": [ | |
"名詞", | |
"名詞-一般", | |
"名詞-固有名詞", | |
"名詞-固有名詞-一般", | |
"名詞-固有名詞-人名", | |
"名詞-固有名詞-人名-一般", | |
"名詞-固有名詞-人名-姓", | |
"名詞-固有名詞-人名-名", | |
"名詞-固有名詞-組織", | |
"名詞-固有名詞-地域", | |
"名詞-固有名詞-地域-一般", | |
"名詞-固有名詞-地域-国", | |
"名詞-代名詞", | |
"名詞-代名詞-一般", | |
"名詞-代名詞-縮約", | |
"名詞-副詞可能", | |
"名詞-サ変接続", | |
"名詞-形容動詞語幹", | |
"名詞-数", | |
"名詞-非自立", | |
"名詞-非自立-一般", | |
"名詞-非自立-副詞可能", | |
"名詞-非自立-助動詞語幹", | |
"名詞-非自立-形容動詞語幹", | |
"名詞-特殊", | |
"名詞-特殊-助動詞語幹", | |
"名詞-接尾", | |
"名詞-接尾-一般", | |
"名詞-接尾-人名", | |
"名詞-接尾-地域", | |
"名詞-接尾-サ変接続", | |
"名詞-接尾-助動詞語幹", | |
"名詞-接尾-形容動詞語幹", | |
"名詞-接尾-副詞可能", | |
"名詞-接尾-助数詞", | |
"名詞-接尾-特殊", | |
"名詞-接続詞的", | |
"名詞-動詞非自立的", | |
"名詞-引用文字列", | |
"名詞-ナイ形容詞語幹", | |
"接頭詞", | |
"接頭詞-名詞接続", | |
"接頭詞-動詞接続", | |
"接頭詞-形容詞接続", | |
"接頭詞-数接続", | |
"動詞", | |
"動詞-自立", | |
"動詞-非自立", | |
"動詞-接尾", | |
"形容詞", | |
"形容詞-自立", | |
"形容詞-非自立", | |
"形容詞-接尾", | |
"副詞-助詞類接続", | |
"連体詞", | |
"接続詞", | |
"助詞", | |
"助詞-格助詞", | |
"助詞-格助詞-一般", | |
"助詞-格助詞-引用", | |
"助詞-格助詞-連語", | |
"助詞-接続助詞", | |
"助詞-係助詞", | |
"助詞-副助詞", | |
"助詞-間投助詞", | |
"助詞-並立助詞", | |
"助詞-終助詞", | |
"助詞-副助詞/並立助詞/終助詞", | |
"助詞-連体化", | |
"助詞-副詞化", | |
"助詞-特殊", | |
"助動詞", | |
"感動詞", | |
"記号", | |
"記号-一般", | |
"記号-読点", | |
"記号-句点", | |
"記号-空白", | |
"記号-括弧開", | |
"記号-括弧閉", | |
"記号-アルファベット", | |
"その他", | |
"その他-間投", | |
"フィラー", | |
"非言語音", | |
"語断片", | |
"未知語" | |
] | |
} | |
}, | |
"analyzer": { | |
"ja_neologd_analyzer": { | |
"filter": [ | |
"greek_lowercase_filter", | |
"cjk_width" | |
], | |
"char_filter": [ | |
"icu_normalizer" | |
], | |
"type": "custom", | |
"tokenizer": "ja_neologd_tokenizer" | |
}, | |
"ja_neologd_meishi_analyzer": { | |
"filter": [ | |
"greek_lowercase_filter", | |
"cjk_width", | |
"ja_neologd_pos_meishi_filter", | |
"kuromoji_neologd_baseform" | |
], | |
"char_filter": [ | |
"icu_normalizer" | |
], | |
"type": "custom", | |
"tokenizer": "ja_neologd_tokenizer" | |
}, | |
"ja_neologd_doushi_analyzer": { | |
"filter": [ | |
"greek_lowercase_filter", | |
"cjk_width", | |
"ja_neologd_pos_doushi_filter", | |
"kuromoji_neologd_baseform" | |
], | |
"char_filter": [ | |
"icu_normalizer" | |
], | |
"type": "custom", | |
"tokenizer": "ja_neologd_tokenizer" | |
}, | |
"ja_neologd_keiyoushi_analyzer": { | |
"filter": [ | |
"greek_lowercase_filter", | |
"cjk_width", | |
"ja_neologd_pos_keiyoushi_filter", | |
"kuromoji_neologd_baseform" | |
], | |
"char_filter": [ | |
"icu_normalizer" | |
], | |
"type": "custom", | |
"tokenizer": "ja_neologd_tokenizer" | |
}, | |
"ja_neologd_fukushi_analyzer": { | |
"filter": [ | |
"greek_lowercase_filter", | |
"cjk_width", | |
"ja_neologd_pos_fukushi_filter", | |
"kuromoji_neologd_baseform" | |
], | |
"char_filter": [ | |
"icu_normalizer" | |
], | |
"type": "custom", | |
"tokenizer": "ja_neologd_tokenizer" | |
} | |
}, | |
"tokenizer": { | |
"ja_neologd_tokenizer": { | |
"mode": "search", | |
"type": "kuromoji_neologd_tokenizer" | |
} | |
} | |
} | |
} | |
}, | |
"mappings": { | |
"_default_": { | |
"dynamic_templates": [ | |
{ | |
"integer_fields": { | |
"mapping": { | |
"fielddata": true, | |
"type": "integer" | |
}, | |
"match_mapping_type": "string", | |
"match": "ranking||rate" | |
} | |
}, | |
{ | |
"string_fields": { | |
"match_mapping_type": "string", | |
"match": "*_txt", | |
"mapping": { | |
"type": "text", | |
"fields": { | |
"analyzed": { | |
"type": "text", | |
"fielddata": true, | |
"store": true, | |
"analyzer": "ja_neologd_analyzer", | |
"search_analyzer": "ja_neologd_analyzer" | |
}, | |
"analyzed-meishi": { | |
"type": "text", | |
"fielddata": true, | |
"store": true, | |
"analyzer": "ja_neologd_meishi_analyzer", | |
"search_analyzer": "ja_neologd_meishi_analyzer" | |
}, | |
"analyzed-doushi": { | |
"type": "text", | |
"fielddata": true, | |
"store": true, | |
"analyzer": "ja_neologd_doushi_analyzer", | |
"search_analyzer": "ja_neologd_doushi_analyzer" | |
}, | |
"analyzed-keiyoushi": { | |
"type": "text", | |
"fielddata": true, | |
"store": true, | |
"analyzer": "ja_neologd_keiyoushi_analyzer", | |
"search_analyzer": "ja_neologd_keiyoushi_analyzer" | |
}, | |
"analyzed-fukushi": { | |
"type": "text", | |
"fielddata": true, | |
"store": true, | |
"analyzer": "ja_neologd_fukushi_analyzer", | |
"search_analyzer": "ja_neologd_fukushi_analyzer" | |
}, | |
"keyword": { | |
"type": "keyword", | |
"ignore_above": 256 | |
}, | |
"full": { | |
"type": "text" | |
} | |
} | |
} | |
} | |
} | |
], | |
"properties": { | |
"execDate": { | |
"type": "date", | |
"format": "yyyy/MM/dd'T'HH:mm:ssZ" | |
} | |
} | |
} | |
} | |
} | |
} |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment