Created
July 17, 2014 15:17
-
-
Save koorukuroo/4aea6353b20c789bb2bc to your computer and use it in GitHub Desktop.
2014 부산과고 R&E 수학분야 연구용 코드
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
# -*- coding: utf8 -*- | |
import Umorpheme.morpheme as um | |
from collections import OrderedDict | |
s = "나는 멸치 볶음 보리 밥을 롯데리아에서 한예슬과 함께 먹었습니다. 롯데리아에는 맥도날드 해피밀이 없습니다." # input sentence | |
data = um.analyzer(s, '23485900349', "[롯데리아,맥도날드]", 1) | |
temp = {} | |
for key, value in data.items(): | |
temp[int(key)] = value | |
data = OrderedDict(sorted(temp.items())) | |
for i, j in data.iteritems(): | |
print i, j['data'], j['feature'] |
실행 결과물
0 나 NP
1 는 JX
2 멸치볶음보리밥 COMP
6 을 JKO
7 롯데리아 CUSTOM
8 에서 JKB
9 한예슬 NNP
10 과 JKB
11 함께 MAG
12 먹 VV
13 었 EP
14 습니다 EF
15 . SF
16 롯데리아 CUSTOM
17 에 JKB
18 는 JX
19 맥도날드 CUSTOM
20 해피밀 COMP
22 이 JKS
23 없 VA
24 습니다 EF
25 . SF
설치 방법
pip install umorpheme
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
2014/07/21 부산과고 형태소 분석기 실습
품사 태그 설명 : http://goo.gl/tI84DW