Skip to content

Instantly share code, notes, and snippets.

@ksomemo
Last active August 29, 2015 14:07
Show Gist options
  • Save ksomemo/6e8483e8f332ec5aefdf to your computer and use it in GitHub Desktop.
Save ksomemo/6e8483e8f332ec5aefdf to your computer and use it in GitHub Desktop.

mecabインストール

OSのバージョンが低いものに、インストールしてハマったときのメモ

gccのバージョンが低い場合

gcc --version
gcc (GCC) 4.1.2 20080704 (Red Hat 4.1.2-55)
Copyright (C) 2006 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

make時に下記エラーが発生する

./.libs/libmecab.so: undefined reference to `__sync_val_compare_and_swap_4'
collect2: ld returned 1 exit status

gccの新しいバージョンをインストール

yum install gcc44 gcc44-c++

mecab

インストールしたgccを指定して実行する

#wget https://gist.githubusercontent.com/ksomemo/2a53b42abfde3eb204a3/raw/fcf2eae9dd056e881d9b626bab4fa94a4d54a9e6/request_type.patch
wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz
tar zxfv mecab-0.996.tar.gz
cd mecab-0.996
#patch -u < ../request_type.patch
./configure --with-charset=utf8 CXX='g++44'
#./configure --enable-utf8-only CXX='g++44'
make
make install
cd ..

辞書

wget https://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
tar zxfv mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801
./configure --with-charset=utf8 CXX='g++44'
make
make install
cd ..

確認

mecab
すもももももももものうち
すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
うち    名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

mecab-python

wget https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
#wget https://gist.githubusercontent.com/ksomemo/2a53b42abfde3eb204a3/raw/d111f1e975bb5f69252a7abb4f56535b0b90b43f/MeCab.py
#wget https://gist.githubusercontent.com/ksomemo/2a53b42abfde3eb204a3/raw/2d52dc2b4f41db8aa264ffa2011cde4c87ffc24a/MeCab_wrap.cxx
#tar zxfv mecab-python-0.996.tar.gz
#mv MeCab.py mecab-python-0.996/
#mv MeCab_wrap.cxx mecab-python-0.996/
#vi setup.py
# return string.split (cmd1(str)) を
# return cmd1(str).split() に書き換える。
#pip install mecab-python-0.996
pip install mecab-python-0.996.tar.gz

モジュール読み込み

vim /etc/ld.so.conf.d/lib.conf
/usr/local/lib
ldconfig

確認

ipython
In [1]: import MeCab
In [2]: tagger = MeCab.Tagger("-Ochasen")
In [3]: print tagger.parse("すもももももももものうち")
すもも  スモモ  すもも  名詞-一般
も      モ      も      助詞-係助詞
もも    モモ    もも    名詞-一般
も      モ      も      助詞-係助詞
もも    モモ    もも    名詞-一般
の      ノ      の      助詞-連体化
うち    ウチ    うち    名詞-非自立-副詞可能
EOS
@ksomemo
Copy link
Author

ksomemo commented Oct 14, 2014

コメントアウト部分は、python3用

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment