普段良く使うモジュールのMeCabのインストール。 Homebrewもvirutalenvも最近使い始めたばかりなので、自分用メモとして記録。
virtualenv環境の作成
普段はNormalという環境を作って、これを使うことにする。
$ mkvirtualenv Normal
MeCabのインストール
$ brew search mecab
mecab mecab-ipadic
Homebrewにあった。
$ brew install mecab mecab-ipadic
$ mecab
これでこの時点の最新版である0.994とIPA辞書がインストールできた。動作確認。
$ mecab
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS
Ctrl + c で終了。 文字コード周りのトラブルも特になし。
MeCabのPythonバインディングのインストール
MacPortsのときはPythonバインディングもまとめてインストールできたが、Homebrewには無いっぽい。まあvirtualenvで作った環境にインストールするには結局自分で入れなきゃならないらしいので、普通にインストールすることにする。インストール先のvirtualenv環境のまま作業続行。
$ cd ~/Downloads/
$ curl -O http://mecab.googlecode.com/files/mecab-python-0.994.tar.gz # 同じバージョンのものをダウンロード
$ pip install mecab-python-0.994.tar.gz # tar.gz のままインストールできる。
動作確認を行う。
Pythonバインディングの動作確認
サンプルコード
実行。
$ python mecab_test.py
BOS/EOS,*,*,*,*,*,*,*,*
それ 名詞,代名詞,一般,*,*,*,それ,ソレ,ソレ
サバンナ 名詞,一般,*,*,*,*,サバンナ,サバンナ,サバンナ
で 助詞,格助詞,一般,*,*,*,で,デ,デ
も 助詞,係助詞,*,*,*,*,も,モ,モ
同じ 連体詞,*,*,*,*,*,同じ,オナジ,オナジ
事 名詞,非自立,一般,*,*,*,事,コト,コト
言え 動詞,自立,*,*,一段,未然形,言える,イエ,イエ
ん 助動詞,*,*,*,不変化型,基本形,ん,ン,ン
の 助詞,終助詞,*,*,*,*,の,ノ,ノ
? 記号,一般,*,*,*,*,?,?,?
BOS/EOS,*,*,*,*,*,*,*,*
動いた。
おまけ
今回はgistで書いたコードをブログに貼ってみたけど、
{% gist 4555097 %}
の1行で長いコードを見やすい形式で貼れるのってかなり便利だ。 Github + Octopress 快適すぎる。