普段良く使うモジュールのMeCabのインストール。 Homebrewもvirutalenvも最近使い始めたばかりなので、自分用メモとして記録。

virtualenv環境の作成

普段はNormalという環境を作って、これを使うことにする。

$ mkvirtualenv Normal

MeCabのインストール

$ brew search mecab
mecab mecab-ipadic

Homebrewにあった。

$ brew install mecab mecab-ipadic
$ mecab

これでこの時点の最新版である0.994とIPA辞書がインストールできた。動作確認。

$ mecab
すもももももももものうち
すもも  名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
も      助詞,係助詞,*,*,*,*,も,モ,モ
もも    名詞,一般,*,*,*,*,もも,モモ,モモ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
うち    名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

Ctrl + c で終了。 文字コード周りのトラブルも特になし。

MeCabのPythonバインディングのインストール

MacPortsのときはPythonバインディングもまとめてインストールできたが、Homebrewには無いっぽい。まあvirtualenvで作った環境にインストールするには結局自分で入れなきゃならないらしいので、普通にインストールすることにする。インストール先のvirtualenv環境のまま作業続行。

$ cd ~/Downloads/
$ curl -O http://mecab.googlecode.com/files/mecab-python-0.994.tar.gz # 同じバージョンのものをダウンロード
$ pip install mecab-python-0.994.tar.gz # tar.gz のままインストールできる。

動作確認を行う。

Pythonバインディングの動作確認

サンプルコード

実行。

$ python mecab_test.py
 BOS/EOS,*,*,*,*,*,*,*,*
それ 名詞,代名詞,一般,*,*,*,それ,ソレ,ソレ
サバンナ 名詞,一般,*,*,*,*,サバンナ,サバンナ,サバンナ
で 助詞,格助詞,一般,*,*,*,で,デ,デ
も 助詞,係助詞,*,*,*,*,も,モ,モ
同じ 連体詞,*,*,*,*,*,同じ,オナジ,オナジ
事 名詞,非自立,一般,*,*,*,事,コト,コト
言え 動詞,自立,*,*,一段,未然形,言える,イエ,イエ
ん 助動詞,*,*,*,不変化型,基本形,ん,ン,ン
の 助詞,終助詞,*,*,*,*,の,ノ,ノ
? 記号,一般,*,*,*,*,?,?,?
 BOS/EOS,*,*,*,*,*,*,*,*

動いた。

おまけ

今回はgistで書いたコードをブログに貼ってみたけど、

{% gist 4555097 %}

の1行で長いコードを見やすい形式で貼れるのってかなり便利だ。 Github + Octopress 快適すぎる。