SSブログ

janome のソースコードを読む(まだ途中) [Python]

これは「(第53回)Python mini Hack-a-thon」の記録です
http://pyhack.connpass.com/event/13504/

前回は mecab をインストールしてソースを読んでました。
http://nakagami.blog.so-net.ne.jp/2015-03-28
・・・が、まあ自然言語解析の素養がないのでさっぱりわかりません。

その後、たまたま Janome という Pure Python の形態素解析器がリリースされました
http://mocobeta.github.io/janome/
今日は、これをインストールしてソースを読みました(まだ途中)

何が書いてあるかさっぱりわからないことには変わりないですが、だいぶ読みやすく分量も少なく、
解析器全体で 1000行以内なので、
「ふーん、この程度でできるんだー」
という感じはしました。
(まだ、mecab のごく一部の機能しかないのですが)
せっかくなので、もうちょっと勉強したいと思います。

Python3.4 でしか動かなくて、これはこれで良いと思っているのですが、 Python2.7 でも動くようにしたらうれしいかな・・・

(追記)
これを書いた直後に python2.7 で動くバージョンのブランチが作成され、パッケージがリリースされてた

コメント(0)  トラックバック(0) 
共通テーマ:日記・雑感

コメント 0

コメントの受付は締め切りました

Facebook コメント

トラックバック 0