「フカマチカズヤの日記」復活と Splitter [Python]
みなさん、大変です。さりげなくフカマチカズヤの日記が復活しつつあります!
http://www.atransia.co.jp/home/fukamachi/Diary/
(あまり煽ると、また疲れて中断してしまうかもしれないのでそっと復活を見守りましょう)
しかも、今年に入ってからの日記の内容がまたすばらしい。Zope/Plone 使いは要チェックですよ!
で、フカマチさんは、コンピューターによる言語解析を学んだそうで、早速ちょっと小難しい話になっておりますが・・・
http://www.atransia.co.jp/home/fukamachi/Diary/2006/01/05/
うーむ、こういう話が読めるのはありがたいことです。
で、まぁそんな深いところまで極める必要もないひとも、↓これは見ておきましょう
http://www.atransia.co.jp/home/fukamachi/Diary/2006/01/06/
分かって使ってるならいいけど、盲目的に Chasen や Mecab を使った Splitter の方が
良いと思っている人がいるので、気をつけましょう。
ちなみに、CJKSplitter のカタカナのパッチは
ここ↓で送られているようですが、本家に反映されてないんでしょうか・・・
http://www.liris.org/blog/709
あと、自分の書いたもの以外の情報は古くて間違っているかもしれませんが
私が追いかけられる範囲でメモがあります。
http://www005.upp.so-net.ne.jp/nakagami/tips/ZCTextIndex.html
> CJKSplitter のカタカナのパッチ
本家に反映してくれるとメールでもらっているんですが,なかなかリリースしてくれませんね。そのうち、また、つっついてみます。(英語を書くのがめんどいので,先のばしになっていた。。。)
by liris (2006-01-06 10:30)
もうパッチ送ってあったのですね。そのページ気がついていませんでした。このところ、人のページあまり見ていなかったので。
2005/08/31 ですか。ずいぶんたっている。。。。
normalizeは確かに入れた方がよくなりますね。
liris さん、つっついてくださいませ。
でも、私のことは誰もつっつかないで(笑)
by ふかまち (2006-01-06 14:15)