k-takahashi's blog

個人雑記用

日本語形態素解析Webサービス

日本語文を形態素に分割し、品詞、読みがなの付与、統計情報を取得できる機能を提供します。

http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html

テキスト解析の必須技術である形態素解析。これをウェブAPIとして提供しようというなかなか面白い話。単に統計データを取るための仕組みとしても面白いが、誤り修正を何らかのかたちで集められると凄い話になる。そこはどうなんだろう?


 Namazuが使っているChasenという形態素解析があるが、性能比較とかはそのうち出てくるかな。意外と中身はChasenkakasiかもしれないけれど。