読者です 読者をやめる 読者になる 読者になる

読点「、」挿入システム

3月ぐらいに先生と話していて文章を書くときに「、」を挿入する位置って難しいよねっていう話になりました。

特に、レポートで提出されてくる文章はひどいらしく、

「、」がたくさん含まれすぎている
「、」がまったくない

みたいな文が多いらしい。でも、「、」を挿入する位置なんて誰もあんまり教えてくれてないような・・・。

んで、「、」の位置を適切に挿入できるようにサポートしてくれるシステムがあればいいねって話になりました。

少しアイデアがあったので、実装してみました。

http://pumpkin.i.ryukoku.ac.jp/cgi-bin/dokuten_insert/di.cgi

ずっとお蔵入りしてたシステムなんですが、せっかくなんで公開しておきます。

PerlとCRF++で作ってます。精度評価をすべきかなぁって思ってます。

TODO:

  • 毎日新聞のデータからWikipediaのデータに変更
  • 大学のサーバから移す(GAEの練習で移してみるか?)
  • CRFとSVMとMEで比較