読者です 読者をやめる 読者になる 読者になる

冬休みの目標

一般

最近、忙しすぎて、いつぞやに公開したライブラリをまったく更新できてない。

http://code.google.com/p/sbvj/

ただ、更新する意思はあったので、実装すべきことの検討は、通勤時間で煮詰めた。
あとは、まとまった時間があれば一気にできると思う。
今年は、年末にかなり休みが多いので、そのときに一気にやろうと思う。
やっぱ、手を動かすのが大事だし。

まず、以下の論文のp.24-25の定数時間のselectの実装をやる。

http://www.dcc.uchile.cl/~gnavarro/abstracts/acmcs06.html

次に、同じ論文のp.31-33のCSAを実装する。

Wavelet TreeとFM-Indexについては、まだ調査不足なので、休みの間は調査をする。

あと、整数列圧縮のSimple9とnewPFORだったかな?(正確な名前を忘れた)についても調べたので、Javaでの性能を測ってみようと思う。

なんとかCSAまでは、jarファイルを公開するところまでやりたいと思う。

ほんとは、分野適応させた辞書を使ったMeCabで、Wikipediaのテキストを機械学習で分類させたらどのぐらいの精度になるかとかも調べたいけど、限界やわ。
山にも登りたいし。

広告を非表示にする