2011-07-01から1ヶ月間の記事一覧

共通部分文字列

問題 情報オリンピックJOI2008本選 AOJ05282つの文字列が与えられたとき、両方の文字列に含まれる文字列のうち最も長いものの長さを返す。 考え方 最も単純な方法は、片方の部分文字列を作ってそれがもう片方に含まれるかを探す方法。 しかし、これではO(n^4…

K-meansによるクラスタリング

PRML第9章にK-meansアルゴリズムがあって、Old Faithful間欠泉データを2つのクラスタに分解した図が載ってたので、自分でも書いてやってみた。 準備 ■Old Faithful間欠泉データ http://research.microsoft.com/en-us/um/people/cmbishop/prml/index.htm 上の…

g++で日本語を使う in Windows7+Cygwin

日本語の取り扱いって面倒くさいことこの上ないという印象で、今まではpython使えばいいやって思ってたのですが、やっぱり使い慣れたc++でも使えるようにしたいと思い、ちょっと調べてみた。 環境 OS : Windows 7 Professional 64bit cygwin上の設定 $ local…

「耳をすませば」の月島雫のセリフは分類できるか?

はじめに 最近、自然言語処理とかちゃんと勉強始めたので、まずはやってみようということで文書分類をやってみた。 本当だったらもっと一般的な題材(ニュースカテゴリ分類やスパムフィルタとか)からやるべきだろうけど、前々から気になってた「映画のキャラ…

備忘録

いろいろ残していきたいと思います。基本的に雑記。