言語モデル構築Toolメモ
はじめに
世の中には言語モデルを構築するToolkitはたくさんあるということで、簡単に探してみた。
言語モデルツールキット
SRILM - The SRI Language Modeling Toolkit
Palmkit - a statistical language modeling toolkit
Kylm - 京都言語モデルツールキット
CMU SLM Toolkit
KenLM - Faster and Smaller Language Model Queries
IRSTLM - The IRST Language Modeling Toolkit
berkeleylm - An N-gram Language Model Library from UC Berkeley
mitlm - MIT Language Modeling Toolkit
MSRLM - MicrosoftResearch Scalable Language-Model-Building Tool
その他
気になるもの。
latticelm
- http://www.phontron.com/latticelm/index-ja.html
- ノンパラメトリックベイズ法に基づくPitman-Yor言語モデルを用いた単語分割と言語モデルの教師なし学習ツール
lwlm
- http://chasen.org/~daiti-m/dist/lwlm/
- Latent Words Language Modelのフル実装
- HPYLMが!!
rflm - The Random Forest Language Model Toolkit
Sequence Memoizer
- http://www.sequencememoizer.com/
- 離散列データのノンパラメトリックベイズモデル