言語モデルの評価尺度
エントロピー、パープレキシティ
言語Lにおいて、単語列の生起確率がのとき、1単語あたりのエントロピーは、
になる。
ある単語について、平均して個の単語が次につながりうることを表す。
このはパープレキシティと呼ばれる。
なので、パープレキシティを見ればその言語の複雑さがわかる、と。
テストセット・パープレキシティ
実際の言語モデルの評価には、評価データに対するパープレキシティを求めるらしい(テストセット・パープレキシティ)。
評価データの文書集合に対する1単語あたりのエントロピーから求められる(上の式)。
実用上、パープレキシティが言語の複雑さを表すならば、できるだけ小さいほうがいいように思うけど。。どの程度の複雑さでいいかはやっぱり時と場合に依るんだろう。
参考文献
- 言語と計算4 確率的言語モデル