自然言語処理タスクまとめ
はじめに
「自然言語処理」研究にはどういう目標やタスクがあるかについて簡単に調べてみたので、まとめてみる。
タスク
語義曖昧性解消
代名詞解析(照応解析、意味役割付与)
- 照応解析
- 代名詞が指す先が何なのかを特定するタスク
- 「彼ら」という代名詞があった場合、それが具体的に誰と誰を指すのか?
- 意味役割付与
- 名詞が、動作主なのか?対象なのか?手段なのか?を特定するタスク
言語生成
情報抽出
- 情報抽出
- テキスト中から重要な情報のみを抜き出すタスク
- 固有表現抽出
- テキスト中の、固有名詞や時間に関する情報を抜き出すタスク
- 関係抽出
- 固有表現などの単語同士の関係性を見いだすタスク
含意関係
- 「**球団が負けた」というテキストと、球団の結果に関するニュース記事が与えられたときに、このニュース記事が証拠となりうるかどうかを判定するタスク
- 近年の言語処理での共通課題(らしい)
文書校正・スペルチェッカ
- 入力された文章が正しいかどうかを判定するタスク
- 入力された単語のスペルが正しいかどうかを判定するタスク
- 正しい単語を推定する必要がある
形態素解析
- 日本語は英語のように単語がspace区切りになっていないので、単語の区切りを特定するタスク
情報検索
- 大量のテキストデータから特定の内容を持つテキストのみを探し出すタスク
- この場合、検索結果のランキング順位も重要になる