Entity Linkingとは
- テキストに出てくるエンティティ(実体)を識別・決定するタスク
- 固有名詞抽出は「固有名詞を識別して取り出す」タスクなので、異なる
- 雑にいうと、KnowledgeBaseと呼ばれる(識別された)エンティティ集合からテキストにでてくるエンティティを決定すること
- KBにない新しい固有名詞を発見することも含まれたりする(「NIL」として取り扱う)
- テキスト「東京タワーに行った」
- 固有名詞抽出
- 「東京タワー」を取り出す
- Entity Linking
- 「東京タワー」が以下のreference(ここではWikipediaのページ)と対応することを決定する
- http://ja.wikipedia.org/wiki/%E6%9D%B1%E4%BA%AC%E3%82%BF%E3%83%AF%E3%83%BC
- Name Variation
- エンティティがいろんな表記で出てきてしまう
- 「東京ディズニーランド」というエンティティが、「東京ディズニーランド」「ディズニーランド」「TDL」など
- →Robust Candidate Selection
- Entity Ambiguity
- 1つの表記が複数のエンティティの曖昧性を持ってしまっている、複数のKBに対応するものが存在する、など
- 「木」という表記が「植物の木」「データ構造の木」などのどれに対応するのか
- →Ranking and Features for Entity Disambiguation
- Absence
- 表記に紐づけるべきエンティティがKBにない(NIL,無)
- →Learning NILs
- 1. リンクできるフレーズを選ぶ
- MD, Mention Detection
- 2. フレーズに紐づけられる、候補となるエンティティをKBからランキング/選択
- LG, Link Generation
- (ターゲットとなるエンティティがKB内にないかもしれないことも考慮)
- 3. コンテキスト情報を使って曖昧性解消/フィルタリング/改善
- DA, Disambiguation
- Dai et al., From Entity Recognition to Entity Linking: A Survey of Advanced Entity Linking Techniques
- Huber, Entity Linking - A Survey of Recent Approaches
- Batista, Entity Linking
slideshare「Entity+Linking」
Mendeley「Entity+Linking」
TAC KBP 2013 Entity Linking Track
