計量文献学
計量文献学とは?
- 文献の特徴を数値化→統計的にその文献の分析・比較を行う方法または学問
- 「書き手によって文章に現れる言葉は違うのではないか?」に注目
- 文体(文章などのスタイル、和文・漢文、ですます・である調など)に注目=計量文体学
- 著者が同じ人か否かや時代などの推定、文体と内容・思想の関係性などを解析するのが目的
- 注目したりするのは、
- 単語または文の長さ(3文字単語、4文字単語など)
- 音節
- 特定の単語または品詞の使用率、出現率
- 同義語や異なり語、漢字、名詞、接続詞など
- 読点(「、」や「。」)の付け方
- 文頭、文末の表現、単語使用率
- 主語、述語、修飾語などの構文情報
- 直喩、暗喩
- 話題や引用文の内容
- など
応用
- 著者推定
- 犯罪捜査(脅迫文など)
- 聖書の著者問題
- シェークスピア戯曲の真の作者はベーコン?
- メールの送信者分類