国立国語研究所
 
 

語彙統計:バージョン0.8

 『日本語歴史コーパス』バージョン0.8の語彙統計は以下の通りです。

作品別短単位数

※下記の表中の語数には、空白・記号・補助記号は含んでいません。

サブコーパス作品名語数
平安時代編竹取物語10144
古今和歌集31017
伊勢物語13657
土佐日記6606
大和物語22878
落窪物語53952
枕草子64996
源氏物語435893
和泉式部日記10759
紫式部日記17094
合計666996

各種データ

  • 延べ語数(ジャンル・作品名・成立年・巻名等・本文種別別)
 
 
event
unidic_bnr

日本語をはじめとする言語を分析するための基礎資料として、書き言葉や話し言葉の資料を体系的に収集し、研究用の情報を付与したものです。