『日本語歴史コーパス』バージョン2018.3の語彙統計は以下の通りです。
『日本語歴史コーパス』「中納言」収録データの語数は以下のファイルの通りです。 サンプルID・コア/非コア・本文種別(引用を含む)・文体ごとに、語数(記号を含む場合と含まない場合)をまとめました。
次のリンクから短単位語数データがダウンロードできます。
短単位語数tsvデータ(Version2018.3)のダウンロード
『日本語歴史コーパス』「中納言」収録データの語数は以下のファイルの通りです。 サンプルID・コア/非コア・本文種別(引用を含む)・文体ごとに、語数(記号を含む場合と含まない場合)をまとめました。
次のリンクから長単位語数データ(サンプル別)がダウンロードできます。
長単位語数tsvデータ(Version2018.3)のダウンロード
『日本語歴史コーパス』「中納言」収録データの語彙素別の語数(および語種・品詞別の語数)を時代・作品別にまとめました。
次のリンクからダウンロードできます。