報告書

各プロジェクトの報告書ページにアクセスします。

現代日本語書き言葉均衡コーパス(BCCWJ)

現在,日本語について入手可能な唯一の均衡コーパス。無作為抽出された全体で1億語規模のサンプルを格納。

日本語話し言葉コーパス(CSJ)

日本語の自発音声を中心に750万語規模のサンプルを格納した世界最高水準の話し言葉コーパス。音声データを書き起こした転記テキストやイントネーション情報等の研究用情報を付加。

近代語のコーパス

明治から昭和にかけての雑誌を中心としたコーパス。「太陽コーパス」「近代女性雑誌コーパス」「明六雑誌コーパス」の3点を公開。

 

リンク Links