報告書
各プロジェクトの報告書ページにアクセスします。
現代日本語書き言葉均衡コーパス(BCCWJ)
現在,日本語について入手可能な唯一の均衡コーパス。無作為抽出された全体で1億語規模のサンプルを格納。
日本語話し言葉コーパス(CSJ)
日本語の自発音声を中心に750万語規模のサンプルを格納した世界最高水準の話し言葉コーパス。音声データを書き起こした転記テキストやイントネーション情報等の研究用情報を付加。
近代語のコーパス
明治から昭和にかけての雑誌を中心としたコーパス。「太陽コーパス」「近代女性雑誌コーパス」「明六雑誌コーパス」の3点を公開。