言語資源開発センター -Center for Language Resource Development-
English 国立国語研究所
 

概要

  『日本語話し言葉コーパス( Corpus of Spontaneous Japanese : CSJ ) 』は、日本語の自発音声を大量にあつめて多くの研究用情報を付加した話し言葉研究用のデータベースであり、国立国語研究所情報通信研究機構(旧通信総合研究所)東京工業大学 が共同開発した、質・量ともに世界最高水準の話し言葉データベースです。
 本コーパスは、音声言語情報処理、自然言語処理、日本語学、言語学、音声学、心理学、社会学、日本語教育、辞書編纂など幅広い領域で利用されています。

 『日本語話し言葉コーパス』はオンライン版(無償)およびオフライン版(有償)にて公開しています。商業目的での利用をご希望の場合は、個別に検討させていただきますので、下記までご連絡ください。

オンライン版(無償)

中納言

オフライン版(有償)

USBメモリ

コーパス検索アプリケーション「中納言」利用申込

  「中納言」利用申込

※ 「中納言」は利用契約を結んだ上でのご利用です。
※ 契約期間は1年で、以後自動更新されます。



※有償版はデータだけを格納したものであり、コーパス検索環境(検索ツール等)は提供しておりませんので、ご注意ください。

 

コーパスの引用について

『日本語話し言葉コーパス』を利用した研究成果等を発表される際は、必ず下記の論文を参照・引用してください。

「中納言」を利用した場合は、利用データとして必ず下記の情報を載せてください。(バージョンやアクセス年月日は適宜置き換えてください)

  • 国立国語研究所(2024)『日本語話し言葉コーパス』(バージョン2018.01,中納言バージョン2.7.2)https://clrd.ninjal.ac.jp/csj/(20XX年X月X日確認)
 

リンク Links