概要

　『日本語話し言葉コーパス( Corpus of Spontaneous Japanese : CSJ ) 』は、日本語の自発音声を大量にあつめて多くの研究用情報を付加した話し言葉研究用のデータベースであり、国立国語研究所・情報通信研究機構（旧通信総合研究所）・東京工業大学が共同開発した、質・量ともに世界最高水準の話し言葉データベースです。
　本コーパスは、音声言語情報処理、自然言語処理、日本語学、言語学、音声学、心理学、社会学、日本語教育、辞書編纂など幅広い領域で利用されています。

　『日本語話し言葉コーパス』はオンライン版（無償）およびオフライン版（有償）にて公開しています。商業目的での利用をご希望の場合は、個別に検討させていただきますので、下記までご連絡ください。

コーパス検索アプリケーション「中納言」利用申込

※ 「中納言」は利用契約を結んだ上でのご利用です。
※ 契約期間は１年で、以後自動更新されます。

※有償版はデータだけを格納したものであり、コーパス検索環境（検索ツール等）は提供しておりませんので、ご注意ください。

コーパスの引用について

『日本語話し言葉コーパス』を利用した研究成果等を発表される際は、必ず下記の論文を参照・引用してください。

(日本語論文の場合)
国立国語研究所（2006）「日本語話し言葉コーパスの構築法」国立国語研究所. https://doi.org/10.15084/00001357
(日本語以外の論文の場合)
Maekawa, Kikuo (2003) Corpus of spontaneous Japanese: Its design and evaluation. ISCA/IEEE Workshop on Spontaneous Speech Processing and Recognition, 7–12. https://www.isca-archive.org/sspr_2003/maekawa03_sspr.html

「中納言」を利用した場合は、利用データとして必ず下記の情報を載せてください。（バージョンやアクセス年月日は適宜置き換えてください）

国立国語研究所（2018）『日本語話し言葉コーパス』（バージョン2018.01，中納言バージョン2.7.2）https://clrd.ninjal.ac.jp/csj/（20XX年X月X日確認）

概要

利用・申込方法

公開データ（第９刷）

CSJ-RDB Ver.2.0

CSJ-「中納言」

サンプル・データ

ドキュメント

研究成果

What's New

概要

コーパスの引用について