『日本語話し言葉コーパス( Corpus of Spontaneous Japanese : CSJ ) 』は、日本語の自発音声を大量にあつめて多くの研究用情報を付加した話し言葉研究用のデータベースであり、国立国語研究所・ 情報通信研究機構(旧通信総合研究所)・ 東京工業大学 が共同開発した、質・量ともに世界最高水準の話し言葉データベースです。
本コーパスは、音声言語情報処理、自然言語処理、日本語学、言語学、音声学、心理学、社会学、日本語教育、辞書編纂など幅広い領域で利用されています。
『日本語話し言葉コーパス』はオンライン版(無償)およびオフライン版(有償)にて公開しています。商業目的での利用をご希望の場合は、個別に検討させていただきますので、下記までご連絡ください。
※有償版はデータだけを格納したものであり、コーパス検索環境(検索ツール等)は提供しておりませんので、ご注意ください。
『日本語話し言葉コーパス』を利用した研究成果等を発表される際は、必ず下記の論文を参照・引用してください。
「中納言」を利用した場合は、利用データとして必ず下記の情報を載せてください。(バージョンやアクセス年月日は適宜置き換えてください)