言語資源開発センター -Center for Language Resource Development-
English 国立国語研究所
 

報告書『日本語話し言葉コーパスの構築法』

(公開:2006.06.26)

 

 標記のレポートを国立国語研究所報告 No.124として刊行しました。 『日本語話し言葉コーパス』の構築過程で蓄積された各種作業マニュアルを整理して加筆したもので、世界的に類例のないレポートです。 『日本語話し言葉コーパス』のマニュアルとしてもご利用いただけます。
 以下に『日本語話し言葉コーパスの構築法』の構成を示します。

報告書『日本語話し言葉コーパスの構築法』
章のタイトル 執筆者 開始-終了頁
刊行のことば 杉戸清樹 i
目次
iii-xvi
第1章  概説 前川喜久雄 1-22
第2章  転記テキスト 小磯花絵・西川賢哉・間淵洋子 23-132
第3章  形態論情報 小椋秀樹 133-186
第4章  短単位・長単位データベース 山口昌也 187-254
第5章  節単位情報 丸山岳彦・高梨克也・内元清貴 255-322
第6章  分節音情報 藤本雅子・菊池英明・前川喜久雄 323-346
第7章  韻律情報 五十嵐陽介・菊池英明・前川喜久雄 347-454
第8章  XML文書 菊池英明・塚原渉 455-526
第9章  CSJの検索 前川喜久雄 527-542
参考文献
543-546
索引
547-552



報告書ダウンロード
(国立国語研究所学術情報リポジトリ)


『日本語話し言葉コーパス』付属マニュアル 

(公開:2006.06.26 最終更新:2015.04.28)

 
タイトル更新情報
『日本語話し言葉コーパス』の概観 (←最初にご覧ください , 改訂 : 15.04.28)
音声収録作業の概要 (← 改訂 : 15.04.28)
記録票データ・対話記録票データ・講演者属性データ・ 対話参加講演者の講演一覧の解説 (← 改訂 : 15.04.28)
転記テキストの仕様
文節の仕様について
『日本語話し言葉コーパス』の形態論情報の概要
短単位・長単位データマニュアル
短単位辞書マニュアル
『日本語話し言葉コーパス』の分節音ラベリング (← 改訂 : 11.11.28)
『日本語話し言葉コーパス』のイントネーションラベリング (← 改訂 : 11.11.28)
印象評定データの概要 (← 改訂 : 15.04.28)
『日本語話し言葉コーパス』における節単位認定 (← 改訂 : 15.04.28, 追記:21.05.13)
『日本語話し言葉コーパス』における係り受け構造付与 (← 改訂 : 15.04.28)
『日本語話し言葉コーパス』における自由要約・重要文抽出データについて
『日本語話し言葉コーパス』の談話境界情報について
音声認識のための音響モデルと言語モデルの仕様
『日本語話し言葉コーパス』XML文書について (← 改訂 : 15.04.28)
『日本語話し言葉コーパス』節単位XML文書について (← 追加 : 06.03.10)
『日本語話し言葉コーパス』節単位XMLビューワーの使用法 (← 追加 : 06.08.21)
『日本語話し言葉コーパス』における文編集データについて (← 追加 : 08.03.25)


『日本語話し言葉コーパス』付属マニュアルダウンロード
(国立国語研究所学術情報リポジトリ)

 

リンク Links