第二刷までのTextGridは、Xwavesと同様に単語層、分節音層、BI層、トーン層、プロミネンス層、注釈層の六つの層から構成されていたが、第三刷では、"TRN"という名前で転記テキスト層を一番下に追加した。この層では、転記テキストにおける転記基本単位毎に、発話内容が漢字仮名交じり(転記における基本形の表記)で記されており、文脈の理解の助けとなる。なお、転記基本単位の開始・終了時刻は、転記基本単位冒頭の分節音の開始時間、末尾の分節音の終了時間と必ずしも一致しておらず、作業上の都合で概ね転記基本単位の方がおよそ50~100ミリ秒程度広く設定されている。
転記基本単位など、転記テキストの詳細については、以下の解説文書を参照されたい。
参照 : 「転記テキストの仕様」(transcription.pdf)
『日本語話し言葉コーパスの構築法』 第2章
上記1で述べたように、漢字仮名交じりテキストを加えたことにより、第三刷のTextGridファイルの文字コードをUTF-8に変更した。転記テキスト層が文字化けする場合の対応については、以下を参照のこと。
参照 : TextGridの利用方法
プロミネンス層でおいてタグ"EUAP"とタグ"FR"が共起するような場合、同じ層に同一時刻のタグを複数表現する必要がある。しかしXwavesとは異なりTextGridでは、一つの層に同一時刻のタグを別のイベントとして表現することができない。第二刷では、複数のタグのうち一つだけ(例えば"EUAP"だけ)が表現され、他のタグ(例えば"FR")は欠落するというエラーが生じていたが、第三刷では、"EUAP,FR"のように複数のタグをカンマで区切り一つのイベントとして表現することでこの問題に対応した。
同一層に複数のタグが共起するのは次の場合である。
単語層では、当該単語を「kaku」(書く)のようにアルファベットで表記しているが、フィラーや言い間違いなどの場合、転記で用いられるタグとあわせて「(F eQtoH)」のように記される。ここで、転記のタグとそれに伴うスペースが単語層に生じることになるが、第二刷ではこのスペース以降の文字列が部分的に欠落するエラーが生じていた。第三刷ではこのエラーを全て修正した。
分節音層では、隣接する二つの転記基本単位の間に存在するポーズに相当する位置に記号「#」を付与することで、後続する転記基本単位(の冒頭の分節音)の開始位置を表現しているが、第二刷の単語層にはこの記号は付与されていなかった。TextGridでは、分節音層と単語層は interval tier として表現されるが、記号「#」がない単語層では、転記基本単位冒頭の単語の開始位置が同定できず、転記基本単位間のポーズを含む区間全体があたかも当該単語の範囲であるかのように表現されてしまうという問題があった。これは、いわばpoint tier で表現される Xwavesの仕様をそのまま引き継いだためであるが、第三刷では、データの見やすさ、使いやすさの観点から、単語層についても記号「#」を付与することとした。
第三刷では、音声ラベルの修正を多岐に渡って実施した。その修正内容はTextGridファイル、Xwaves形式ファイル、XML文書のいずれにも反映されている。修正の詳細については、以下を参照のこと。
参照 : 音声ラベルのエラー修正(第3刷)