『日本語歴史コーパス 明治・大正編Ⅰ雑誌』として明治・大正期の雑誌のデータを、『日本語歴史コーパス 明治・大正編Ⅱ教科書』として小学校・高等小学校で使用された国定国語科教科書、明治初期の理科教科書および布哇日本語学校で使用された『日本語読本』のデータを、『日本語歴史コーパス 明治・大正編Ⅲ明治初期口語資料』として明治初期に刊行された主要な口語資料のデータを、『日本語歴史コーパス 明治・大正編Ⅳ近代小説』として明治中期から大正末期の小説21作品(21著者)のデータを、『日本語歴史コーパス 明治・大正編Ⅴ新聞』として明治・大正期に刊行された『読売新聞』のデータを、『日本語歴史コーパス 明治・大正編Ⅵ落語SP盤』として明治から大正期にかけて録音された落語(落語家23人による127作品)公開しています。
※長単位データは付与されていません。
『明治・大正編Ⅰ雑誌』は、明治期から大正期までの各年代を代表する雑誌の一定の年数ごとの刊行分を収録しています。多様な記事ジャンルや著者層を有する雑誌を資料とし、現代語の確立に至るまでの書き言葉の様相を広く見渡し、文語体から口語体への移行といった近代語の変化を通時的に捉えられるように設計されています。
「明治・大正編Ⅰ雑誌」に収録した雑誌名・刊行年(巻号)は以下のとおりです。
原則として雑誌各冊の全テキストを収録対象としていますが、次の文書要素はコーパスの対象範囲外としました。
また、コーパスの収録対象とした文書要素のテキストのうち、次の部分は対象からは除外しました。
コーパスのテキストには、短単位形態論情報をはじめとして、雑誌・記事・作者等に関する情報が付与されており、コーパス検索アプリケーション「中納言」の検索結果から参照することができます。
利用に際しては、以下の本コーパスの概要書をご一読のうえ、ご利用ください。
本コーパスの前身である4コーパスの仕様の詳細は以下のページからご参照ください。
本コーパスの短単位形態論情報は文語・口語の文体別に以下の規程集に基づいて付与されています。
利用に際しては、規程集もご一読のうえ、ご利用ください。
「中納言」によるコーパスの検索結果では、以下の雑誌の原本画像とのリンクが表示され、原本を参照しながらコーパスを利用することができます。(『女学雑誌』『女学世界』『婦人倶楽部』の原本画像の参照はできません。ご注意ください。)
本コーパスをご利用になる際は、必ず下記の情報を明記してください。(バージョンやアクセス年月日は適宜置き換えてください)
※ バージョンかアクセス年月日のいずれかを明記すれば下記のように短縮しても構いません。
『日本語歴史コーパス 明治・大正編』は、オンライン検索ツール「中納言」を通してご利用いただけます。ご利用には利用許諾契約契約が必要です。詳しくは利用・申込方法をご覧ください。
※ 肩書きは開発当時のものです。
このコーパスは、国立国語研究所共同研究プロジェクト「通時コーパスの設計」(2009-2016)、JSPS科研費 JP15H01883「日本語歴史コーパスの多層的拡張による精密化とその活用」(2015-2019)および国立国語研究所共同研究プロジェクト「通時コーパスの構築と日本語史研究の新展開」(2016-)の成果の一部です。
明治36(1903)年、小学校令の改正により、小学校で使用される教科書は文部省において著作権を有するものに限るとする教科書の国定制度が確立され、国語科では明治37(1904)年から国定教科書が使用されました。国定国語科教科書は、国語教育を通して、文字言語としての言文一致体の完成と音声言語としての標準語の確立を目指して編集され、近代日本における標準語の確立・普及に大きく貢献した資料です。 「明治・大正編Ⅱ教科書」には、小学校*で使用された国定国語科教科書(第1期~第6期)と小学校に続く教育課程である高等小学校で使用された国定国語科教科書(第1期)を収録しています。
*本コーパスで「小学校」と呼ぶ教育課程は、実際には各時期の学校制度改革により「尋常小学校」→「国民学校初等科」→「小学校」と呼称が変遷しています。本コーパスではこれらをまとめて「小学校」と呼んでいます。
2023年3月に、明治大学大学院国際日本学研究科田中牧郎研究室が開発した明治初期の理科教科書『物理階梯』『小学化学書』『初学人身窮理』のデータを、追加公開しました。このコーパスについては、明治初期理科教科書コーパスの解説書をご参照ください。
2024年3月に、布哇教育会が編纂した『日本語読本』のデータを追加しました。ハワイでは、明治元(1868)年から日本人の移民がはじまり、明治26(1893)年には日本語学校が設立されました。当初は日本の国定国語教科書が使用されていましたが、大正4(1915)年に布哇教育会が発足し、独自の日本語教科書の編纂がはじまります。この時編纂された教科書は、大正6(1917)年から『日本語読本尋常科用』(全6巻)として使用が開始されます。この資料は、ハワイ日系社会がホスト社会へ適合する際に、どのような日本語教育方針をとったのかを知るための重要な資料と言えます。本コーパスでは、大正6(1917)年に使用が開始された教科書を、ハワイ日本語教科書第1期として収録しています。
収録した小学校教科書(国定読本)の期(使用開始年)と教科書名とテキストの収録範囲は以下のとおりです。
原則として教科書の各冊の全テキストを収録対象としていますが、次の文書要素はコーパスの対象範囲外としました。
また、コーパスの収録対象とした文書要素のテキストのうち、次の部分は対象からは除外しました。
本コーパスの小学校教科書のデータは、『国定読本用語総覧 CD-ROM版』(国立国語研究所編、1997)を作成する際に用いられた本文のテキストデータを基礎としています。また、高等小学校教科書のデータは別途作成していた『高等小学読本』の形態論情報付きコーパス(近藤明日子・小木曽智信・加藤文明子(2010)「『高等小学読本』の形態論情報付きコーパス」『情報処理学会シンポジウム論文集(じんもんこん2010論文集)』2010:15、pp.189-194)のデータを基礎としています。本コーパスはこれら2つのデータを統合し、『日本語歴史コーパス』の設計に合わせて再構築したものです。
収録したハワイ日本語教科書の期(使用開始年)と教科書名は以下のとおりです。
原則として教科書の各冊の全テキストを収録対象としていますが、次の文書要素はコーパスの対象範囲外としました。
また、コーパスの収録対象とした文書要素のテキストのうち、次の部分は対象からは除外しました。
ハワイ日本語教科書第1期は、筑波大学附属図書館の蔵本を底本とし、2022年8月30日に「日本語読本 尋常科用[布哇教育会第1期]」6巻分」として公開した全文テキストデータを基礎としています。
コーパスのテキストには、短単位形態論情報のほか、期・学年などに関する情報が付与されており、コーパス検索アプリケーション「中納言」の検索結果から参照することができます。 利用に際しては、以下の概要書をご一読のうえ、ご利用ください。
本コーパスの短単位形態論情報は文語・口語の文体別に以下の規定集に基づいて付与されています。規定集もご一読のうえ、ご利用ください。
「中納言」によるコーパスの検索結果では、以下の教科書の原本画像とのリンクが表示され、原本を参照しながらコーパスを利用することができます。(小学校国語科教科書の第2期~第6期、および布哇教育会編纂『日本語読本』の原本画像は参照できません。ご注意ください。)
本コーパスをご利用になる際は、必ず下記の情報を明記してください。(バージョンやアクセス年月日は適宜置き換えてください)
※ バージョンかアクセス年月日のいずれかを明記すれば下記のように短縮しても構いません。
『日本語歴史コーパス 明治・大正編Ⅱ教科書』は、オンライン検索ツール「中納言」を通してご利用いただけます。ご利用には利用許諾契約が必要です。詳しくは利用・申込方法をご覧ください。
※肩書きは開発当時のものです。
このコーパスは、国立国語研究所共同研究プロジェクト「通時コーパスの構築と日本語史研究の新展開」、国立国語研究所共同研究プロジェクト「開かれた共同構築環境による通時コーパスの拡張」の成果の一部です。
『明治・大正編Ⅲ明治初期口語資料』は、明治初期刊行の主要な口語体資料を収録したコーパスです。収録した資料は、当時の話し言葉や、明治・大正期に拡大・定着した口語体(言文一致体)の初期の姿を知る上で重要なものとされています。
各作品の底本の全テキストを収録対象としていますが、次の文書要素はコーパスの対象範囲外としました。
また、コーパスの収録対象とした文書要素のテキストのうち、次の部分は対象からは除外しました。
本コーパスの利用に際しては、以下の概要書をご一読のうえ、ご利用ください。
本コーパスの短単位形態論情報は文語・口語の文体別に以下の規程集に基づいて付与されています。利用に際しては、規程集もご一読のうえ、ご利用ください。
本コーパスをご利用になる際は、必ず下記の情報を明記してください。(バージョンやアクセス年月日は適宜置き換えてください)
※ バージョンかアクセス年月日のいずれかを明記すれば下記のように短縮しても構いません。
『日本語歴史コーパス 明治・大正編』は、オンライン検索ツール「中納言」を通してご利用いただけます。ご利用には利用許諾契約が必要です。詳しくは利用・申込方法をご覧ください。
※ 肩書きは開発当時のものです。
このコーパスは、国立国語研究所共同研究プロジェクト「通時コーパスの設計」(2009-2016)、国立国語研究所共同研究プロジェクト「通時コーパスの構築と日本語史研究の新展開」(2016-)、JSPS科研費JP15H01883「日本語歴史コーパスの多層的拡張による精密化とその活用」(2015-2019)、JSPS科研費JP17K02786「英学資料のテキストデータ化に関する研究」(2017-2020)の成果の一部です。
近代小説は、西洋の思想や文化を取り入れた文明開化の影響下で生まれた、新しい文体によって記された文学作品群であり、近代を象徴する言語の変化である言文一致を研究する上で欠かすことのできない資料です。また、語彙・文体・表記など、あらゆる研究分野における近代語の研究で取り上げられてきた実績と歴史を持つ重要な資料です。
本コーパスに収録した小説は、次の21作品です。
原則として書籍の各冊の全テキストを収録対象としていますが、次の文書要素はコーパスの対象範囲外としました。
また、コーパスの収録対象とした文書要素のテキストのうち、次の部分は対象からは除外しました。
なお、各作品の収録範囲については、詳しくは、「『日本語歴史コーパス 明治・大正編Ⅳ近代小説』(短単位データ1.0)概説書」をご覧ください。
本コーパスの利用に際しては、以下の概要書をご一読のうえ、ご利用ください。
本コーパスの短単位形態論情報は文語・口語の文体別に以下の規程集に基づいて付与されています。規程集もご一読のうえ、ご利用ください。
「中納言」によるコーパスの検索結果では、原本画像が公開されている10作品について、国立国会図書館デジタルコレクションの原本画像を参照しながらコーパスを利用することができます。(21作品のうち、原本画像が公開されていない11作品は参照できません。ご注意ください。また、公開されている画像は一部欠損などがあるほか、書き込みや破れによって見えにくい部分があることを、予めご了承ください。)
本コーパスをご利用になる際は、必ず下記の情報を明記してください。(バージョンやアクセス年月日は適宜置き換えてください)
※ バージョンかアクセス年月日のいずれかを明記すれば下記のように短縮しても構いません。
『日本語歴史コーパス 明治・大正編Ⅳ近代小説』は、オンライン検索ツール「中納言」を通してご利用いただけます。ご利用には利用許諾契約が必要です。詳しくは利用・申込方法をご覧ください。
※肩書きは開発当時のものです。
このコーパスは、国立国語研究所共同研究プロジェクト「通時コーパスの構築と日本語史研究の新展開」の成果の一部です。
明治時代以降に発達したメディアである新聞は、その初期では知識層向けの大新聞と教育を受けない庶民層向けの小新聞の二系統に分かれており、本サブコーパスは、小新聞として創刊された『読売新聞』の明治・大正期のデータをコーパス化したものです。初期の『読売新聞』は平易な文章や振り仮名を用いて書かれるなど大衆メディアの特徴を持ち幅広い読者層に日常的・継続的に読まれた重要な言語資料あるとともに、「中新聞」化に伴う文体変化を遂げた、近代における文体変化の一端を捉えることのできる資料でもあります。
原則として各号の全テキストを収録対象としていますが、次の文書要素はコーパスの収録対象外としました。
また、コーパスの収録対象とした文書要素のテキストのうち、次の部分は対象からは除外しました。
本コーパスの利用に際しては、以下の概要書をご一読のうえ、ご利用ください。
本コーパスの短単位形態論情報は文語・口語の文体別に以下の規程集に基づいて付与されています。規程集もご一読のうえ、ご利用ください。
「中納言」によるコーパスの検索結果では、読売新聞記事データベース「ヨミダス歴史館」の原本画像とのリンクが表示され、原本を参照しながらコーパスを利用することができます。なお、閲覧には「ヨミダス歴史館」との別途契約が必要となります。ご注意ください。
本コーパスをご利用になる際は、必ず下記の情報を明記してください。(バージョンやアクセス年月日は適宜置き換えてください)
※ バージョンかアクセス年月日のいずれかを明記すれば下記のように短縮しても構いません。
『日本語歴史コーパス 明治・大正編Ⅴ新聞』は、オンライン検索ツール「中納言」を通してご利用いただけます。ご利用には利用許諾契約が必要です。詳しくは利用・申込方法をご覧ください。
※肩書きは開発当時のものです。
このコーパスは、国立国語研究所共同研究プロジェクト「通時コーパスの構築と日本語史研究の新展開」、JSPS科研費16J08872「コーパスを利用した近現代漢語の表記・語法の多様性に関する計量的・通時的研究」(代表:間淵洋子、2016-2018)、JSPS科研費20K13060「新語彙定着期の言語変化―コーパスに基づく通時的語彙研究の実践」(代表:間淵洋子、2020-2023)の成果の一部です。
『日本語歴史コーパス明治・大正編VI落語SP盤』は近世から連続する話し言葉の資料としての価値を持つものです。本コーパスは、金澤裕之・矢島正浩編(2019)『SP盤落語レコードがひらく近代日本語研究』(笠間書院)で扱われた作品を対象としており、東京の76作品(落語家13人)、大阪の51作品(落語家10人)の約8.5万短単位を収録しています。「中納言」の検索結果から、検索語を含んだ前後10秒程度の音声情報を聞くことができます。
「明治・大正編Ⅵ 落語SP盤」の本文は金澤裕之・矢島正浩編(2019)で文字化されたデータを基礎としつつ、音声データのノイズを可能な範囲で取り除く処理を施し、それに基づいて適宜修正を加え本文としました。
原則として全ての音声を収録対象としています。ただし、録音の音声が極端に低く、聞き取りが不可能であった箇所はコーパスの対象範囲外としました。
音声の出典は、次の通りです。
本コーパスの利用に際しては、以下の概要書をご一読のうえ、ご利用ください。
本コーパスの短単位形態論情報は文語・口語の文体別に以下の規程集に基づいて付与されています。利用に際しては、規程集もご一読のうえ、ご利用ください。
本コーパスで対象とした作品の選択に際しては以下を参考としています。
本コーパスをご利用になる際は、必ず下記の情報を明記してください。(バージョンやアクセス年月日は適宜置き換えてください)
※ バージョンかアクセス年月日のいずれかを明記すれば下記のように短縮しても構いません。
『日本語歴史コーパス 明治・大正編Ⅵ落語SP盤』は、オンライン検索ツール「中納言」を通してご利用いただけます。ご利用には利用許諾契約が必要です。詳しくは利用・申込方法をご覧ください。
※ 肩書きは開発当時のものです。
このコーパスは、国立国語研究所共同研究プロジェクト「通時コーパスの構築と日本語史研究の新展開」(2016-2022)、および「開かれた共同開発環境による通時コーパスの拡張」(2022-)の成果の一部です。