このコーパスのデータを更新し、形態論情報(単語の情報)を付与したものを、『日本語歴史コーパス』「明治・大正編Ⅰ雑誌」の一部として、コーパス検索アプリケーション「中納言」で公開しています。「中納言」の利用にはユーザー登録が必要です。(2016/10/26)
『太陽コーパス』(2005年公開)概要
- 明治後期~大正期の総合雑誌『太陽』から5年分を抽出した全文コーパス
- 記事・引用・文字などにタグ付けしたテキストコーパス
- 対象雑誌:『太陽』(博文館刊)の、1895(明治28)年、1901(明治34)年、1909(明治42)年、1917(大正6)年、1925(大正14)年の、通常号の全文
- 総文字数:約1450万字
- 著者数:約1000人
※ 『太陽コーパス』設計の考え方は、『太陽コーパス研究論文集』を御覧ください。
利用方法
CD-ROM版を出版社から刊行していますので、ご購入ください。
国立国語研究所編『太陽コーパス ―雑誌『太陽』日本語データベース―』(国立国語研究所資料集15) (外部リンク)
博文館新社刊 CD-ROM1枚+解説書1冊 9,500円(税別)
※ CD-ROM版に同梱される『ひまわり』は旧バージョンのためWindows Vista、Windows7・8には対応していません。
以下のリンク先にある新しいバージョンの『ひまわり』に更新してお使いください。
参照: 無償公開版『ひまわり』で『太陽コーパス』を利用する方法 (外部リンク)
『太陽コーパス』研究論文集
『太陽コーパス』の設計の考え方や、このコーパスを用いた研究事例を論文集にまとめました。『太陽コーパス』を活用する手引としてお読みください。
国立国語研究所編『雑誌「太陽」による確立期現代語の研究―「太陽コーパス」研究論文集―』(国立国語研究所報告122) (外部リンク)
博文館新社刊 A5判横組み414ページ 7,500円(税別)
参照: 目次 『雑誌「太陽」による確立期現代語の研究―「太陽コーパス」研究論文集―』
研究活用例
・口語記事と文語記事
『太陽コーパス』に含まれる記事について,口語記事と文語記事の比率を調べると,図1の通りです。日本語の書き言葉が,文語文から口語文に移行するほぼ全過程を『太陽コーパス』によって調べることができます。
・濁点表記法の完成
例えば,「喜ぶ」の「ぶ」に濁点文字を使うことは現代語では当たり前ですが,19世紀までは「喜ふ」のように濁点をつけない文字を用いることも一般的でした。この濁点文字の使用率を,『太陽コーパス』の中のすべての語について調べると,図2のようになります。
1909年までは,濁点を付けない文字を使う場合もあったこと,1917年にほとんどの場合に濁点文字を使用する現代の表記法が完成したことが分かります。そして,文語文よりも口語文の場合の方が,濁点文字使用の普及が早く進んだことも分かります。
・漢語サ変動詞の可能の形
言文一致の進行によって,書き言葉として用いる表現法が,旧来の文語的な語法から,話し言葉に根付いた口語的な語法へと徐々に移行しました。図3は,漢語サ変動詞に付く、可能を意味する表現法四種について,その頻度の経年変化をまとめたものです。水色の線は,口語記事の比率を示しています。
口語的な「出来る」が,口語記事の増加と軌を一にして急速に増えていき,文語的な「能ふ」(「想像すること能はず」など)や「を得る」(「想像するを得ず」など)は減っていきます。一方,「し得る」(「想像し得ず」など)は文体の変化に影響されずに同じ程度に使用され続けていることも注目されます。文体の変化にともなって,可能表現のしくみが変わっていったと見られます。
・新漢語「優秀」の定着
近代に誕生あるいは流入した新しい言葉が定着していく過程も,『太陽コーパス』によって詳しく知ることができます。図4は,「優秀」という漢語の頻度の経年変化を,類義語とともに示したものです。当初はほとんど使われていなかった「優秀」が,1901年から1917年の間に一気に定着に向かう様子が際立っており,1909年以後は,旧来からよく使われていた和語「すぐれる」とほぼ同じ程度に使われるようになっていきます。
「優秀」と「すぐれる」の使用文脈を比較してみると,「すぐれる」が人物の内面に備わる才能に関して使われやすいのに対して,「優秀」は人物が生み出す外面的な成果に関して使われやすく,意味によって使い分けられていることが判明します。新しい言葉が,独自の役割を担って,日本語の中に場所を得ていく様子を知ることができます。
以上の研究活用例は、『太陽コーパス研究論文集』で詳しく報告しています。
『太陽コーパス』についての、お問い合わせ、ご意見などは、以下のアドレスまで電子メールでお寄せください。