分類語彙表-増補改訂版データベース

 分類語彙表とは,「語を意味によって分類・整理したシソーラス (類義語集) 」です。昭和39年 (1964年) に出版された初版『分類語彙表』 (現在は絶版) は,現代日本語の本格的なシソーラスとして幅広く活用されてきました。その後,収録語数を増やした『分類語彙表 −増補改訂版−』が刊行されましたが,研究開発用にそのデータベース版を用意しました。
本データベース版は,書籍版の『分類語彙表 −増補改訂版−』(pdf)の元となったデータを加工したものです。データベースソフトに取り込めるようCSV形式になっています。レコード総数は,101,070件です (この中には,見出しの併記を分割してできたレコード及び分類項目内の意味的区切りを示すレコードを含みます)。

 レコードを構成する項目は,次のとおりです。

レコードID番号/見出し番号/レコード種別/類/部門/中項目/分類項目/分類番号/段落番号/小段落番号/語番号/見出し/見出し本体/読み/逆読み

023700,22537,A,体,主体,機関,同盟・団体,1.2760,03,01,04,独立行政法人,独立行政法人,どくりつぎょうせいほうじん,んじうほいせうょぎつりくど
001946,01838,A,体,関係,存在,成立,1.1220,14,01,03,国立,国立,こくりつ,つりくこ
030548,29140,A,体,活動,言語,言語,1.3101,03,01,01,国語,国語,こくご,ごくこ
022620,21486,A,体,主体,社会,社寺・学校,1.2630,15,01,01,研究所,研究所,けんきゅうじょ,ょじうゅきんけ

データベースの利用について

 学術研究用としてデータベースを無償で公開します。
 商業利用につきましては,国立国語研究所言語資源開発センター(下記E-mail)までご連絡ください。

https://github.com/masayu-a/WLSP

書籍版との違い

 現在刊行されている「国立国語研究所資料集14 『分類語彙表 -増補改訂版-』」(大日本図書・刊)では,五十音順索引や逆引き検索といった検索環境が整えられています。検索環境が必要な方は,書籍版(有償)をご利用ください。

 参照:書籍紹介「国立国語研究所資料集14 『分類語彙表 -増補改訂版-』」(2004年1月発行)

WLSP-familiarity -- 分類語彙表に対する親密度情報付与

分類語彙表に対して親密度情報・位相情報を付与したデータ WLSP-familiarity をリリースいたしました。
https://github.com/masayu-a/WLSP-familiarity

WLSP-antonym -- 分類語彙表に対する反対語情報付与

分類語彙表に対して反対語情報を付与したデータ WLSP-antonym をリリースいたしました。
https://github.com/masayu-a/WLSP-antonym

wlsp2unidic -- 分類語彙表番号-UniDic 語彙素番号対応表

分類語彙表番号-UniDic 語彙素番号対応表:wlsp2unidic-1.0.2 をリリースいたしました。
https://github.com/masayu-a/wlsp2unidic

wlsp2iwanami -- 分類語彙表番号-岩波国語辞典データ対応表

分類語彙表番号と岩波国語辞典第五版タグ付きコーパス2004との対応表を整備中です。
https://github.com/masayu-a/wlsp2iwanami

BCCWJ-WLSP -- 『現代日本語書き言葉均衡コーパス』に対する分類語彙表番号付与データ

『現代日本語書き言葉均衡コーパス』に分類語彙表番号を付与したデータ BCCWJ-WLSP を公開しています。
https://github.com/masayu-a/BCCWJ-WLSP

 

リンク Links