利用上の注意
また以下の解析用辞書を利用して行なった研究等の成果を公表する場合は、その旨を明記してください。 必要に応じて参考文献に挙げた文献を参照してください。 UniDicの利用状況を把握する際の集計に使用させていただきます。
現代語用UniDicS
古文用UniDicS
現代書き言葉UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-cwj-202302.zip | 2023-03-24 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 解析に利用する場合に適した軽量版です。(576MB) |
unidic-cwj-202302_full.zip | 2023-03-24 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 辞書の再学習などにも利用できるフルパッケージ版です。(2.1GB) |
unidic-cwj-3.1.1.zip | 2022-09-06 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 語彙サイズ(UTF-8) matrix.def, model.defが付属しない軽量ダウンロード版です。(530MB) |
unidic-cwj-3.1.1-full.zip | 2022-09-06 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 語彙サイズ(UTF-8) モデルの学習・出力に使用したmatrix.def, model.defが付属するバージョンです。(ファイルサイズが1.6Gと非常に大きいので、ダウンロードの際は注意してください。) |
unidic-cwj-3.1.0.zip | 2021-04-01 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 語彙サイズ(UTF-8) matrix.def, model.defが付属しない軽量ダウンロード版です。(530MB) |
unidic-cwj-3.1.0-full.zip | 2021-04-01 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 語彙サイズ(UTF-8) モデルの学習・出力に使用したmatrix.def, model.defが付属するバージョンです。(ファイルサイズが1.6Gと非常に大きいので、ダウンロードの際は注意してください。) |
unidic-cwj-2.3.0.zip | 2018-04-10 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | ファイルサイズが2.2Gと非常に大きいので、ダウンロードの際は注意してください。 |
unidic-cwj-2.3.0_beta.zip | 2018-03-29 | GPL v2.0/LGPL v2.1/修正BSD | 試験公開です。フルパッケージ化した正式版は4月上旬に公開予定。[2018/04/10]試験公開終了。 | |
unidic-cwj-2.2.0.zip | 2017-09-05 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | [2017/09/06]dicrcのchamame出力フォーマットを修正しました。[2017/10/02]ライセンスファイルをzip内に追加しました。[2017/12/14]1603系のライセンスファイル(LICENSE)が誤ってパッケージングされていたため、削除しました。 |
参考文献
- 岡 照晃: 「CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic ― unidic-cwj-2.2.0 と unidic-csj-2.2.0 ― 」, 言語資源活用ワークショップ2017発表予稿集, pp.143-152 (2017).
References
- Yasuharu Den, Toshinobu Ogiso, Hideki Ogura, Atsushi Yamada, Nobuaki Menematsu, Kiyotaka Uchimoto and Hanae Koiso. The development of an electronic dictionary for morphological analysis and its application to Japanese corpus linguistics, Japanese Linguistics, Vol.22, pp.101-123 (2007). [in Japanese]
- Yasuharu Den. A Multi-Purpose Electronic Dictionary for Morphological Analyzers, Journal of Japanese Society for Artificial Intelligence, Vol.24, No.5, pp.640-646 (2009). [in Japanese]
- Kikuo Maekawa, Makoto Yamazaki, Takehiko Maruyama, Masaya Yamaguchi, Hideki Ogura, Wakako Kashino, Toshinobu Ogiso, Hanae Koiso and Yasuharu Den. Design, Compilation, and Preliminary Analyses of Balanced Corpus of Contemporary Written Japanese, In Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), pp.1483-1486 (2010).
謝辞
本研究は国立国語研究所コーパス開発センターの共同研究プロジェクト 「コーパスアノテーションの拡張・統合・自動化に関する基礎研究」(2016-2021 年度) の成果である。
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-mecab-2.1.2_bin.zip | 2013-03-14 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | OSDNで公開していたバージョン(2013/3/14)の再公開 |
unidic-mecab-2.1.2_src.zip | 2013-03-14 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | OSDNで公開していたバージョン(2013/3/14)の再公開 |
unidic-mecab-2.1.2_model.zip | 2013-03-14 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | OSDNで公開していたバージョン(2013/3/14)の再公開 |
unidic-mecab_kana-accent-2.1.2_src.zip | 2013-03-14 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | OSDNで公開していたバージョン(2013/3/14)の再公開 |
unidic-mecab-211_bin.zip | 2012-12-13 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | OSDNで公開していたバージョン(2012/12/13)の再公開 |
unidic-mecab-211_windows.zip | 2012-12-13 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | OSDNで公開していたバージョン(2012/12/13)の再公開 |
unidic-mecab-211_src.zip | 2012-12-13 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | OSDNで公開していたバージョン(2012/12/13)の再公開 |
unidic-mecab-211_model.zip | 2012-12-13 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | OSDNで公開していたバージョン(2012/12/13)の再公開 |
File name | Release date | Licence | Note | |
---|---|---|---|---|
UniDic-gendai_1603.zip | 2016-03 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | Web茶まめで公開していたバージョン(2016/3)の再公開[2018/03/19]学習時に使用されたdefファイルをzip内に追加しました。 |
参考文献
- 伝 康晴, 小木曽 智信, 小椋 秀樹, 山田 篤, 峯松 信明, 内元 清貴, 小磯 花絵: 「コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用」, 日本語科学, Vol.22, pp.101-123 (2007).
- 伝 康晴. 多様な目的に適した形態素解析システム用電子化辞書, 人工知能学会誌, Vol.24, No.5, pp.640-646 (2009).
References
- Yasuharu Den, Toshinobu Ogiso, Hideki Ogura, Atsushi Yamada, Nobuaki Menematsu, Kiyotaka Uchimoto and Hanae Koiso. The development of an electronic dictionary for morphological analysis and its application to Japanese corpus linguistics, Japanese Linguistics, Vol.22, pp.101-123 (2007). [in Japanese]
- Yasuharu Den. A Multi-Purpose Electronic Dictionary for Morphological Analyzers, Journal of Japanese Society for Artificial Intelligence, Vol.24, No.5, pp.640-646 (2009). [in Japanese]
- Kikuo Maekawa, Makoto Yamazaki, Takehiko Maruyama, Masaya Yamaguchi, Hideki Ogura, Wakako Kashino, Toshinobu Ogiso, Hanae Koiso and Yasuharu Den. Design, Compilation, and Preliminary Analyses of Balanced Corpus of Contemporary Written Japanese, In Proceedings of the Seventh International Conference on Language Resources and Evaluation (LREC 2010), pp.1483-1486 (2010).
現代話し言葉UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-csj-202302.zip | 2023-03-24 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 解析に利用する場合に適した軽量版です。(609MB) |
unidic-csj-202302_full.zip | 2023-03-24 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 辞書の再学習などにも利用できるフルパッケージ版です。(2.2GB) |
unidic-csj-3.1.1.zip | 2022-09-06 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 語彙サイズ(UTF-8) これはv3.1.0の修正版となります。matrix.def, model.defが付属しない軽量ダウンロード版です。(530MB) |
unidic-cwj-3.1.1-full.zip | 2022-09-06 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 語彙サイズ(UTF-8) これはv3.1.0の修正版となります。モデルの学習・出力に使用したmatrix.def, model.defが付属するバージョンです。(ファイルサイズが1.6Gと非常に大きいので、ダウンロードの際は注意してください。) |
unidic-csj-3.1.0.zip | 2021-04-01 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 語彙サイズ(UTF-8) matrix.def, model.defが付属しない軽量ダウンロード版です。(530MB) |
unidic-csj-3.1.0-full.zip | 2021-04-01 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 語彙サイズ(UTF-8) モデルの学習・出力に使用したmatrix.def, model.defが付属するバージョンです。(ファイルサイズが1.7Gと非常に大きいので、ダウンロードの際は注意してください。) |
unidic-csj-3.0.1.1.zip | 2020-02-21 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 語彙サイズ(UTF-8) ファイルサイズが1.5Gと非常に大きいので、ダウンロードの際は注意してください。3.0.1からの変更点は、連接行列の圧縮スクリプトを改良し、matrix.defのサイズが4.3Gから3.6Gになっただけで解析性能等の変更はありません。 |
unidic-csj-3.0.1.zip | 2019-12-17 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | 語彙サイズ(UTF-8) ファイルサイズが1.6Gと非常に大きいので、ダウンロードの際は注意してください。 |
参考文献
- 伝 康晴, 小木曽 智信, 小椋 秀樹, 山田 篤, 峯松 信明, 内元 清貴, 小磯 花絵: 「コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用」, 日本語科学, Vol.22, pp.101-123 (2007).
- 伝 康晴. 多様な目的に適した形態素解析システム用電子化辞書, 人工知能学会誌, Vol.24, No.5, pp.640-646 (2009).
- 岡 照晃: 「言語研究のための電子化辞書」, コーパスと辞書, 講座 日本語コーパス 7, pp.1-28, 朝倉書店 (2019).
References
- Yasuharu Den, Junpei Nakamura, Toshinobu Ogiso, Hideki Ogura. A Proper Approach to Japanese Morphological Analysis: Dictionary, Model, and Evaluation, In Proceedings of the sixth international conference on Language Resources and Evaluation (LREC 2008), pp.1019-1024 (2008).
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-csj-2.3.0.zip | 2018-04-10 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | ファイルサイズが2.2Gと非常に大きいので、ダウンロードの際は注意してください。 |
unidic-csj-2.3.0_beta.zip | 2018-03-29 | GPL v2.0/LGPL v2.1/修正BSD | 試験公開です。フルパッケージ化した正式版は4月上旬に公開予定。[2018/04/10]試験公開終了。 | |
unidic-csj-2.2.0.zip | 2017-09-05 | GPL v2.0/LGPL v2.1/修正BSD | ライセンスに同意してダウンロード | [2017/09/06]dicrcのchamame出力フォーマットを修正しました。[2017/10/02]ライセンスファイルをzip内に追加しました。 |
参考文献
- 伝 康晴, 小木曽 智信, 小椋 秀樹, 山田 篤, 峯松 信明, 内元 清貴, 小磯 花絵: 「コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用」, 日本語科学, Vol.22, pp.101-123 (2007).
- 伝 康晴. 多様な目的に適した形態素解析システム用電子化辞書, 人工知能学会誌, Vol.24, No.5, pp.640-646 (2009).
- 岡 照晃: 「CRF素性テンプレートの見直しによるモデルサイズを軽量化した解析用UniDic ― unidic-cwj-2.2.0 と unidic-csj-2.2.0 ― 」, 言語資源活用ワークショップ2017発表予稿集, pp.143-152 (2017).
References
- Yasuharu Den, Junpei Nakamura, Toshinobu Ogiso, Hideki Ogura. A Proper Approach to Japanese Morphological Analysis: Dictionary, Model, and Evaluation, In Proceedings of the sixth international conference on Language Resources and Evaluation (LREC 2008), pp.1019-1024 (2008).
File name | Release date | Licence | Note | |
---|---|---|---|---|
UniDic-spoken_1603.zip | 2016-03 | ライセンスに同意してダウンロード | Web茶まめで公開していたバージョン(2016/3)の再公開[2018/03/19]学習時に使用されたdefファイルをzip内に追加しました。 |
参考文献
- 伝 康晴, 小木曽 智信, 小椋 秀樹, 山田 篤, 峯松 信明, 内元 清貴, 小磯 花絵: 「コーパス日本語学のための言語資源:形態素解析用電子化辞書の開発とその応用」, 日本語科学, Vol.22, pp.101-123 (2007).
- 伝 康晴. 多様な目的に適した形態素解析システム用電子化辞書, 人工知能学会誌, Vol.24, No.5, pp.640-646 (2009).
References
- Yasuharu Den, Junpei Nakamura, Toshinobu Ogiso, Hideki Ogura. A Proper Approach to Japanese Morphological Analysis: Dictionary, Model, and Evaluation, In Proceedings of the sixth international conference on Language Resources and Evaluation (LREC 2008), pp.1019-1024 (2008).
近現代口語小説UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-novel-v202308.zip | 2023-08 | ライセンスに同意してダウンロード | ||
UniDic-202203_65_novel.zip | 2022-03 | ライセンスに同意してダウンロード | 新規公開 |
参考文献
- 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
- Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
- Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
旧仮名口語UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-qkana-v202308.zip | 2023-08 | ライセンスに同意してダウンロード | ||
UniDic-202203_60b_qkana.zip | 2022-03 | ライセンスに同意してダウンロード | ||
UniDic-qkana_1603.zip | 2016-03 | ライセンスに同意してダウンロード | Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。 |
参考文献
- 小木曽智信: 「旧仮名遣いの口語文を対象とした形態素解析辞書」, じんもんこん2012論文集, pp.25-32 (2012).
References
- Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
- Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
近代文語UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-kindai-bungo-v202308.zip | 2023-08 | ライセンスに同意してダウンロード | ||
UniDic-202203_60a_kindai-bungo.zip | 2022-03 | ライセンスに同意してダウンロード | ||
UniDic-kindai_1603.zip | 2016-03 | ライセンスに同意してダウンロード | Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。 | |
unidic-MLJ_14.zip | 2014-03-31 | 配布終了しました | 近代文語UniDic専用ページで公開していたバージョン(2014/3/31)の再公開[2017/12/07] |
参考文献
- 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
- Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
- Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
近世江戸口語UniDic(旧称:近世口語(洒落本)UniDic)
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-kinsei-edo-v202308.zip | 2023-08 | ライセンスに同意してダウンロード | ||
UniDic-202203_50c_kinsei-edo.zip | 2022-03 | ライセンスに同意してダウンロード | ||
UniDic-kinsei_1603.zip | 2016-03 | ライセンスに同意してダウンロード | Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。 |
参考文献
- 小木曽 智信, 市村 太郎, 鴻野知暁: 「近世口語資料の形態素解析の試み」, 第4回コーパス日本語学ワークショップ予稿集, pp.145-150 (2013).
References
- Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
- Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
近世上方口語UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-kinsei-kamigata-v202308.zip | 2023-08 | ライセンスに同意してダウンロード | ||
UniDic-202203_50b_kinsei-kamigata.zip | 2022-03 | ライセンスに同意してダウンロード | 新規公開 |
参考文献
- 小木曽 智信, 市村 太郎, 鴻野知暁: 「近世口語資料の形態素解析の試み」, 第4回コーパス日本語学ワークショップ予稿集, pp.145-150 (2013).
References
- Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
- Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
近世文語UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-kinsei-bungo-v202308.zip | 2023-08 | ライセンスに同意してダウンロード | ||
UniDic-202203_50a_kinsei-bungo.zip | 2022-03 | ライセンスに同意してダウンロード | 新規公開 |
参考文献
- 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
- Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
- Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中世口語UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-chusei-kougo-v202308.zip | 2023-08 | ライセンスに同意してダウンロード | ||
UniDic-202203_40_chusei-kougo.zip | 2022-03 | ライセンスに同意してダウンロード | ||
UniDic-kyogen_1603.zip | 2016-03 | ライセンスに同意してダウンロード | Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。 |
参考文献
- 小木曽 智信, 鴻野 知暁, 市村 太郎: 「狂言台本の形態素解析」, 日本語学会2015年度春季大会 (2015). [can not read online]
References
- Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
- Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
中世文語UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-chusei-bungo-v202308.zip | 2023-08 | ライセンスに同意してダウンロード | ||
UniDic-202203_30_chusei-bungo.zip | 2022-03 | ライセンスに同意してダウンロード | ||
UniDic-wakan_1603.zip | 2016-03 | ライセンスに同意してダウンロード | Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。 |
参考文献
- 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
- Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
- Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]
和歌UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-waka-v202308.zip | 2023-08 | ライセンスに同意してダウンロード |
参考文献
- 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
- Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese, In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012), pp.911-915 (2012).
中古和文UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-chuko-v202308.zip | 2023-08 | ライセンスに同意してダウンロード | ||
UniDic-202203_20_chuko.zip | 2022-03 | ライセンスに同意してダウンロード | ||
UniDic-wabun_1603.zip | 2016-03 | ライセンスに同意してダウンロード | Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。 | |
unidic-EMJ_14.zip | 2014-03-31 | 配布終了しました | 中古和文UniDic専用ページで公開していたバージョン(2014/3/31)の再公開[2017/12/07]コーパス開発センターでの配布及びサポートを終了しました。 |
参考文献
- 小木曽 智信, 小椋 秀樹, 田中 牧郎, 近藤 明日子, 伝 康晴: 「中古和文を対象とした形態素解析辞書の開発」, 情報処理学会研究報告 人文科学とコンピュータ, Vol.2010-CH-85, No.4, pp.1-8 (2010).
- 小木曽智信: 「中古仮名文学作品の形態素解析」, 日本語の研究, Vol.9, No.4, pp.49-6 (2013).
- 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
- Toshinobu Ogiso, Mamoru Komachi, Yasuharu Den and Yuji Matsumoto. UniDic for Early Middle Japanese: a Dictionary for Morphological Analysis of Classical Japanese, In Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012), pp.911-915 (2012).
上代語UniDic
File name | Release date | Licence | Note | |
---|---|---|---|---|
unidic-jodai-v202308.zip | 2023-08 | ライセンスに同意してダウンロード | ||
UniDic-202203_10_jodai.zip | 2022-03 | ライセンスに同意してダウンロード | ||
UniDic-manyo_1603.zip | 2016-03 | ライセンスに同意してダウンロード | Web茶まめで公開していたバージョン(2016/3)の再公開[2017/10/31]ライセンスファイルをzip内に追加しました。[2018/03/09]学習時に使用されたdefファイルをzip内に追加しました。 |
参考文献
- 小木曽 智信, 小町 守, 松本 裕治: 「歴史的日本語資料を対象とした形態素解析」, 自然言語処理, Vol.20, No.5, pp.727-748 (2013).
References
- Toshinobu Ogiso, Mamoru Komachi and Yuji Matsumoto. Morphological Analysis of Historical Japanese Text, Journal of Natural Language Processing, Vol.20, No.5, pp.727-748 (2013). [in Japanese]
- Tomoaki Kouno and Toshinobu Ogiso. Improving an Electronic Dictionary for Morphological Analysis of Japanese: Use of historical period information, In Proceedings of The 9th International Conference of ASIALEX (ASIALEX2015) (2015). [can not read online]